Saturday 5 August 2017

Centered Moving Average Methode


Gleitender Durchschnitt. Mean der Zeitreihen-Datenbeobachtungen gleichermaßen zeitlich beabstandet von mehreren aufeinanderfolgenden Perioden Angerufen, sich zu bewegen, weil es kontinuierlich neu berechnet wird, wenn neue Daten verfügbar werden, geht es fort, indem sie den frühesten Wert fällt und den letzten Wert addiert. Zum Beispiel der gleitende Durchschnitt von sechs - Monat Umsatz kann berechnet werden, indem man den Durchschnitt der Verkäufe von Januar bis Juni, dann der Durchschnitt der Verkäufe von Februar bis Juli, dann von März bis August, und so weiter Moving-Mittelwerte 1 reduzieren die Wirkung von temporären Variationen in Daten, 2 verbessern Die Anpassung der Daten an eine Zeile ein Prozess namens Glättung, um die Daten s Trend klarer zu zeigen, und 3 markieren Sie jeden Wert über oder unter dem Trend. Wenn Sie berechnen etwas mit sehr hoher Varianz das Beste, was Sie tun können, ist Figur Aus dem gleitenden Durchschnitt. Ich wollte wissen, was der gleitende Durchschnitt von den Daten war, also würde ich ein besseres Verständnis davon haben, wie wir es gemacht haben. Wenn Sie versuchen, herauszufinden, einige Zahlen, die sich oft ändern St können Sie tun, ist berechnen die gleitenden Durchschnitt. Moving durchschnittlichen Preis MAP. Wenn die Berechnung eines laufenden gleitenden Durchschnitt, Platzierung der Durchschnitt in der mittleren Zeitspanne macht Sinn. Im vorherigen Beispiel haben wir den Durchschnitt der ersten 3 Zeiträume berechnet und platziert Neben der Periode 3 Wir hätten den Mittelpunkt in der Mitte des Zeitintervalls von drei Perioden platzieren können, das heißt, neben Periode 2 Das funktioniert gut mit seltsamen Zeiträumen, aber nicht so gut für gleichzeitige Zeiträume Also, wo würden wir die Der erste gleitende Durchschnitt, wenn M 4.Technisch würde der Moving Average auf t 2 5, 3 fallen 5. Um dieses Problem zu vermeiden, glatt wir die MA s mit M 2 So glatt wir die geglätteten Werte. Wenn wir durchschnittlich eine gerade Anzahl von Begriffen, Wir müssen die geglätteten Werte glätten. Die folgende Tabelle zeigt die Ergebnisse mit M 4. David, Ja, MapReduce soll auf einer großen Menge an Daten arbeiten und die Idee ist, dass im Allgemeinen die Karte und die Funktionen reduzieren, Viele Mapper oder wie viele Reduzierstücke gibt es, dass s jus T-Optimierung Wenn Sie sorgfältig über den Algorithmus nachdenken, den ich gepostet habe, können Sie sehen, dass es nicht wichtig ist, welcher Mapper bekommt, welche Teile der Daten jeder Eingabedatensatz für jeden reduzierenden Betrieb verfügbar ist, der es benötigt Joe K Sep 18 12 um 22 30. Im besten meiner Verständnis gleitenden Durchschnitt ist nicht schön Karten zu MapReduce Paradigma seit seiner Berechnung ist im Wesentlichen Schiebefenster über sortierte Daten, während MR Verarbeitung von nicht geschnittenen Bereichen von sortierten Daten Lösung Ich sehe, ist wie folgt a Um benutzerdefinierte Partitionierer zu implementieren In der Lage sein, zwei verschiedene Partitionen in zwei Läufen zu machen In jedem Lauf werden Ihre Reduzierstücke unterschiedliche Datenbereiche erhalten und den gleitenden Durchschnitt berechnen, wo angemessen ich versuche zu veranschaulichen. In den ersten Run-Daten für Reduzierstücke sollte R1 Q1, Q2, Q3, Q4 R2 Q5 sein , Q6, Q7, Q8.hier Sie cacluate gleitenden Durchschnitt für einige Qs. In nächsten Lauf Ihre Reduzierstücke sollten Daten wie R1 Q1 Q6 R2 Q6 Q10 R3 Q10 Q14.And caclulate den Rest der gleitenden Durchschnitte Dann müssen Sie aggregieren Results. Idea der benutzerdefinierten Partitionierer, dass es zwei Modi der Operation haben wird - jedes Mal in gleiche Bereiche, aber mit einigen Verschiebung In einem Pseudocode wird es wie diese Partitionstaste aussehen SHIFT MAXKEY numOfPartitionen wo SHIFT wird aus der Konfiguration MAXKEY Maximalwert von genommen werden Der Schlüssel Ich nehme zur Vereinfachung, dass sie mit Null beginnen. RecordReader, IMHO ist keine Lösung, da es auf bestimmte Split begrenzt ist und kann nicht über Split s Grenze gleiten. Eine andere Lösung wäre, um benutzerdefinierte Logik der Aufteilung von Eingabedaten, die es Teil ist zu implementieren Der InputFormat Es kann getan werden, um 2 verschiedene Folien zu tun, ähnlich wie partitioning. answered Sep 17 12 at 8 59.

No comments:

Post a Comment