Saturday, 7 October 2017

Berechnen Moving Average Sql Server


Bei einer Zeitreihe xi möchte ich einen gewichteten gleitenden Durchschnitt mit einem Mittelungsfenster von N Punkten berechnen, wobei die Gewichtungen für neuere Werte über ältere Werte sprechen. Bei der Wahl der Gewichte verwende ich die bekannte Tatsache, daß eine geometrische Reihe gegen 1 konvergiert, d. H. Sum (frac) k, sofern unendlich viele Begriffe genommen werden. Um eine diskrete Zahl von Gewichtungen zu erhalten, die zu einer Einheit summieren, nehme ich einfach die ersten N-Terme der geometrischen Reihe (frac) k und normalisiere dann ihre Summe. Bei N4 ergeben sich zum Beispiel die nicht normierten Gewichte, die nach Normalisierung durch ihre Summe ergibt. Der gleitende Mittelwert ist dann einfach die Summe aus dem Produkt der letzten 4 Werte gegen diese normierten Gewichte. Diese Methode verallgemeinert sich in der offensichtlichen Weise zu bewegten Fenstern der Länge N und scheint auch rechnerisch einfach. Gibt es einen Grund, diese einfache Methode nicht zu verwenden, um einen gewichteten gleitenden Durchschnitt mit exponentiellen Gewichten zu berechnen, frage ich, weil der Wikipedia-Eintrag für EWMA komplizierter erscheint. Was mich fragt, ob die Lehrbuch-Definition von EWMA hat vielleicht einige statistische Eigenschaften, die die obige einfache Definition nicht oder sind sie in der Tat gleichwertig sind, beginnen Sie mit 1), dass es keine ungewöhnlichen Werte Und keine Pegelverschiebungen und keine Zeittrends und keine saisonalen Dummies 2), dass das optimale gewichtete Mittel Gewichte aufweist, die auf eine gleichmäßige Kurve fallen, die durch einen Koeffizienten 3 beschreibbar ist), dass die Fehlerabweichung konstant ist, dass es keine bekannten Ursachenreihen gibt Annahmen. Ndash IrishStat Okt 1 14 am 21:18 Ravi: In dem gegebenen Beispiel ist die Summe der ersten vier Ausdrücke 0,9375 0,06250,1250.250,5. Die ersten vier Ausdrücke haben also 93,8 des Gesamtgewichts (6,2 ist im abgeschnittenen Schwanz). Verwenden Sie diese, um normierte Gewichte zu erhalten, die zu einer Einheit durch Reskalierung (dividieren) um 0,9375 zusammenkommen. Dies ergibt 0,06667, 0,1333, 0,267, 0,5333. Ndash Assad Ebrahim Ich habe festgestellt, dass die Berechnung der exponentiell gewichteten laufenden Durchschnitte mit overline leftarrow overline alpha (x - overline), alphalt1 ist eine einfache einzeilige Methode, die leicht, wenn auch nur annähernd interpretierbar in Bezug auf Eine effektive Anzahl von Proben Nalpha (vergleichen Sie diese Form an die Form für die Berechnung der laufenden Mittelwert), erfordert nur das aktuelle Datum (und den aktuellen Mittelwert), und ist numerisch stabil. Technisch integriert dieser Ansatz alle Geschichte in den Durchschnitt. Die beiden Hauptvorteile bei der Verwendung des Vollfensters (im Gegensatz zum verkürzten, in der Frage diskutierten) liegen darin, dass es in einigen Fällen die analytische Charakterisierung der Filterung erleichtern kann, und es reduziert die Fluktuationen, die bei sehr großen (oder kleinen) Daten induziert werden Wert ist Teil des Datensatzes. ZB betrachten Sie das Filterergebnis, wenn die Daten alle null sind, mit Ausnahme eines Datums, dessen Wert 106 ist. Antwortete Nov 29 12 bei 0: 33SQL Server-Datenträger-Performance-Metriken Teil 2 andere wichtige Datenträger-Performance-Maßnahmen Im vorherigen Teil der SQL Server-Performance-Metriken Serie haben wir die wichtigsten und nützlichen Datenträger-Performance-Metriken vorgestellt. Nun zeigen auch andere wichtige Datenträger-Performance-Maßnahmen Aktuelle Datenträger-Warteschlange Länge Gibt die Anzahl der Festplatten-Anforderungen, die derzeit warten sowie Anforderungen derzeit gewartet werden. Vorbehaltlich breiter Variationen, es sei denn, die Arbeitsbelastung hat einen stationären Zustand erreicht und Sie haben eine ausreichende Anzahl von Proben gesammelt, um ein Muster zu erstellen. 1 Die Metrik zeigt, wie viele IO-Operationen darauf warten, von der Festplatte geschrieben oder gelesen zu werden und wie viele aktuell verarbeitet werden. Wenn die Festplatte nicht verfügbar ist, werden diese Operationen in die Warteschlange gestellt und werden verarbeitet, sobald die Festplatte verfügbar ist. Das gesamte Datenträger-Subsystem verfügt über eine einzige Warteschlange Die aktuelle Datenträger-Warteschlange-Metrik in Windows-Systemmonitor ist sowohl für physische als auch für logische Datenträger verfügbar. In einigen früheren Versionen von Systemmonitor wurde dieser Zähler als Datenträgerwarteschlangenlänge bezeichnet Der Wert der aktuellen Datenträgerwarteschlangenlänge sollte kleiner als 2 pro Datenträgerspindel sein. Beachten Sie, dass dies nicht per logisch ist, sondern pro physischer Festplatte. Wenn dies größer ist, deutet dies auf einen potenziellen Datenträger-Engpass hin, so dass eine weitere Untersuchung und Überwachung anderer Datenträger-Metriken empfohlen wird. Beginnen Sie mit der Überwachung der Disk Time (siehe unten). Häufige Peaks sollten ebenfalls untersucht werden. Plattenarraysysteme wie RAID oder SAN haben eine große Anzahl von Platten und Controllern, was Warteschlangen auf solchen Systemen kürzer macht. Da die Metrik keine Warteschlange pro Datenträger, sondern für das gesamte Array anzeigt, wird von einigen DBAs davon ausgegangen, dass die Überwachung der aktuellen Datenträgerwarteschlangenlänge auf Datenträgerarrays nicht erforderlich ist Ein anderes Szenario, in dem die aktuelle Datenträgerwarteschlangenlänge irreführend sein kann, ist, wenn Daten im Datenträgercache gespeichert werden. Es wird als in Warteschlange für das Schreiben gemeldet werden und somit ist der Wert der aktuellen Datenträgerwarteschlangenlänge höher als die tatsächliche durchschnittliche Datenträgerwarteschlangenlänge Die durchschnittliche Datenträgerwarteschlangenlänge-Metrik zeigt die Informationen ähnlich der aktuellen Datenträgerwarteschlangenlänge an. Nur der Wert ist nicht aktuell, sondern über einen bestimmten Zeitraum durchschnittlich. Die Schwelle ist die gleiche wie für die vorherige Metrik bis zu 2 pro Platte. Für Plattensysteme ist der empfohlene Wert kleiner als 2 pro einzelnem Festplattenlaufwerk in einem Array. Beispielsweise bedeutet in einem 6-Platten-Array der Wert der aktuellen Plattenwarteschlange von 12, dass die Warteschlange 2 pro Datenträger ist. Es gibt zwei weitere Messwerte, die der durchschnittlichen Datenträger-Warteschlangenlänge 8211 Durchschnittliche Datenträgerlade-Warteschlangenlänge und durchschnittliche Festplatten-Warteschlangenlänge ähnlich sind. Wie ihre Namen zeigen, zeigen sie die durchschnittliche Warteschlangenlänge für Vorgänge, die darauf warten, dass die Festplatte gelesen oder geschrieben wird. Festplattenzeit Dieser Zähler kennzeichnet ein Festplattenproblem, muss aber in Verbindung mit dem aktuellen Datenträgerwarteschlangenlängen-Zähler betrachtet werden, um wirklich informativ zu sein. Erinnern Sie sich auch, dass der Datenträger ein Engpass sein könnte, bevor die Datenträgerzeit 100 erreicht hat. 2 Die Datenträger-Zeit-Metrik gibt an, wie der Datenträger mit Lese - und Schreibanforderungen arbeitet, aber wie bereits erwähnt, ist er keine eindeutige Angabe eines Problems Kann normal sein, während theres eine ernste Disk-Performance-Problem. Sein Wert ist der durchschnittliche Datenträger-Warteschlangenlängenwert, der in Prozenten dargestellt ist (d. h. multipliziert mit 100). Wenn die durchschnittliche Datenträger-Warteschlangenlänge 1 ist, ist die Datenträger-Zeit 100 Was kann verwirrend sein, ist, dass die Datenträger-Zeitwerte über 100 liegen können, was nicht logisch ist. Dies geschieht, wenn der Wert für die durchschnittliche Datenträgerwarteschlangenlänge größer als 1 ist. Wenn die durchschnittliche Datenträgerwarteschlangenlänge 3 beträgt, ist die Festplattenzeit 300, was bedeutet, dass Prozesse 3 Mal mehr Datenträgerzeit als verfügbar verwenden, noch dass es einen Engpass gibt Haben Sie ein Festplatten-Array, die gesamte Festplattenzeit für alle Datenträger wird angezeigt, ohne die Angabe, wie viele Datenträger verfügbar sind und welche Festplatte die höchste Festplattenzeit hat. Zum Beispiel, Disk Time gleich 500 könnte auf gute Leistung (falls Sie 6 Disketten haben), oder extrem schlecht (falls Sie nur 1 Diskette haben). Sie können nicht sagen, ohne zu wissen, die Maschine Hardware Da dieser Zähler kann irreführend sein, einige DBAs nicht verwenden, da es andere einfachere und indikative Metriken, die Datenträger-Leistung anzeigen Wenn der Wert höher als 90 pro Datenträger ist, ist eine zusätzliche Untersuchung erforderlich. Überprüfen Sie zunächst den Wert der aktuellen Festplattenwarteschlangenlänge. Wenn er höher als der Schwellenwert (2 pro physikalische Festplatte) ist, überwachen Sie, ob die hohen Werte häufig auftreten. Wenn die Maschine nicht nur für SQL Server verwendet wird, können andere ressourcenintensive Anwendungen Datenträger-Engpässe verursachen, sodass die SQL Server-Leistung leidet. Wenn dies der Fall ist, sollten Sie in Erwägung ziehen, diese Anwendungen auf einen anderen Computer zu verschieben und einen dedizierten Computer nur für SQL Server zu verwenden. Wenn dies nicht der Fall ist oder nicht, können Sie einige der Dateien auf andere Datenträger - oder Maschinenarchivdatenbanken, Transaktionsprotokollsicherungen, das Verwenden einer schnelleren Diskette oder das Hinzufügen zusätzlicher Datenträger zu einem Array Datenträger-Lesezeit und die Datenträger-Schreibzeit Die Datenträger-Lesezeit - und Datenträger-Schreibzeit-Metriken ähneln der Festplattenzeit. Die nur die von der Platte gelesenen bzw. auf diese geschriebenen Operationen zeigen. Sie sind tatsächlich die durchschnittliche Datenträger-Lesewarteschlange und die durchschnittlichen Datenträger-Schreibwarteschlange-Länge-Werte in Prozent angegeben. Die Werte, die diese Metriken anzeigen, können genauso irreführend sein wie die Datenträgerlaufzeit auf einem System mit drei Plattenarrays, wenn ein Datenträger 50 der Zeit liest (Datenträgerlesezeit 50), der andere liest 85 der Zeit und der dritte ist im Leerlauf, Die Datenträger-Lesezeit beträgt 135 und die mittlere Datenträger-Lesewarteschlange 1.35. Auf einen ersten Blick, Disk Read Time gleich 135 sieht aus wie ein Problem, aber seine nicht. Es bedeutet nicht, dass die Festplatten sind beschäftigt 135 der Zeit. Um einen echten Wert zu erhalten, sollten Sie den Wert mit der Anzahl der Datenträger aufteilen und Sie erhalten 1363 45, was die normale Leistung anzeigt. Leerlaufzeit Der Datenträger ist im Leerlauf, wenn er keine Lese - und Schreibanforderungen verarbeitet. Dies bestimmt den Prozentsatz der Leerlaufzeit des Datenträgers Während des Probenintervalls. Wenn dieser Zähler unter 20 Prozent fällt, ist das Plattensystem gesättigt. Sie können das aktuelle Plattensystem durch ein schnelleres Plattensystem ersetzen. 3 Wenn der Wert kleiner als 20 ist, ist die Festplatte nicht in der Lage, alle Lese - und Schreibanforderungen rechtzeitig zu warten. Bevor Sie sich für den Datenträgerersatz entscheiden, überprüfen Sie, ob es möglich ist, einige Anwendungen auf einem anderen Computer zu entfernen. Freier Speicherplatz Neben dem Windows-Systemmonitor ist diese Metrik im Windows Explorer auf den Registerkarten "Eigenschaften" des Computers und der Registerkarte "Eigenschaften" verfügbar. Während der Systemmonitor den Prozentsatz des verfügbaren freien Speicherplatzes anzeigt, zeigt Windows Explorer den Betrag in GB an. Dies misst den Prozentsatz des freien Speicherplatzes auf dem ausgewählten logischen Laufwerk. Beachten Sie, wenn diese unter 15 Prozent fällt, da Sie Gefahr laufen aus freien Speicherplatz für das Betriebssystem, um kritische Dateien zu speichern. Eine offensichtliche Lösung hier ist, mehr Speicherplatz hinzuzufügen. 3 Wenn der Wert plötzliche Spitzen ohne offensichtliche Gründe zeigt, ist eine weitere Untersuchung erforderlich Anders als die meisten der Speicher - und Prozessor-SQL Server-Leistungsmesswerte können Datenträger-Metriken ziemlich trügerisch sein. Sie könnten nicht eindeutig auf ein Leistungsproblem hinweisen, dessen Werte möglicherweise in Ordnung sind, wenn tatsächlich ein schwerwiegender Festplattenproblem vorliegt, während ihre seltsam hohen Werte normale Leistung zeigen können, da sie Werte für ein Array von Festplatten anzeigen. Dann kommt es zu Array-Metriken, Hardware-Konfiguration Wissen ist notwendig, um sie richtig zu lesen. Trotz dieser Datenträger-Metriken-Downsides sind sie für die Problembehandlung bei der SQL Server-Leistung erforderlich

No comments:

Post a Comment