[Playlisten] [Impressum und Datenschutzerklärung]

29.03 Schätzung der Varianz


CC-BY-NC-SA 3.0

Tempo:

Anklickbares Transkript:

Schätzungder Varianz und damit die Schätzung der Standardabweichungwie bereit ist meine Verteilungwar diemirden Erwartungswert?? typischerweise in dem man einfach soundso oft Mistund den Mittelwert bildet der Mittelwert der Stichprobeaber wie kann ich den erfahren über das streutwas ich da gemessen habedas wäre die Schätzung derVarianzman probiert es ähnlichaneinmal messensteht im Text in meinem Essengibt mirX einsbis X N als Resultatund jetzt versuche ich aus diesen ähm Messungendie Streuung zu schätzenwas man machen könntewäre folgendesdas ist die sogenannte unkorrigierteStichprobenvarianzlassen sich monströs Kanonen korrigierteStichprobenvarianzan dem Wort unkorrigiertemerken sich schonetwas faul das wird man typischerweise nicht machen StichwarJanznurdie ist folgendesPunkt ich bestimme den Mittelwertausdehnenundmache das was ich bei der Varianz macheaber nun mit dem Mittelwertschlusszwei minus MittelwertQuadrat plus und so weiterplus neunzehn ?? Minuszeichen geworden plus und so weiterplus X ähm minusden den Mittelwert der Stichprobedurchähm sowas könnte man probierenum dieVarianz zu schätzen also dieses X quer wäre jetzt der Mittelwertder Punkt sie bestimmen die falschen Tasten das sie wäre jetzt der MittelwertderStichprobeeigentlicheigentlich müsste sicher hier rechnender gemessene Wert minus Mühe den echten ErwartungswertQuadrat plus den nächsten gemessenen Wert minus Mühlin ErwartungswertQuadrat und so weiter und so weiter das müsste ich eigentlich rechnendie mit dem echt Erwartungswert dann wäre alles in Ordnungdas würde mehr und mehrdie Varianz werden durch die Varianzdefiniert die Abweichung vom Erwartungswert verlieren und Mitteals wenn ich ein mühe stündedann wäre alles okay wenn er der Erwartungswert stünde das ungeschickte sich kennen Erwartungswertnichtnur meine Messwerteund weißen Erwartungswertnicht statt dass ich den echten Erwartungswertnehme setzt sich hier jaden Mittelwert der Stichprobe einsicher gelogen der Mittelwertestichprobeist ja nicht dasselbe wie erwartet versammelte mir sogar gesehenwie weit sich der Mittelwert der Stichprobe typischerweiseweg von Erwartungswertso vieldas ist der Ärgerwenn hier mühe stündewäre das wunderbardie übliche Formel wie die Bayerns entsteht hier vonden Grenzwert entgegen und ich binrichtig Mühe steht derMittelwert der Stichprobe und der stimmtletztlich das ganzeSchiefbahnkann aber noch Komma diese zwei Kriterien anguckendie man typischerweise hatder Schätzungen??ich möchte das es immer genauer wird je mehrExperimente ich mache je größer die Stichprobe ist umso genauer soll das werdendas funktioniert hierwenn sie immer mehrExperiment in der Stichprobe haben dann wird dieses X quer sich auch immer mehr an den Erwartungswertannähernund hier steht dann tatsächlich immer mehr weiß was der üblichen Varianzentspricht das haut hinwas nicht hinhautist folgendes Meßkirch gleich vor ?? ist das zweitewenn sie von dem Ausdruck unten von der Schätzung und den Erwartungswertbildenkönnen sie nicht das richtige Resultatimmer das funktionierter die Schätzung für denErwartungswertdurch den Mittelwertdas Haupthindernis Erwartungswert das richtigewenn ich das hier mache aus leider nicht hindas wir jetzt gleich das Instrument hier von Erwartungswertbildenund gucken was passiertob das das richtige wird ob dieses zumindest im Mittelstimmtsie Schätzung bitte auch mal zu groß mal zu klein sein und meine Hoffnung ist dann zumindest das der Erwartungswertdavon stimmte sie im Mitteldie Schätzung zumindest das richtige ergibtleider nichthaben kann man sichgrob so vorstellenwarum das nicht hinhauen kannFall gewordenimsich vor das wäre derechteErwartungswertMühlund jetzt mache ich ein paar Messungendie werden wir irgendwie streuenwo wird der Mittelwertvon diesen vier Messungen liegenalso wenn das meine vier Messungen sind X einsX zwei X drei sechs vier von mir ausund ich bilde da von den Mittelwertnicht vielleichtsonoch nicht der vielleicht so X werde Mittelwert aus diesen vier Messungendas ist im allgemeinen nicht Erwartungswertaber schon sehr viel Glückgenau den Erwartungswert treffen Beziehung Weise die Wahrscheinlichkeit dass das genau Erwartungswertist ist nullTreffernicht sie Stecknadel im Heuhaufen typischerweise nicht der Mittelwert daneben und eben ausgerechnet hierwie weit ich daneben liegeim Mittelund nun kommt das Ärgernisdas ichdiese Abweichungenvondiesem gemessenenMittelwert betrachtet wie weit ist das X einsweg von diesem Wert wie weit ist das X vier Wege weil es das X zwei Weg geweiht ist das X drei wegdavon guck ich mir die Abweichungen einquartiertund das Mitteldas ist aber zu gutweil der Mittelwert der Imagewerbung gerutscht ist wenn ich den wahren Erwartungswertnehmen würdedie Abweichung vom wahren Erwartungswertdes Bündnisses?? Erwartungswert ist ein weißer Schimmel erweichen vom ErwartungswertErwartungswertes immer warsie neben der Brechung vom Erwartungswertdamit es schlechterdie werden größer werdendasMittel der Stichprobeist der schon in den Schwerpunkte Stichprobe gezogenden ganzen einzelnenähmExkremente in der Stichprobe liegen natürlich dichter dran an dem Mittel der Stichprobeals an dem waren mit als am Erwartungswertdas heißt das was ich aus der Stichprobe schätze kann nur zu klein sei die Streuung diverser Schichtstichprobeschätze kann nur zu glatt ?? müssen es einmal ganz brutal malähm stellen sich vor sie habenecht Pechanund gegen das als Ergebnis das könnte ein Prinzip passieren das ist der wahreMittelwertder Erwartungswertkönnte im Prinzip passieren dass das ihre Messwerte sind genauso dem Prinzip es passieren kann das Sinn würfelt jemand miteinander werfen kriegen Firma die sechs es kann passieren ?? es muss sogar irgendwann passieren jährlich vor das passiert tatsächlich die vier Messungen liegen alle dadann ist derMittelwert ihrer Stichprobe hieran die Abweichungenvom Mittelwertder Stichprobe sind alle moderat aber die Abweichungen vomErwartungswertsind monströsdas wären Extremsituationjedes bisschen moderat aber trotzdemwirddieVarianz die ich hier schätze dieses Ding hier wird zu klein sein es ist immerzu gut was da rauskommtweil der Mittelwert der Stichprobe schon in der richtigen Richtung verschoben?? man einfach auswie viele zu gut istdas gar nicht so dramatischdas für mich auch widerlich für allgemeine Ent vor dass das nervt total das allgemeine zu machen das für mich auch wieder nur vorführtzwei was ist wenn siezwei nehmenund Mittewas passiert dannmit dem Ergebnis was wird Erwartungswert des Ergebnissesähmals ich hier für einen gleich zweider Erwartungswertvondas sieht heftig aus der Erwartungswert von den ersten Teil hierX eins Ministers Mittel aus zwei Messungsquadrat?? zwei Misses Miller zwei müssen könnendurch zweieinsminusdassdas Krause Minus das Mittel aus zwei Messungendas Mittel aus zwei Messungenins Quadratplus X zweiJahren noch nicht das sich allgemein für N hinschreibennur für gleich zweiX zwei minus das Mittel aus zwei Messungenins Quadratund davon den Mittelwert und streichen sondern den Mittelwertso tausend MittelwertKlammer zunoch mal zum Vergleicherste Mal messen minus Mittel verlieren zweite Mal messen Mittel Quadrieren durchzweiinsofern gleich zweimal anguckeerste Mal müssen Mittel vertrieben das zweite Mal messen minus Mittel vertrieben durch zweiund dass man jetzt müssen vorsichtig ausBastiadas irgendwie zusammenfassendie zwei kommt es bei der vor?? Indexnummersieben ??die zwei kommt erstvor also ein halb malErwartungswert von demwie kann ich den ersten hierkann ich den geschickt schreibenalso hier vorne habe ich eine X einsdavon sich in halbes X eins abseitig?? insgesamt ein halbes an ??ich hab insgesamt ein halbes X einseines minus ein halbes und davon sich noch in halbes X zweier ein halb X eins minus ein halbX zweiQuadrat ist der erste Termplusje hinten habe ich ein X zwei von dem ich ein halbes abziehenalso X zweiHalbeund dann habe ich noch ein X einsminushalbe abgezogenminus X einshalbeQuadratso weit so schönwarenlosesehr genau anguckenQuadratA minus B Quadrat plus den minus A Quadratich die zweimal dasselbeimim Quadrat hinten ist das einer mit einer Vorzeichen das was davon stehtalso das Amulett und schweift Komma schreiben sowas hier stets einfach zweimalX einshalbe minus X zweihalbe Quadrat hierhin steht dasselbe nur andersrum das was mit negativem Vorzeichen minus X ?? plus X zweigroß X eintritt minus X eins Innigkeit Resources minus Wegindie zwei ganz aus dem Quadrat aussehenwie sind da die zwei rausdie zwei aus dem Quadrat zehn heißt ein Viertel raus mal ein halbeinmaldie zwei also zweiViertel mal Xeins minuswenigstensdrei QuadrateKomma kürzenden Weg und ?? zweidas haftet insgesamt ?? des weiterendas Modell insgesamt ein halb malein halb ist ein viertelmal ErwartungswertvonX einsminusdreiQuadratjetzt kommt wieder binomisch Formelhier innen drin stehtPunktetwas größerhier in den Sandquadratso samt QuadratTX einsQuadrat minus zweiX eins X zweiplus X zwei Quadratdas was zwei Quadratso das ich insgesamt habe das ist ein viertel malverloren gegangen kann sein jährlich ein halb mal ein halb macht ein viertelein viertel malso der Erwartungswertvon X eins QuadratGradminuszwei mal das Produkt der Erwartungswertelosden ErwartungswertvonX zwei Quadratsromanmühsam ernährt sich das Eichhörnchennunein viertelso der Erwartungswertzum ersten Mal messen Quadrieren und Erwartungswert vom zweiten Mal messen Quadrierensowie einfach zweimal Erwartungswertder Zufallsgröße überhaupt schon es einmal X?? sie fassen die Beine zusammenErwartungswerteinmal messen Quadrieren irgendwie dasselbe als ob sie immer das zweite Mal messen Quadrierendie beiden sind die selberzweite vorne machensodie Beine natürlich dieselben ?? zweimal Erwartungswert der Zufallsgrößedieser jetztder ErwartungswertKomma sie müssen geschickt tausende Stellender Erwartungswertdes Produktsder beidenirgend eine Ideedass er gerade mal beim Würfeln?? sich vor sie Würfel einmal die drei dann dürfen sie noch mal gibt mit viersie würfelnsie beginnt von vornegibt es fünfzig normative Feldzüge von noch mal eins beim nächsten Mal gibt's in zweiKomma damit es genug und ich teile durch dreiin das wird nicht null werden wir eben immer das null war der Standdie Zufallsgrößeminus ihren Erwartungswertmalnoch mal messen minus Erwartungswertdann wird es tatsächlich null dass sie wird nicht null werdenwas wird das hier wolle Mittel werdenbeiden Anlässender erstes Mal größer war kleiner als Erwartungswert der zweite Makrosommer kleiner als Erwartungswert und das unabhängig voneinanderdiese Abweichungenlöschen sich Beckund Jahn zum Schluss tatsächlich den Erwartungswertdes einenmal den Erwartungswert des anderenmüsste man ausführlich begründennoch malfünf Veranstaltungskostenlassen sich nicht alle der Erwartungswertdes einen mal den Erwartungswert des anderen wird das werden wenn die beidenunabhängig voneinander sind?? aber Erwartungswert es einmal Erwartungswert des anderen ist schlicht und ergreifend der Erwartungswertdieser Zufallsgrößeins Quadratbeim zweiten Mal messen hatte durch denselben Erwartungswert überm ersten Mal messen und ihr steht ?? minus zwei der vorzweiproda steht dann insgesamt zwei Viertelzwei Viertel mal den ErwartungswertvonX Quadratminusden ErwartungswertvonXQuadratwas erkennt man nun wiederdas ist die andere Art die Varianz in zu ?? das ist die Art nicht die Varianz gut ausrechnen kann?? sie können einmal sagen Varianz istvon der Idee herdie Abweichungvom MittelQuadrieren im Mittel?? verglichen und vorgeführt das es nichts anderes alsdas Mittel des Quadrat minus das Quadrat von Mittelalso steht hier insgesamt haben wir Sigma Quadrat halbesich noch jemand was eine ?? auskommen sollteVorsicht warum ich das gemacht habe ?? dass ausgerechnet ich wollte feststellenob diese Schätzung hierzweimal messenund dann diese Anführungszeichen untenrigide Stichprobenvarianzzu bilden Punktich wollte feststellen ob das im Erwartungswertstimmt ich wolltewissenob dieses hier für N gleich zweiim Erwartungswertdie richtigeVarianz ergibt wenn ich das mit zweien mache einmal messen minusMittel von zwei Messungen plus zwei zwei messen minus Mittel der beiden MessungenQuadrat dividiert durchzwei ich wollte wissen ob das im Erwartungswertdas richtige wirdeines der beiden Kriterien hierstimmt es fürimmer größereStichproben immer besser geht es gegen richtigen Wert für immer größer Stichprobe undist Erwartungswertder richtigeauch für endlich große Stichprobenist zweite Kriterium wollte ich überprüfenist der Erwartungswertvon dieser unkorrigierten Stichprobenheuvarianzist Erwartungswertvon diesem Dingwirklichdie Varianz oder nicht und sie stellenfestleider nichtes ist nur die Hälfte der Varianzdas ist auch keine große Neuigkeitdass es kleiner ist zumindest nicht genau um wie vieles kleiner ist ?? dass es kleines Rkeine großen Orgel Neuigkeitenist auf jeden Fall kleiner als die Variante der vergangenen Chancenan ihr Wissen um wie vieles kleines ist nur die Hälftewenn sie zweimal messen und mit den zwei Messungen schätzen was die Varianz ist auch am sie nur die Hälfte des Originalsdas kann man allgemein machensie an das Essen bisschen ekliger wird undes unschöne Summenzeichenreinich kann diesen Faktor einfach korrigieren anscheinend wenn ich zwei Messungen machemuss ich das Ergebnis mal zwei nehmenund dann stimmt bei drei Messungen konnten anderer Faktor bei vier Messungskonten anderer Faktorallgemeines der Faktor folgenderund damit hat man dann diekorrigierte Stichprobenvarianzdie korrigierteStichprobenvarianzdie heißen gerne esdie Nummer achtS Quadrat heißt natürlichdie Standardabweichungist dann ist es Quadrat nicht mehr Sigma Quadrat sondern es Quadrat um zu sagen hallo das ist eine Schätzung dass es nicht Erwartungswertdas ist das Wasser eben hattenmit Verzierung?? einmal messen minus den Mittelwert von in Messungen Quadrat plusQuadrat plus noch mal messen minus den besagten Mittelwert plus und so weiterdas letzte Mal Ente mal messenminus besagten Mittelwertdurchähmund jetzt kommt der KorrekturfaktorN durch N minus einswas ich ihn vorgeführt habe ich hier ist für N gleich zweiArmfangleich zwei steterzweidurchWasser runter wenngleich zwei steht A zwei durch zwei minus eins mal zweizwei durch einsin gleich zwei Rechen sie mal zwei und handelt tatsächlich alsMittelvon diesem Ausdruck den richtigen Wertman sich die Mühe macht das für andere in durchzurechnenwenn man das ist der Korrekturfaktordie man brauchtmal en durch N minus eins also je mehr Messungen ich machedesto besser wird das auch wenn sie tausend Messungen machen ist der Korrekturfaktorja nur nochtausendneun hundert neunundneunzigstenoch ein Promille daneben ernst es mir auch egal zwei tausend Messungen heißt das dürfen Sieden ignorieren und rechnen das was sie naiv machen würden wenn sie nur zwei Messungen machendie sie massiv daneben wir würden mit dem hinteren Term alleine dieStichprobenvarianzum Faktor zwei daneben schätzen dabei schon für wenigeMessungen für kleine Stichproben diesen Term davon nicht vergessendas nette ist man keine kürzen wir dann sogar noch einfacherkürzen einfach N und Nuntersteht da die formelsammlungsmäßigeFormen es sieht so aus wie der Mittelwertder Mittelwert der Abweichungenvom Mittelwert korrigiertAbweichung vom Mittelwert verliert plus und so weiter plus und so weiter und hier X N minusMittelwert verliert ?? Teil durch N minus einsDetail nicht durch die Anzahlsondern sie teilen durch eins wenigerernannte den Korrekturfaktor eingebaut das ist diekorrigierteStichprobenvarianzdas ist das was man üblicherweisealsVarianz der Stichprobe angeht wenn man irgendwas redet von Varianz der Stichprobe gibt man typischerweise das ??nicht durch N teilen sonderlich N minus eins Talund was man als Standardabweichungangeht ist dannauch keine große Überraschung einfach die Wurzeldarausdieschon immer in Klammernman meist nennt man es dann einfach StichprobenvarianzundStichprobenstandardabweichungdurch mein Klammern die korrigierteStandardabweichungder Stichprobebestanden??Abweichungin AbweichungderStichprobeeinfach die Wurzel darausesnicht SigmaSigma ist die wirklicheStandardabweichungdie der Grundgesamtheitzu schönheitsarmes ist die Schätzungeinfach die Wurzelaus dem darum sittlichen Schreibenging alleine auf die Wurzel aus dem Ausdruck ebendas gibt man dannfür Stichproben typischerweiseandie Abweichungenvom Mittel Quadrieren auf summieren durchdie Anzahl minus einsund dann die Wurzelnur sich das genauer anguckt diese Schätzung jeder Standardabweichungist die ein bisschen gelogen dennandie beiden Kriterien hier wiederwillig ?? wenn diewenn die Anzahl der Messungen immer größer wird okay dann haut das Handy Standardabweichungwirddie Ware Standardabweichungwerden aber der Erwartungswertvon dieser Standardabweichungbildenstimmt der leider nicht stimmte Erwartungswertvon der Varianzaber Erwartungswert von der Standardabweichungwird leider nicht stimmt anderes ist die so fiesist der Sophies zu berechnen Erwartungswert von der Standardabweichungdass man sich das auch nicht gibtund gibt sich damit zufrieden löschen Erwartungswert der Varianz passtund daraus bildet man die Wurzel und nennt das denäh die die Steine dabei in der Stichprobeeine letzte Bemerkungzur Statistik noch an dieser Stelledieses Schätzungen hier sind nicht richtig schönweil diese unter Ausreißer leidenanwenn sie ein paar Messungen machenhierfinden Sie ein paar Messungen machenso von dieser Artund haben ein Ausreißerwenn sieeinfach jetzt den Mittelwertbilden darauswird der Mittelwertwunderbar in ein Vorzeichen wunderbar nach rechts verschoben seinanalog werden die ganzen anderen Größen die man da gebaut hat verschoben sei das macht sich sehr schön?? das ist nicht robust wie man so sagt ?? in der Physik in der Technik ist das meist nicht so ein Drama denn wenn sie Sohn Ausreißer haben?? wahrscheinlich normal an ihr Instrument zu untersuchen und fange von vorne anin den Sozialwissenschaftenmuss mit solchen Ausreißernrechnendieser Pins in den sozial gesicherten typischerweiseseltenerwas wir Erwartungswertan sondern lieber den Medianzum Beispiel den attischen vorgestelltwenn sie von diesen fünfMesswerten den Meridianbildensie geben das Ergebnis andas in der Mitte von allen liegt fünfzig Prozent drunter fünfzig Prozent oder welcher der Messwerte wird der Median seinPunktwas jeder ?? der zweite genau der ?? wird der Median seinden Medien störte Ausreißer nicht zu sehr?? deshalb nicht wundern wenn sie in Sozialwissenschaftenandere Größen sehenman braucht da robustere Statistiken wie das schon heißen robuste Statistikdie auch mit Ausreißern umgehen kann ist ?? technisch nicht in der Technik ganz und nicht ganze dramatischer Weise das im Hinterkopfsobald sie Ausreißer haben undkeine Chance sehen das das Ergebnis zu verbessern in dem Segment noch mal richtig machenanden sie mit dieser Sorte an Statistiknichtauf dem besten Wege