[Playlisten] [Impressum und Datenschutzerklärung]

Ideen hinter z-Test, t-Test, chi²-Test, ANOVA; Auswertung in Python


CC-BY-NC-SA 3.0

Tempo:

Anklickbares Transkript:

in der Statistik gibt zum BarklassikerKlassiker der Statistikdie üblichen Hypothesentestsvier Stückeinmalwas im Prinzip tun und dann auf einmal im heißen gezeigtwie sie da einfach die Werte generieren können heißender aller erste und einfachste ist der Z Testklassenmit zweiKasachen jeweils dazudann der nächste der VorkommnisseTäter ist und es tut uns täte es von dem es gleichdrei Varianten gibtdann kommt häufig vor der chi-Quadrat-Testjeder griechische Buchstabe Ichi-Quadrat-TestEnglisch Kai CHE-Kaiundals letztes Nummer vier anno war Arnaudwarin der LesesoftwareWilliamssollte das oft großschreibenwegen des Ohrund das V fätt auch Osram und SA dann auch schwammigerdiesevier Sitze die üblichen Verdächtigen nicht nur in der Mensch-Maschine-Interaktionsondern allgemein sieht man diese vier Arten an Tests am häufigstendieses Wald gut die man alle zusammen zu schreibenund jeden Fall geht es darum eine Nullhypothese abzulehnenals die Geschichte die von letzten Mal?? ich möchte mir überlegen ob die Messwertedie ich erhalten habeziemlich abwegig sind wenn die Nullhypothese gilt dafür gab seine diesen Wert klein P der kein Irrtumswahrscheinlichkeitistsondern Senat gemessenegeschätzteempirische Wirkungswahrscheinlichkeitistdieser Wert klein B sagt ebenin Anführungszeichenwie unwahrscheinlichdas ist was ich gemessen habewenn die Nullhypothese gilt mit vielen Körnchen Salz habe ich letztes Mal als erwähnt oder zuletzt angedeutet es der ganz ganz viele Körnchen Salz gibt aber dass zumindest die Beschäftigungmeiner hat mit Statistik Programmreservat?? heißensein eigenes Paket was das alles kannman rechnen die kleinen die Werteum zu sagenwas spricht aber gegen die Nullhypothese oder aber auch um konsterniert festzustellen ?? spricht nicht so wirklich gegen die Nullhypothesedas erste wäre der Z Test das erste und allereinfachsteich nehme an meineZufallsgrößedich untersuche es normal verteiltvöllig ?? Normalverteilungsowas ich nehme an meine Zufallsgröße Sommer verteiltund will es einfach wissenfür den gemessenen Wert den ich habewie schlimm ist es denn da für diesen Wertwie viel Wahrscheinlichkeitist sozusagen noch drüberund ich will Wahrscheinlichkeit ist auf der anderen Seite nochGegenpol im sicheren symmetrisch machen sie ?? Visier gehen ?? ich habe eine Normalverteilunggegeben miteinem ErwartungswertMühlund einer StandardabweichungSigmaerwarteNullhypothesedass meine Werte so verteilt sind die ich messeund die Frage ist wenn ich jetzt diesen Wert tatsächlich gemessen habenämlich Nixwie schlimm ist dieser Wert sozusagengebendie Nullhypothese angenommen die Nullhypothesemit welcher Wahrscheinlichkeitsich den Wertzeichen gemessen habe und höhere Werteoder spiegelverkehrtwenn zwei beidseitig sein soll spiegelverkehrtauf der anderen Seitedie Wahrscheinlichkeit möchte man bestimmennebenbei heißt es also diesen Z Testing kann ich nur anwenden wenn die Zufallsgröße dich untersuchenormal verteilt istschreib das mal jemand was Bedingungen dazu was das klein Gedruckteum diesen Test machen zu könnenmir ist die Bedingung Normalverteilungsollte das nicht funktionieren wenn ihre Zufallsgröße so verteilt ist und sie mit dem Test ist nicht allzu viel anfangen?? will also wissenwie wahrscheinlich ist es so weit draußen zu liegen und man rechnet dann einfach um Rechner von diesem Fixum auf einen Z Wertauf einen normierten Wertwie würden Sie das tun wie würden Sie diesen X wird um Rechnen auf eine Normalverteilungmit Breite einsunddas Zentrumim Ursprungoder bei null soll ich sagenwie würde man diesen X wird um Rechnen können wir den Bürgern ihrsieschieben sich imo nach links also Nix minusschien das ganze ?? nach linksund dann teilen sie durch die Breite dies hat durch die Standardabweichungdies hat unter ?? ist jetzt um die null unter die Stadtverwaltungeins man rechnet einfach von irgendeiner Normalverteilungmit irgend einem Mittelwertirgendeiner Stelle erweichen um auf einer Verteilung die um die null sitztund die Stadtverwaltung eins hatdas RZ wird?? einfach minus Mittelwert durch deine Abweichung im DZ Wert und RZ Werte werden normal verteilt wenn das X irgendwie normal verteilt ist der Zettel auch wieder normal verteilt ?? mit Mittel null und stand dabei ?? eins und das kann man den eben ganz dumm nachguckenfür Preisen gibt es nette Paketsei beiStaatssei Preis ein Defekt beißenPunktdas Statistikund was ich es einfach braucheist jetzt ZS normal verteilt ich habe umgerechnetund dann kann ich jetzteinfach nachgucken wo liegen wir denn damit unserem Zbei derVerteilungsfunktionbin ich dieWahrscheinlichkeitbis zur Mittel irgendwo zu liegenist ein ?? dass es auf der Höhe ein halbbis unendlich irgendwo zu legen ist eins das da guck ich jetzt nachvorn wie weit sind wir hier draußenwie viel sind wir unter der einundzwanzigZiffer nach Punkt in Preußen zum Beispielfinden wir dasund warstjetzt natürlichda die Normalverteilungund von der Normalverteilunghätte ich gerne CDRdie Communities zu duschen fang schonwie groß ist die Wahrscheinlichkeitetwas bis zu den gegebenen Wert zu habenwie groß ist die Wahrscheinlichkeitetwas zu habenbis zur Zahl zwei zum BeispielSiam eine Normalverteilungan der null zentriertStandardabweichungeins wie groß sie wahrscheinlich hat ein Wert rauszukriegenbis zur Zeit zwei negativnull zwei irgendwo dazwischennull Kommaneun sieben siebenbin ich schon sehr weit außenirgendwo das wäre dann den Wert null Komma neun sieben sieht mir oben hätten sie eins raus hält sie null Komma fünf ausihren sie bei null Komma neun sieben sieben?? die zwei Standardabweichungenweg stand aber schon jetzt war gerade einsmuss man sagen können was kriegen sie raus wenn sie minuszweigebenwie groß ist die Wahrscheinlichkeitaus der Normalverteilungin Mittelwert null und ?? abweichend eins etwas rauszukriegenwasminus unendlich und minus zwei nicht auf der anderen Seitealsoich guck miroben zu noch ich gucke mir die übliche Normalverteilunganstatt Abweichung einsund stelle Festwertebis zur Zahl zweiirgendwelche Werte egal welche bis zur Zahl zwei Krieg ?? wahrscheinlich bald von null Komma neun sieben sieben irgendwaswie groß ist die Wahrscheinlichkeitswertebis zur Zahlminus zweizu kriegendurch die oben fehlen ihm null Komma null zwei drei ?? werden zu lassen Komma null zwei drei irgendwas zu eins die gesamte Flächeunter der Kurve ist ja einssei sie oben fehlen die null Komma null zwei drei und aus Symmetriegründenmuss Session daneben auch null Komma null zwei dreisein Wahrscheinlichkeitbei dieser Verteilung einen Wert zu bekommen der bis minus zwei liegt minus zwei hundert Unterrichtmüsstezwei Komma dreiPerson Prozentzahlenguckenwas sagt?? Minuszeichennull Komma null zweidrei ungefährso ist Beistrichdass wir jetzt ein P wirdschonfür diesen setzt jetzt ?? ich rechne um auf die Normalverteilungsteinerner Abweichung eins Mittelwert nulloder könnte es auch hier oben direkt sagen für diese Normalverteilungdie breiter ist und verschoben istund jetzt weiß ich eben wenn ich hier nicht eine Abweichungeins und Mittelwert null den Wert zwei bekommen habe dann ist die Wahrscheinlichkeitso einwärts zu bekommen oder einen größeren dazu bekommen zwei Komma drei Prozentdas wäre einseitigund zweiseitigrechnendann wär's irgendwas bei knapp unter fünf Prozenteinen Wert zu bekommen der zwei Standardabweichungenweg ist das ist auch einerder Gründe für diese fünf Prozent Klausel sozusagen warum fünf Prozentfünf Prozent übersetzt man zu zwei Standardabweichungenkönnte fünf Prozent aus an zwei Stellen der Weichen wegoder mehrund der ZSist einfach dies umrechnet in diese Variable Zso das ich an der Normalverteilungmit Mittelwert null und stand Abweichungeins nachgucken kannsowie vier gerade nur in Preußen dieProzentwerte generierthat ?? noch einen Schritt vorher machendieses umrechnetauch noch eingebautZ ist gleich?? setzt natürlich wiederassistant Asis CorlizenzWert und würde sie Scoreund jetzt will er wissenwas ich denn übersetzen wir in den sie Score geben Sie jetzt eine Liste von Messwerten sozusagenangeht zweivier Komma zweisiebendrei Kommaanno eins Komma null oder sowasdas sind ihre Messwerteund die werden jetzt in Zeitwert übersetzt sich jedes Mal aufs ?? also bestimmt die Standardabweichungder Stichprobeund den Mittelwert der Stichprobedas GTZ Werte das ganze geschobeneskaliertdass die Standardabweichung als wird und der Mittelwert null wirdKomma die vorausdas Kind in Summe distanziert werdendas Events EZ Wertealso für die zwei wäre der Zeitwert installiereverschiebe anatomisch Verschiebeskalierenminus null Komma acht und für die vier wäre dernull Komma fünffür die eins Komma null Ziffer ganz weit rüber minus eins Komma vier Sis in der Reihenfolge sozusagen bleibt dieselbe ?? Zahlen werdenverschoben und skandiert das wären die Zeitwert und mit diesen Zahlen unten kann ich jetzt auf der Normalverteilungmit Mittelwert null undAbweichung eins nachguckenhier zum Beispiel gucken okay was ist denn jetzt der Wert Z von ??gucken ?? man in den letzten in den Preisen ist der letzte in einem Reaktor minus eins?? nur wenn sie den ersten Finger minus eins in den letzten oder null eins zwei drei vier?? aufschreiben jetzteins es wäre dezent wird von den letztenund dehnte sich jetzt ein in meinerVerteilungsfunktionund kriege rauseinen Wertbis eins und darunterglicheine Normalverteilungjetzt mit einer Wahrscheinlichkeit vonacht Prozent ?? acht Komma eins Prozentder kleine B dazu zu sagen was sie da jetzt rauskriegenfür den letzten Erzieherandere Werte ausprobierenwenn wir immer ganz was absurdes minus zehnwas erwarten Sie als P wird für minus zehnsehr geringzwei Prozent nur allerdingsweil das inzwischen komisch an dieser Funktion diese Funktion rechnet ja aus der Liste die Mandate Mittelwerte die Standardabweichungaus das heißt zensieren Ausreißer haben diese Ausreise wird ja auch benutztum Mittelwert und Stange dabei ausrechnen ist insofernbisschen Fisch das muss man anders machen ?? immer minus hundert und vierzehn das deutliche Wasser gerade nur zwei Komma fünf Prozentwird offensichtlich nicht besser als damit man etwas anders angehen müsse erster Mittelwert der Mitarbeiter bestimmen und dannden Eigenwert der einsetzenkonnte ?? gerade beiFluss sehenwas erwarten Sie so größenordnungsmäßigWinter hinten plus zehn steht?? als Wildwasser eben gestanden hat knapp einsnatürliches auch wieder mit Körnchen Salz in zehn Meter eingerechnet in den Mittelwert und so weiter man müsse das etwas anders war das Ganze etwaspassieren in den ganz viele Werte eingebendass die Ziele nicht mehr so dreinschlägtdann müsste dieser wird jetztgrößer werden noch dichter an einsich bestimme ja die Wahrscheinlichkeitbis zehn zu liegenund die müsste jetzt doch sehr groß seinsind ist der Club ein Semester in minus zehn eingebenwird er hoffentlich wieder klein werdenmit der er klein werdenso sieht das aus?? könnte man den Z des?? guckt einfachich habeZufallsgrößevon der ich annehme dass sie normal verteilt ist wichtige Annahmeund gucke einfach wie wahrscheinlich es ist das die Zufallsgrößeso entlegen nicht wie sie ist oder schlimmer muss ein bisschen vorsichtig sein wenn man hier mit derblauen Kurve arbeitet das ist die kumulierte Verteilungsfunktionvon der Normalverteilungendlich oben gegen eins das Axiom müssen immer eins minusden Wert rechnen den sie aus Gericht haben wir aus der Verteilungsfunktion?? und nahmen die Berliner haben vordas wäre dezent Testangenommen ein Zufallsgrößeist normal verteiltwie groß ist die Wahrscheinlichkeitdas zu sehen was ich gesehen habe oder schlimmerder Täter ist der kam gleich in drei Variantenvores gab einmal den für eine Stichprobe der ein Stichproben tätestunddann gab's sinnvollerweise den zwei Stichprobentätersundder Testaufbau weist Differenzen muss schon sagen soll ich habe immer paarweise Differenzendas kam ja schon vorwas soll das jeweils seinich hab mal offensiver Sinn oder Prothesen werdensicher zahlreiche oben die Nullhypothesewäredie Zahl die ich gezogen habe stammt aus der gegebenen Normalverteilungund keine anderendas wärediesaloppe These da obenfür den Zentestfür den Teetest der ein Stichprobentestsie mache eine Umfrageund kucken zum Beispielmögen die Leute oder mögen sie's nichtist der Mittelwert der gegebene Wertprotesteanderskann ich annehmen dass zum Beispiel der Umfrage einfachim Mittel gut rauskommt oder gibt es Gründe anzunehmen dass das nicht der Fall istdas wäre ein Strichpunktdie dass sie Fragen zwanzig Leute gucken sich an der Schule gefunden haben ?? Schulnotendann wollen Sie wissen das sie Mitleid gut oder ist das im Mittel abweichendvon dem gut weitere einseitigdieses Mittel besser als gutes Mittel schlechter als gut das wäre dein Stichproben täte es sie machen eine Stichprobe?? zwanzig Leuteeinmalzwei Stichproben tätestwas machen Sie da?? zwei Stichproben sie geben der Hälfte der Leutedie Anwendung mit dem roten Hintergrund und seinen Hefte deutlich Anwendung mit dem blauen Hintergrundund die Frage ist finden die das selbersie haben zwei Stichprobendie Frage ist Stimmen die Mittelwerte über ein in diesen beiden Stichprobendas wäre die Nullhypothesedie Mittelwerte stimmen übereinüberlegen ?? ich sage Nullhypothese müsste ich eigentlich schreibendie Nullhypothese sagtAusrufezeichennicht FragezeichenProfessor Fragezeichen Ausrufezeichendass meine Hypothesein Nullhypothesebei Mittelwert ist gleichein eine Variante des Programms Jan-Hendrik eine Rente des Programmswirklich klinischen StudienmedikamentAund ein Placebound die Fragen sind die Mittelwerte gleichoder nicht und hoffe natürlich dass die Mittelwerte nicht gleich ?? soll der Handel abgelegt werdenKlammer zu zwei verschiedene Gruppen an Leuten die sich jeweils für sich befragen zwei Stichprobendas getan schon den Bogen zu den letzten paarweise Differenzenwas ist da jetzt anders bei den Bauweisen Differenzenwas mich zwei getrennte Gruppen von Leuten sondern dieselbe Gruppe von Leutenzeigen den Leuten etwas vorhernachherzu ausprobierenzum Beispieloder man hat irgend eine Interventionvor dem Training nach dem Training unterbietet man die Differenzen pro NaseproTestteilnehmerin ?? bildet man einfach die Differenzen deshalb diese paar weißen Differenzen sowas wie vorher nachherzwei Stichproben des an sich Vorher Nachher sie an eine Gruppe an Leutenmit der einen Variante Nano bei Leuten mit der anderen Variantedass sie nicht dieselben Leute decken sachlichpro Nase sozusagen ein Differenz bildenüber den Bau weisen Differenzenanders und die Nullhypothese wäre dann sowas dass der Mittelwertder Differenz ich weiß es sich wieder schön aufschreiben soll ist der Mittelwert der Differenzpro Person gerechnetgleich null ist das wäre dadie Nullhypothesevorher nachher gibt's keinen unterschied im Mittel das wird eine Nullhypothese und der Titel sagt imwenn die Nullhypothese gilt sich das oder was Schlimmeres nur große Abweichungen mit der Wahrscheinlichkeit klein PCasas es gibt die mindestens drei Funktionenin den Tabellenkalkulationsprogrammschalten Sie um mithilfe vonspeziellen Parametern in der Funktionheißen gesetzlichenFunktionmit dem man das erledigen kann Punkt das ist das übliche was man bei Umfragen verwenden wirddas immer Aus kommentieren sich zu viel ausgegebenwirdder erste wäre derTT schon mal der ersteStylesderTTS one Sampleund er will jetzt wissenwas sind meine Messwerte als Liste Komma dass meine Messwerte zwei vierKomma einssiebenacht vom ersten das meine Messwerteund mit welchem Mittelwert aufbrechen Mittelwert möchte ich jetzt prüfenKomma ?? fünf Komma zwei es Beistrich ganz unplausibelich möchte jetzt prüfenob das zusammenpasstmit dem Mittelwert fünf Komma zwei das wäre meine Nullhypotheseder Mittelwertist ?? fünf Komma zwei?? ausgeben überhaupt noch Print TTdas Gegenüber daraus sehen okaynull Komma neun acht Selinde Nullhypothese nicht ab das ist der Tee wird das erste hier ist der Teewertsich erinnernsowas wie die Differenz der Mittelwerte durch etwas wie die Standardabweichungsehr ist der Teewertist aber nicht richtig spannendschon im zweiten Jahr der zweite der herauskommtdas STP wirdKomma neun acht das heißtdas ist doch ziemlich wahrscheinlich unter der Nullhypothese?? was heftiges nehmen sorgen ?? malso fünfzehnich habe diese fünf Messwertemöchte wissen ob das der passt in der Mittelwert eigentlich fünfzehnwäredann kriegen sie null Komma null neun sieben rausdas passt also offensichtlich nichterhöht Punkt diese Ablehnungder zweite Wert ist der SpannDT wertistwie gesagt sowas wie Differenz der Mitteldurch die Standardabweichungdas wäre der ein Stichproben tätestso der zwei Stichproben Teetest war sinnvollerweisezwei Stichprobenwerde jetzt nur einediese Liste ihrkriegt sinnvollerweise jetzt zweiTeetestin den Händenganz in die bändigen anstattzweiIndustriezweigenzweiunabhängige Stichprobenfragenhundert Leute daund hundert Leute auf deiner Seite sozusagen zwei hundert Stichproben die stehe natürlich jetzt auch trennen und das wäre quasi meine erste StichprobeKomma meine zweite Stichprobe irgendwie dazudie Frage ist haben sie denselben Mittelwertwendet die Werte aus ?? sehr kleines ist das ein Indiz dagegenein Indiz dagegen dass sie denselben Mittelwert haben also ?? rausaus dem was rauskommt ?? PrintT zweiKommavier sagte jetzt für den diverse Sinn das sieht auch relativ plausibel ausbreiteStreuung irgendwie um dieEinheitund jede breite Streuung?? etwas größer aber nicht so weit weg mich das im bisschen weiter treiben wenn ich es sage oben immerdas hiersang sie vielleicht sowas wiedas sinddie Zeiten die sie gemessen haben für eine Benutzergruppe dessen die Zeiten gemessen hat oder für ein Typ ihrer Software dass die zeitlichen Messen haben in einer Benutzergruppein einer Softwarehat die zweite Benutzergruppeoffensichtlich viel länger gebraucht als die erstedas sollte sich imTeetest hier niederschlagen ??null Komma null eins ein Prozentwürden sie ein Bild wird von null Komma eins Prozent haben offensichtlich das sieht man jetzt aber auch mit bloßem Auge dass das wohl nicht zusammenpasst von Mittelwertendas wäre der zwei StichprobenSehtestsie sind die beiden Stichproben müssen sich um dieselbe Größe habendas Komma raus korrigierenund dann kommt noch der paarweiseVergleichdieverwinkelteVorder sowas ist ähm siezweimal gemessenen Werte an sowas wievier fünf sechssieben von mir ausdas wären die Werte vorherwurde die Werte mit einer Version und dann kommt die werden nachher die Werte mit der anderen Versiondieser Macher die Werte werden grundsätzlich größeralso von D vier auf die siebendass wir jetzt meine erste Testpersonvorher vier jetzt die siebendie nächste Testpersonvorher fünf reicht dann jetzt achtin die nächste Testperson jetztvorher sechster nachher vielleicht auch sieben ?? und die vierte Testpersonsieben?? jetzt neunso könnte das aussehen?? Werte vorher nachher das bedeutet übrigens das hier vorne genauso viel Zahn bestehendes wieder hintenanders als bei dem zwei Stichproben tätestfragen viele Leute sie fragen sechs ?? Aussagensind viel zu wenig vier und sechsdie beiden müssen nicht gleich groß sein wie die beiden müssen gleich groß seinKomma wenn die Werte gleich sind ungefähr Sonnenenergie wird groß sein Komma dass gerade mal sogar forcierenich schreib einfach hinten derselbe rein vier fünf sechs siebenkeine Änderungdie Nullhypotheseist ja für diesen Detailsdie Differenzhatte Mittelwert nullDifferenz wirklich den Mittelwert null offensichtlichausgeben TPTages leider gerade durch nuretwas abschwächen so wird auch nicht vorkommen in der Warenwelt ich hoffe jetzt reicht in das um es ausrechnensieht etwas besser aus als gesamte int wird von neun dreißig ProzentKlammer zu wenn ichmit dem einen um eins rauf dieDemo eins raufgehe und wenn ich mit eins runtergeheein siebzig Prozent verringert und das ist es auch offensichtlich alles irgendwie plausibelund wenn dagegendeutlich was passiert wenn ich sage sieben neuennormalenneunachtdann will ich doch hoffen dass der Bewerber untergeht die beiden sollten doch erkennbarverschieden seinzwei Prozent es jetzt viel Wertwürde meine Nullhypothese absehensind für den Täter steinig zu wenig Wertevier Werte ?? Beistrich nichtaber wenn das so wäre wenn sie es ganze Reihe hätten sechs hundert Leute gefragt so sieht das aus den würden sie Nullhypothese ?? playdieserVergleich hierverzeih ich noch mal das diese Funktion hinten eigentlich überflüssig ist die können Sie auch mit der ersten Funktion hinkriegen wir nicht noch mal nehmeich könnte dasselbe ausrechnen mit dem ein Stichproben tätestsehen Sie wie das KlingelnPunkt sie niemals die Differenzensieben minus vier sind dreineun minus fünfsind vierneun minus sechs sind dreiund acht minus sieben ?? einsund ich guckeob der Mittelwert null ist ebenerdig mit dem Mittelwert fünf Komma Zweifel ?? verglichenmit der Nullhypotheseder Mittelwerte ?? Komma zweies ist die Nullhypothese die Differenzenhaben den Mittelwert nullstatt dass sie das so machenkönnen Sie auch einfach sagen ich nehme die Differenzen und guck ob die Differenzen im Mittelwert null habenund das muss das Ergebnis werdensie hier das Ergebnisaus dieser Zeileund hier sind sie das Ergebnisaus der Zeit offensichtlich dasselbewie der Tee wird es anderswo verrechnetweißen hast ?? Differenzen anders umgebildet als ich sie gebildet habe auch das ändert nicht die bewährte?? insofern ist das kein neuer jetzt Arbeitsdifferenzdes ist nichts Neues macht es noch bequemermuss endlich gucken dass man über die wichtigen festnehmenVergleichen Sie eine Stichprobe mit einem gegebenen Mittelwertvergleichen sie zwei unabhängige Stichprobenoder gucken sich sowas an die vorher nachherdieselbe Anzahl anTeilnehmern jeweilsund bei der ähmZS ?? schon gesagtsich als Hinweisan dasselbe hier bei dem Teetestmuss hinreichend viele habenNormalverteilungoder hinreichend viele Punkt wenn Sie sich Umfrageergebnisseanguckendies natürlich beim besten Willen nicht normal verteilt vor allen Dingen wenn sie ?? ahnungsloshabendenSkala von eins bis fünf Schulnoten oder von eins bis sieben Komma verteilt sein wenn es nur siebensechs sieben Möglichkeiten gibtaber wenn man genügend Leute hatdann wird es funktioniert also eine Regel ist das ?? eine rege so eine Hausmeisterinsagt okay mindestens dreißigdie Stichprobe es mindestens dreißig Individuen großwenn es nicht normal verteilt ist dann geht es auch machbar als dieAnzahl nicht dem Jade vier oder sechs oder so Leute das ist ein ich zu wenig für den tätestmüssen deutlich vorsichtiger seindas es der Täter ist?? das übliche für Umfragenzum Beispieloder um zu prüfen ob sich etwas verbessert hat etwas verschlechtert hatchi-Quadrat-Testden hatte ich in den alten Videos nicht ?? ist die Nullhypothesedas ein Ereignis mit einer bestimmten Wahrscheinlichkeitauftrittsowas wie die Wahrscheinlichkeitistdie gegebene Größekönnte man ganz einfach ?? mit der idealen Münzeist die WahrscheinlichkeitKopfzu habenein halbdas wäre dann die Nullhypotheseist ein halb?? würde versuchen die abzulehnenoderwenn Sie verschiedene Möglichkeiten habenes können die Produkte ABC gekauft werdensie die gleich wahrscheinlichist jede dieser wahrscheinlich galten gleich ein Drittel das wäre auch typischer Fall für den chi-Quadrat-Testoder wenn sogar wahrscheinlich ?? vorgegebenhaben Sie wisseneigentlichsollte arm mit dieser wahrscheinlich kein Auftretenwill mit dieser Wahrscheinlichkeit und zehn mit dieser Wahrscheinlichkeit auftretenist ?? Stichprobefestzustellenhäufig die dein tatsächliches Auftretenpasst das zusammenüberprüfen und Wahrscheinlichkeitenstimmen sind die gemessenen Wahrscheinlichkeitengleich vorgegebenen Wahrscheinlichkeitendas ist das typische was man mit dem chi-Quadrat-Testmachtwas man dannbildet die Teststatistiknahm sie QuadratT heißt die Band geht es sinnvollerweisein Teststatistikbeim chi-Quadrat-Testmuss man ausgerechnetaus seinen Messwertennahm sie Quadrat dann sowas im Prinzip ich will'sgar nicht so im Detail habensie summieren über alle Möglichkeiten sowas wie eben ABCmöchte drei verschiedene Wahrscheinlichkeitenhabenund dann stelle ich festdas mal so in von J gemessenwie viele Bahnen tatsächlich in der Gruppe J nach meiner Messungminuswie viele hätten drin sein sollen ?? mal solldas ins Quadratdurch die Anzahl Toiletten drin sein solldas man einfach außer sie haben Vorgabenfür drei Gruppenkriegen dann drei Anzahl?? neunzig Leute in der Gruppe Ahundert zwanzig tausend der Gruppe B fünf hundert Leute in der Gruppe Cund vergleichen die jeweils mit den anzahlen dieser Raten würden anhand der gegebenen Wahrscheinlichkeitenauf diese Weisedas werden je Quadrat der Statistikan die findigen Leute hingesetzt und sich überlegt wie wir das jetzt verteiltwenn die Nullhypothese giltwenn diese Zahlen tatsächlich so verteilt sind mit den gegebenen Wahrscheinlichkeitenkann man sich überlegen wie weit man davon weg istdie Anrede schon einegleicht vielleicht vielleicht eine BesonderheitzumUnterschied zum tätest und zum Zeittestwas heißtdass meine Wahrscheinlichkeit nicht stimmenwenn die gemessenen Wahrscheinlichkeitennicht gut übereinstimmenmit den vorgegebenenwahrscheinlich kein was passiert mit der Teststatistikhierso der Welt groß niemals klein B steht die Differenzins Quadratbeim tätest Stande sowas wie die Differenz der Wartungswertedurch irgendwas das Wort auch negativ werden beim Z Test konnte das auch negativ werdendiese dann immer nur groß werden wenn es nicht passtwie diese Statistik immer nur groß soundso ins Quadratdurch eine Anzahldes wann man immer einen einseitigen TestFußnote hierchi-Quadrat-Testes immer einseitigdavon also nicht verwirren lassengibt die viel Sinn in zweiseitig zu machen?? nur positiveBecker nicht unter Null liegenich sollte nebenbei aus dieser ?? Teststatistiksagenan die SCHON Idee warum vergleicht man das Quadratmit der Anzahl doch erst mal falsch aus so ein Netz technisch die das offensichtlich falsch aus das Quadrat zu vergleichen mit der erwarteten Anzahlaber die Tester Statistiksich so anfühlt als ob sie der Einheit hätte wenn sie hier Quadratmeterdurch Mieter teilen würden hätten sie noch Meter übrig ?? Teststatistikdas wäre komische Sachen haben die Skalen unabhängig sind aber der Witz ist ?? das es in der nicht Quadratmeter durch Mieter das sind ja anzahlen die sind einheitslosdessen Club das einheitstechnischund vielleicht denen sie sich noch so bisschen anVarianz und Standardabweichungdie Varianzist irgendwie proportionalzur Anzahl dass sie Oma mit der Varianz zu tun ?? das Quadrat von dieser Abweichung das ist proportional zur Anzahl und das kürzlich dann tatsächlich mitgerade durch dieses Quadrat glich das das richtige Skalenverhaltensieht es am Anfang komisch aus ist aber so korrekt das Quadratdurch die Anzahlkönnte man jetzt langwierig studieren lohnt sich nicht wirklich ??ist eingebaut wichtig ist die Idee zu haben sind es Statistik wirdgroßwenn die Wahrscheinlichkeitendie ich meine Stichprobe habe nicht zu den Kleinigkeiten passeich in meiner Nullhypothese habenund es bleibt immer noch großes kann nicht im ?? setzen wir dann wirklich Glück gehabt sozusagennamens man aber mal die technischen Randbedingungen habendie Einschränkung hier wäreeben ehrlich gesagtgeht es Normalverteilungoder mehr als dreißigStichprobebei den chi-Quadrat-Testsagt man zum Beispieldass die erwarteten?? soll erwartet ?? schreiben soll als Einschränkung dass die doch lieber größer als fünf sein solltennicht zu wenigekommen eigentlich auch wieder mit Normalverteilungrechnete man diese Statistik erleidetsich in eine Hand voll Fälle habendann reicht das einfach nicht die Normalverteilung zu sehenalso auch da auch meine Mindestgrößean Fällen sozusagenso und ineinzelnenKommunistenmit dessen Prinz sie wieder weg ist es nicht so voll wirdKomma sinnvollerweisewenn ich das jetzt die zwei vielleicht wegenKreis Quertalsundmit Kaials QuermusterdaHighschool ??oder so signalisiert sie sogar gerade in den Hinweisen so und das Sixpack des Wissens gerade kurz gesehennicht soll säuberlich gut ?? erwartet hinschreiben soll egal was sie angeben müssen ?? dürfteFX bettetdiebeobachtetenHäufigkeitenund die erwarteten Häufigkeiten wenn die erwarteten wir nicht angeben in der Analysis gleich häufigals irgendwas ?? sowas habenmeine Häufigkeiten sind von mir ausdreißig Leute kaufen Produkt Ahundert elf Leute kaufen Produkt B und die Leute kaufen Produkte Cund dieerwarteten Häufigkeitenguckendas es etwas sinnvolles ist fünfundzwanzigtausend wenigerKlammer auf leichthundert sechzehnzehnsowas das wären vielleicht meine erwartetenHäufigkeitenund chi-Quadrat-Testsagtwie steht es um unsere Nullhypothesewas das angehtder klein B wird für unsere NullhypotheseTrennstrichzweisehen Sie okay das würde wohl auch möglich seien vierundfünfzigProzentsieht nicht ganz unplausibel aus also das wäre noch möglichBeistrich betreiben kannich aber vorne vielleicht vierziggezählt und hier nur hundert und eins gezähltdas sollte doch schon ein bisschen wahrscheinlicher seinwird ?? lieber null Komma vier Prozentalso wenn die Nullhypothese gewesen wäre?? Leute kaufen Produkte ABCzwar so von zwanzig Leute kaufen aber hundert sechzehn Leute kaufen wie zehn Leute kaufen sie wenn das die Wahrscheinlichkeitendie erwarteten Wahrscheinlichkeitengewesen sind und ich habe gemessen vierzigster da mal gekauft und eins B und zehn haben sie gekauften würde ich jetzt sagen ?? die Nullhypothese abweil der kleine Bill wirdgleichnull Komma null null vier ist null Komma vier Prozent ist das nach der chi-Quadrat-Testprüfen ob Wahrscheinlichkeiteneingehalten werden ?? der letzte im Bunde war ein Novanovasieht man auch hin und wieder in den einschlägigenArbeitenMensch-Maschine-InteraktionHallo weiß was eine Verallgemeinerungdes Tätersan die Test vergleiche ich typischerweise zwei Gruppenwohntbei Hannover vergleiche ich noch mehr Gruppenmöchte Wissen haben die denselben Mittelwertalso die Nullhypothese wäre hier der Mittelwertgruppeeins schreibe ich mal Mittelwert Gruppe einsist dasselbe wie Mittelwert Gruppe zweiist dasselbe wie mit der Gruppe zwei begruben sie auch immer habenund so weiter das ist da die Nullhypotheseund die wird eben abgelehnt sobaldein Mittelwertsobald eine der Mittelwerte aus der Reihe tanztnur irgend eine Abweichung gibtdas heißtKomma sie bauen zehn verschiedene Variantenvon irgendeiner Softwareüberprüfen dann mit Anrufer auf mindestens eine dieser Varianten aus der Reihe tanztist mindestens eine Gruppeanders Mittelwertdas macht anno mit dem Täters würden sie raus kriegen bei einer Gruppe was der Mittelwerte zwei Gruppenpassen Mittelwerte zusammen und ?? weiß wenn man so willeine Verallgemeinerungdavon soundsoviel Gruppen wie viel sie wollendie denselben Mittelwertdie Nullhypothese wäreeine Mittelwerte sind diesenebenbei soll dann schon mal dazu schreibendass es die Einschränkung hieralle Gruppen sollen die selbst ?? Abweichung habenunddie Störungen die Abweichungen von den Mitteln immer wieder normal verteiltwenn das nicht der Fall ist müsste man eigentlichsehr viel Vorsicht angehendie Teststatistikkönnen sich jetzt eine Vorstellung was man tutfünf verschiedene Gruppen und ich möchte wissen ob die denselben Mittelwert haben diese von verschiedenen Gruppen zum Beispiel was werden sie miteinander vergleichendass meine Versuche auf der x-Achse und hier auf dem Sack sind die Ergebnissejetzt kommt die erste Gruppemit diesen Ergebnissenkommt die zweite Gruppe mitdiesen Ergebnissenkommt die dritte Gruppe mit den Ergebnissenund die vierte Gruppe mit den Ergebnissenist diezu kurz nachdem die fünfte Gruppe mit den Ergebnissenwarum würden Sie sagen wollendass das nicht zueinander passt in den Mittelwerten wickelte man es jetzt festmachenan so einerGrößekönnte man es eine Teststatistikbauen mit der ich sagen kann Leute diese fünf Gruppenpassen nicht zusammen vom Mittelwert fort kann ich das festmachenalso eine Idee wer wie weit streuen die Mittelwerte der Gruppen dieser hat diesen Mittelwert gemessen dann dieser diesendient dieSeite noch einen ein ?? können auch den gesamten Mittelwert bildenund sich angucken wie weit das schwankt wie weit schwankenihre Messungen um den Gesamtmittelwertsowas können sich angucken und begann sich angucken ?? schwanken ihre Messungen um den Gruppenmittelwertdie Seherund die kriegen sie jetzt daraus eine Teststatistikeine Zahl die möglichst ohne Einheiten sagt einer so sagtob das zusammen passt oder nichtsie teilen die grünen Abweichungen durch die violetten Abweichungen diese Gesamtabweichungsozusagen durch die Abweichungenzur jeweiligen Gruppedann haben sie eine Zahl die groß wird wenn diese Gruppen nicht zusammenpassenwird nämlich dieser grüne Anteil immer größer ?? die auseinanderrutschenKommadannwird der grüne Anteil immer größerdas ist die Idee hinter Nova ist eigentlich ziemlich banalwas ich nehme sowas wie die mittlere Abweichungvom Mitteldas müßige stehen sowas wie die mittlere Abweichung vom Mittelnur als Ideekeine korrekte Form hingeschriebendie mittlere Abweichung vom Gesamtmittel versichert habe?? klar die Mitarbeiter von Gesamtmittelnins Quadrat sowas wieVarianz ich hoffe ihr abweichendes Quadrat vom Gesamtmittelteilsdurch die mittlere Abweichung vom Gruppenmitteldie quadratische Abweichungvom Gruppenwetter sowas müsste das sein ist es dann ??und dann muss man sich mehr oder minder kunstvoll überlegenNullhypotheseangenommendie hätten alle den gleichen Mittelwertwie schlimm können die Werte sein die herauskommen mit welcher Wahrscheinlichkeitwieder ?? für die Statistikerund es eingebaut in die üblichen Programmedas nennt sich Hannover in der Misses ?? jetzt die analysieren die Varianten der Abweichung Quadratmit Verwaltungsrathat offensichtlich was mit Varianz zu tun ?? die Varianz insgesamtverglichen mit der Varianzin der jeweiligenGruppe mit kunstvollen Faktoren einer drinkann ich mir auch nicht merken es euch so spannendaber das ist die wesentliche Ideedaran sehen sie nebenbei auch das ist immer einseitigwieder chi-Quadrat-Testwegen des Quadratdas kann nur nach oben begehenkann Komma gezeigt in heißensie an jetzt wie das weitergehen wird es banal wenn sie eine von diesen Funktionen verstanden haben?? Verstand ist spannender eigentlich in der Praxis ist was nehme ich denn jetzt nun für mein Experimentund darf ich das anwenden für mein Instrument habe ich genügendFälleoder es zu wenig ist es normal verteilt und es ist es nicht normal verteilt dass der spannende jetzt die sprechende Kürzel einzugeben müssen ?? so richtigdie große Kunst alsoweiß dann hier und hast jetztleider nicht unter Nummer sondern unter F Runwaydie Statistikwenn sich die F Statistikerfuhren welcheLeiste zu findenundda gebe ich jetzt die Gruppen an die Messergebnissein den Gruppen sank in der ersten Gruppe wie ein zwei drei vier zum Beispielsind ?? bisschen wenig?? ich so Philosophie zu tippenfür die zweite Gruppe habe ich leicht diesefür diese Messergebnisseund für die Gruppe Nummer drei reicht diese Messergebnisseund der B wird da rauskommt ist ein Indiz dafüroder dagegen soll etwas sagendass diese drei Gruppen denselben Mittelwert haben das ist Anrufersind das jeweils die Nullhypothese etwas verschieden sind die Randbedingungen sind etwas verschiedendamit kann man dann Telefonbuch fördern welches Verfahren nämlich für was im Endeffekt hat man sich in der Praxis diese vier Verfahrenging es raus okay für diese Messwertesein fünfzig Prozent Darlehen für die Nullhypothese nicht ab das sieht doch so ausals ob wir denselben Mittelwert haben könntensie müssen weiter treiben in der ersten Gruppe bei Steinhauersind es mich immer zwei Komma sieben Prozentdas sicherlich der ganz danach aus sind weitere ?? mit meinen eins in der ersten Gruppewenn ich bei ähnull Komma fünf Prozentbelassen definitiv ablehnendas passiert bei Anruferhat sie an mehreren Gruppen und Anrufer beantwortet Ihnenkann es sein dass diese Gruppen denselben Mittelwert haben oder gibt es starke Indizien dagegen?? das Problem erkannt haben sie alle drei Gruppenund wissen erstmalig Business jetzt natürlich mit bloßem Auge aber erst mal wüsste sie jetzt nicht welche Gruppe nicht passt warum ist denn der P wird so kleinerweitert jetzt schon Idee was können Sie tundrei Gruppen und sie wissen mindestens eine passt nicht reinwas können Sie jetzt tun um herauszufindenwelche Gruppen zueinander passen und welche nicht zusammenpassenaus eine Möglichkeit wäre ein nach dem andern herausnehmen das finde ich sehr charmantdarüber nachdenken was bedeutet das eigentlich ein nach dem anderen rausnehmen und gucken ob der P wird dadurchbedeutendgrößer wirddie übliche Möglichkeitist das Bonität verwendet sie gucken sich zwei von diesen Gruppen anund schmeißen die in den Täter sodass man sie durch eine Kombination durchist natürlich Miese nervig mit ?? automatisch einfach per automatischenFeld wo eines gegen das andere Details geprüft wird was nicht ganzungefährlichist das man auf zu malen?? sind endlich habenalso ?? stellt vielleicht festmit Anruferdie Mittelwerte passen nicht zusammen erfolgt fünf Gruppenund ich weiß eine von diesen fünf Gruppen mindestens eine von den fünf Gruppentanz aus der Reihedannwird man typischerweise anfangenTests zu machen sie vergleichen nicht damit aber das ist bisschen langweilig sie vergleichen damit Wege machen synthetischAmezedernDetails damit den Sehtest und damit äh Antitestmit A mit Berledigt B mit Base auch egal die vergleichen B mit Cdann geht es denn mit dem und so weiter sie an was passiert was machen hier jetzt vier plus drei plus zwei plus ein D desum festzustellenwelche Gruppe dennwelche Gruppen denn aus der Reihe tanzenvergleichen immer zwei Gruppen paarweise als erstes kommt ein Oberpräsidentendie zusammenfassendenicht manifeste ?? passen nicht zusammenmit Tetris raus findenwelche der nicht zusammenpassen?? sind sie jetzt aber schon warum das nicht ungefährlichisthier würden sie jetzt Kopfrechnengeben sie jetzt zehn T Tests machen warum ist es nicht ungefährlichdas Problem mit sich mehrfache Vergleichedie machen zehn Teetester ist die Wahrscheinlichkeitdoch ziemlich groß dass einer von denen das Waldergebnis hat ?? sechzehn davon machenProblemwenn sich hier mehrfache Vergleichemussdaskorrigierenkann sie auch wieder findige Leute Gedanken darüber gemacht wie man denn diesen Effekt korrigieren kannsie müssen einfach dafür sorgen dass diese Details ziehen bisschen?? sagen bisschen schwieriger werden das meinen Sie nicht mit fünf Prozent angeht sondern mit kleineren Prozentzahlen angeht und das zu korrigierendas üblicherweise machtja das war Statistik in einer Stunde die viel Statistikfunktionenwas jetzthier nicht vorgekommen ist und was auch dann ihr Spezialwissendes Wassers ihr das totale Spezialwissen ist wie kann man den Sitz ausrechnen welche Verteilung das hatdieses Wissen ist ja irgendwie in Preisen eingebautwelche Formel steckte dahinter ?? Wahrscheinlichkeitenausreichengenauer gesagt um diese klein B Werte auszurechnen?? das istdoch nichtso einfach und dass sie auch ?? verkümmern sich jeweils mit einem Dach beschäftigenwas sind jetzt jeweils die Verteilungder Arbeitdann benennen dem Anwender ist es ziemlich egal man weißwas es gibt in welchen Zusammenhängen es einzusetzenist was die Randbedingungen sindmehr als fünferwartet beim chi-Quadrat-Testundbei Hannover überall dieselbe Standardabweichungin jeder Gruppe und ein Weltmeisterverfahrenausunddas Rechnen macht die Softwaredas wesentliche Problem ist dass diese bewährte gar nicht das bedeuten was typischerweise glaubt aber das habe ich letztes Mal erzählt