[Playlisten] [Impressum und Datenschutzerklärung]

07E.2 Idee hinter Google PageRank, Übergangsmatrix, Eigenwert 1


CC-BY-NC-SA 3.0

Tempo:

Anklickbares Transkript:

wirsehen uns etwas anders erst überhaupt nicht nach Matrizen aussieht?? eigen werden Eigenvektoren aussieht nämlich Links auf Webseitenimmer vier zum Beispiel zu habenvier Webseitenhabe CDKommaund die sollen verlinkt sein ?? die WebseiteA soll einen Link zu B habenalso dass sie auf der Webseite A klicken könnenum zu Webseite B zu kommen ?? die Webseite B soll einen Link haben zur Webseite A kommt sie wieder zurückund zur Webseite Cund dieWebseite D soll auch ein Link haben zur Webseite Astellen sich das vorrangig mit vier Webseiten sondern mit Milliarden Webseiten dann haben sie nur ?? bessere Idee auch ?? mit vieren hinkriegener dann ?? wir was weicht auch mit Milliarden hinkriegendie Frage ist zum Beispiel die Frage die sich die beiden Gründer von Google gestellt haben wie kann ich jetzt solche Webseitenbewerten welche sind wichtigwelche sind weniger wichtigoffensichtlich sind welche wichtigdie von vielenals Links angegeben werdendiese Webseite Ade scheint hier wichtiger zu sein als anderedie Stadt unwichtig zu seinD hat keiner verlinkt aber Arzt von zweien verlinkt das schon wichtig zu sein es könnte natürlich nicht nur einfach zählenwie viele Dingsda eingehenauf der Webseitees könnte nämlich sein dass die Situation so aussiehtjemand baut ein Mini Universumvon lauter Webseitendie auf eine Webseite verweisenaber das große Internet das Leben eben an und hat überhaupt nichts damit zu tundann ist diese Webseite nicht wichtig Komma nämlich keiner hin muss das im großen Ganzen betrachten man kann nicht einfach nur gucken mir kommen jetzt zwei Links rein das hilft uns nicht an will wissen wie jetzt der Fluss sozusagenhier passiert wenn Leute da Durchklicken durch diese Webseitenwie häufig sind sie vordass es die ersten Ideen sohinter Google gewesender sogenannte Page Frankgewann Herrn die beiden Gründer Page und beimArbeitgeber geschrieben ganz zu Beginn muss es beschrieben haben den sogenannten Patch Schrenk Wortwitz wegen des Gründers Pagedie Grundidee dahinter was sie vorführen ist nicht genau der Patch bringt aber die Grundidee dahinter sich vorzustellen und jetzt habe ich hier einen Servereines Server sind die einfach auf Links klicktder Seite A darunter muss immer zur Seite B kommenauf der Seite B kann ich mich entscheiden fifty-fifty klicke ich zurückzu A Komma oder glücklich so das ich zu C Komma was fehlt mir noch glaube ich sie sollte ?? zwar verlinken Beistrich müsse langweilig und gemein mehrauf der Webseite die Energie zu einigen komme ich ?? zwarund so weiter und so weiter das stelle ich mir vor was ist wenn ich so einen Server modellierender immer nur auf Links klickt die ganze Zeit auf Linksklickwenn so ein Link gibt okaydann auf den einen Link klicken?? wenn es zwei Links gibt hier wie bei B ein wenig zufällig einen von den beiden Xdas heißt man könnte sagen wenn ich auf AHA bindann gehe ich mit einer Wahrscheinlichkeitvon eins nach Bwenn ich auf der Seite B bin ich mit Wahrscheinlichkeitein halbzur ?? hin und genoss Heiligkeit von ein halb zu ziehenwenn ich ins See binich muss doch noch mehr als eine Messe so langweilig wird oder wenn ich in C binich mit der Äußerlichkeit von ein halb zu BO und ein halb zu Awenn ich in DB hingegen Äußerlichkeit von eins zu habendas wäre ein Modelldas manjeden Link mit der gleichen Wahrscheinlichkeit anklicktund dann überlegt man sich wo sind jetzt die Leutetypischerweisezulassen jemanden das Millionen Mal machen und gucken irgendwann mal wieder hin mit welcher Wahrscheinlichkeitist die Person auf A auf B auf C auf Dund das wird dann im Endeffektmit bisschenFinessen noch wird der Page Frank wenn jemand zufällig klickt und lügt und lügt und klickt und sie gucken dann nach drei Tagen draufwo sind wir dann typischerweisemit welcher Wahrscheinlichkeit sind wir auf A auf B auf C dürftedas Wetter beschränkt werdendass es lustigerweise auch wieder was mit Matrizen zu tunman kann das ganze als Matrix hinschreibenkommen von einer bestimmten Seitehabe ICDvonICDund sie gehen zu einer bestimmten SeiteAB CD diese Wahrscheinlichkeitenkann ?? letzte Sondermatrixreinschreiben?? ich komme von Adanngehe ich auf jeden Fallnach BKomma von Ahier nicht nach Aich gehe nach B ich gehe nicht achtzig gehen ich dachteso könnte das aussehen man das als Matrix dann aufschreibtwenn ich vonBKomma was schreiben Sie die nächste Spalte reinhierbrauchen wir also ein halb von BWahrscheinlichkeitein halb nach A zurückkommen Äußerlichkeitseinheitnach C hier ein halbansonsten nichtsvon C?? Äußerlichkeit ein halb zu A nur scheinbar ?? zu Bein halbeinhalbsonst nichts und von Thesen sehen Sie jedes mit Äußerlichkeit von eins zu A und ansonstennirgends wohin das Ganze als Matrix geschriebenes ist bis dahin erst mal nur nach Art ?? Tabelle aufzubauendas scheint erst mal nichts mit Matrizenrechnungzu tun zu haben der Witz ist es diese Matrix tatsächlichals Matrixkeinen Sinn ergibtsollte als Fußnote anmerken normalerweisewird man die transponiert Schreibenals Übergangsmatrixverteilt wahrscheinlich ?? gesehen Übergangsmatrixich das wirklich mal sodas er mit dem Formalismus weiter arbeiten können den ?? hattendiese Matrix die nenn ich maldefiniertals ähm die nenn ich mal ähmsie überlegen sich was ist das Quadrat von ähmwas ist die dritte Potenz von Mund was bedeutet das wenn ich diese Matrixquartiereund was bedeutet das jetzt für diese Anwendung wenn ich diese Matrix in die dritte Potenz setzemalauf die Schnelle gleich ?? Computerauf die Schnelle immer geradelinks oben die ersteSpalte mal die erste Zeile sollte seine erste Zeile war die erste Spalte zu Stammzellendie Schranke Matrix im Zusammenleben nanntelinks obenwird werden die erste Zeilewar die erste Spaltenull ein halbeinhalb eins mal null eins null nulldas einzige was bleibt ist es ein halb mal einsalso ein halbder da drunterich will die zweite Zeile mal die erste Spalte haben für den darunter?? null mal eins Minutenüberlebt nichts interessanterweisedas bleibt also nullKomma zum Beispielden rechts danebenerste Zeile zweite Spalteerst seine zweite Spaltenull mal ein halbeinhalbmal null ein halb mal ein halb Komma null einhalb mal ein halb oder einmal oder in Mathe war mit ein halbhalb bleibt hier steht also ein viertelsoes kommen werde minder ungemütlich Matrizen raus man das so weiter machtwas heißt denn das jetztdie zweite Potenz von dieser Matrixwieder schon ein Gefühl fürwas heißt denn jetzt die zweite Potenz dieser Matrix was heißt die dritte Potenz der Matrixbestimme ich damit eigentlichalsoim Quadrat sagt Ihnen was nach zwei Klicks passiertwenn sie von A kommenwenn sie von A kommensind sie nach zwei Klicks mehr Wahrscheinlichkeit von ein halb wieder bei A gelandetsie kommen von Adann können Sie zu B gehenoder müssen sogar zu begehen und dann haben sie die Wahlgeht zurück zu A oder gehen Sie zu C nach zwei Klicks sind Sie mit Wahrscheinlichkeit von ein halb wieder bei AA angekommenwenn sie von Arstaatenund so weiter und so weiterdas sagt Ihnen das Quadrat der Matrix das könnte man jetzt Nummer ausbuchstabierenwie das zustande kommt für dieses Produktder beiden Matrizendurch das jetzt vorliegende man sich auf weiteres Komma sie verständigen sie als Baum auf mal von A Gensina und so weiter und so weiter das ist genauso mit dem Produkt der Matrizen ausrechnenwir summieren entlang der verschiedenen Fahrdiebe haben durch sein Baum und die dritte Potenz wird dann sein was nach drei Klicks wenn ich von A startebin ich nach drei Klicksmit Äußerlichkeit von drei Vierteln bei B bin ich immer einen zufälligen Blick und so weiter soweit sie sie sind nienach drei Klicks in dieweil sie werden mit jedem Klick sofortweg sein von den so kann man das betreiben und jetzt angemerkt diese Potenzen ausrechnen istlustigglücklicherweisegibt es ja passende Software sie sowas kann auch der ?? istin weiten Zügen wie matlapaberOpen SourceKomma damitdieseMatrixpotenzenausrechnen also an meine Matrix ähm soll seineckige Klammer aufnulleinhalbhalb eins für die erste Zeile Returneins nulleinhalbnull für die zweite Zeilenull einhalbnull null?? für die dritte Zeile null nullnulleckige Klammer zufür die vierte ZeileextravagantSemikolon dahinter dass ich es Sommer die Matrix hier nicht der ?? eingegeben habewollen ?? eins nullgut sieht gut ausdie zweite Potenzmatrixhoch zweiim ?? genanntdas ist die zweite Potenzhaben wirso rausbekommendie dritte PotenzPunkt natürlich groß Mwird auch so was willmanjawas ich jetzt natürlich hier machen kann ist zu sagen wir nehmen mal dieCD Potenzdas Wort jetzt nicht zu Fuß rechnenzehnte Potenz der Matrix was es nach zehn Mausklicks ?? ich klicke zufälligimmer wieder die Links an wenn ich mir auf einer Seite habeich mir gleich verteilt einen Gas aus was es nach zehn Klicksund an denen sie das scheint sich allmählich einzupendelndass es noch hundert Klickshat sich das schon sehr verdächtig eingependelt nach hundert Klicks liegen sie alsomit egal wo sie gestartet sind wenn sie mit A gestartet sind mit der Seite A gestartet sind oder mit B oder mit CD gestartet sind nach hundert sechs liegen sie mitdrei dreißig Prozent Wahrscheinlichkeitauf A mit vierundsiebzig Prozent Wahrscheinlichkeitauf B mit zwanzig Prozent Persönlichkeit auf C und mit null Prozent wahrscheinlich auf die das wäre dannim großen Ganzen nicht genau aber im Großen und Ganzen vom Prinzip her der Page Frank das man sagt die Seite B kriecht ein Pagering von null Komma vier vier die Seite Arglisteinbettungvon null Komma drei drei wo landet man typischerweisewas ist die richtige Seitewichtigste Seite scheint mir zu sein die unwichtigsteIdee zu seinPunkt die hat jetzt gewiss gezeichnet habe sind siezwei eingehende Links A hat aber sogardrei eingehende Links ist das ich interessant trotzdem gewinnt die ?? wird typischerweise auf der Seite B seinals dieses ganze Netzdurchsagenso verstörtdas die am häufigsten besucht wird B hätte den höchsten Page Frankobwohl es weniger eingehende Links hat als Anichtsdestotrotzwenn sie das B hiergewinntGarbo sie startensie werden nachhundert Xmit vierzig Prozent Wahrscheinlichkeit auf B gelandet seinKomma ?? mal ein paar andere Eigenschaften von dieser Matrixuns angucke?? das ist das transponiertder Übergangsmatrixnormalerweise wird man Übergangsmatrizentransponiertstürzen seinen Spalten vertauschen ?? ich finde sie jetzt für uns einfacherdas wäre mit Website stellt sich irgendwelche Zustände vor in einem Spiel die Figur läuft die Figur springt die Figur schläft was auch immer und hundert Übergangswahrscheinlichkeitenzwischen den Zuständen des typischerweise meinen Haaren herbeigezogenmag auf Ketten wenn sich das dann professionell die kommen zwar professionell wirklich vor aber die Beispiele die man üblicherweise angeht sind haarsträubendbis auf die Geschichte mit dem Webseiten weil das ist tatsächlich die Grundideehinter dem Ring in Googledas man sich hier Übergangswahrscheinlichkeitenein Punkt zwischen Webseitendann überlegt was wird sich der nach langer Zeit einstellendieser Matrix hier war dasin Ordnungsind alle Spaltensindzu den gleichen Vektoren gewordenPunkt ein Beispiel an wo das nicht stattfindetaber?? Komma zurückEigenwerte Eigenvektorenwas fehlt Ihnen jetzt auf vonwegen Eigenwertenund Eigenvektorenkommt die jetzt ins Spielhabenalso ein Eigenvektorzum Eigenwert eins gefunden wenn sie Staaten mit dieser Wahrscheinlichkeitsverteilungsind dreiunddreißig Prozent auf der Seite A mit vierundvierzig Prozent auf der Seite B zwanzig Prozent auf der Seite Cgar nicht auf der Seite die die Staaten mit dieser Verteilungder machen sie einen Schrittdiese genau diese Verteilung wieder raus war mein Eigenvektor gefunden zum Eigenwert einsinteressanterweisediese Verteilung die man versucht eigentlich mehr der Manager Page Frank ist ein Eigenvektorzum Eigenwert einsstellt das wahrscheinlicher mit einer einzigen Person vor sie stellen sich persönlich vor sie haben dreiunddreißigtausend drei hundert dreiunddreißig Leute auf der Seite A sie haben vierundvierzig tausend vier hundert vierundvierzig Leute auf der Seite B zwanzig tausend ?? auf der Seite zielt niemanden auf der Seite diejeder klickt einmal zufällignahm sie wieder drei dreißig tausend hundert dreiunddreißig auf der Seite A und so weiter und so weitermit einer Person dann mehr vorstellen sondern wirklich mit Millionen Milliarden Menschen vorstellte dann jeweilsklickenund diese Verteilung die bleibt dann so wie sie ist ein Eigenvektor zum Eigenwert einsistnicht immer so man kannandere Beispiele kosten im Vergleich noch wo das nicht so hundertprozentig ?? hinkommt aber das ist die Idee dahinter dass das stationär bleibtdas Matrizen von dieser Art immereinen eigenenWert eins haben müssen ist Klammer zu Nummer überlegenals Wiederholung für diese Formel mit DeterminanteMatrixministernder Einheitsmatrixschafft das mal so diese Matrix hat einen Eigenwert einzelne analog aller Sprechen konstruierten Matrizenkam immer ein Eigenwert einsdas überlegen uns gerade mal dennmich interessiert folgendesLambdaist ein Eigenwertdieser Matrix ähmgenau dann wenn jetzt kommt diese übliche Formeldie Matrix ähm Minuslandermal die Einheitsmatrixwenn das Einlösungsproblemhates muss ein Vektor geben der von dieser Matrix im Mittelstand eines Matrix zu null gemacht wird also wenn die Determinantedavon doch nur ist esschon oft genug gesagt aber ich sag's noch mal das keine gute Idee das jetzt für Matrizenmit Milliarden mal Milliarden Einträgen zu machendie Determinante wird nicht Funktion jetzt aberals Gedankenexperimentin der Mathematik Komma das so hinschreiben ?? wenn es niemals ausreichend für große Matrizenaber es müsste gehen wenn es wirklich ausrechnen würden korrekt müsste so gehenanders ein Wert dieser Matrix genau dann wenn diese Determinante gleich null ist jetzt kann ich diese Determinanteja mal hinschreibenwar ?? Matrix gerade verschwunden zu viele ??beschreibt das ?? dahinter was ist diese Determinantesie zu Trierlanderauf der Diagonalenhier Minuslanderhalbhalb einseinsminuslandereinhalbnullnull einhalbMinislandernull und die unten haben wir dann noch ?? null null null minus Lambdadas ist jetzt dieses Ausrüster wird mit unserer Determinanteauf der DiagonalenLander abgezogen??ich möchte zeigen dass dieses hierfür Lambda gleich eins gleich null wirdwie können Sie das hier umformenspaltentechnischseien technisch diese Determinantehier umformensodass ich tatsächlich irgendwie siehe eins Minuslanderist übrigwenn sie da waswie üblich umformen Spaltenzeilenirgendwie raffiniert addieren was weiß ich was für dich wie Tununter eins minus dann daraus zu disziplinierendas muss er nach einer vor Kommahier muss irgendwie ein Faktor stehen verwegeneinzelnes Landerdamit wenn ich Lander gleich Einsätzenull rauskommtKommawahrscheinlich auf Anhieb nicht drauf ich sage mal an was mir vorschwebt und sie überlegen sich warum das dennfunktioniertsie nehmen mal die zweite Zeile auf die erste drauf addiert die dritte auf die erste drauf addiert und die vierte Zeile auf die erste drauf addiertan Determinante so umformen wie sie das kennen ?? ich kann eine Zeile auf eine andere Zeile addieren und die dritte Platte bleibt gleich der werte Determinante bleibt leicht das man Zimmer mit der zweiten dritten vierten Zeile alle von den Zeilenauf die erste Zeile draufaddierenwas passiert da und warum passiert das da was sie dann sehen beschreibt die Zeile zwei drei vier schon wieder hinüberlegen sich die erste Zeilewarum steht in der ersten Zeile was denn der stehtalsoüberall eins minus Lambda interessanterweisein allen Spalten kriegen sind ersten Zeile einzelnes Landerhierdie einzige ?? nach oben es noch neun einzelnes Landerein halb das Minus Landerkom nach oben des ein halb kommt nach oben einzelnes Lander und so weiter und so weiterdie kriegen in jeder Spalteoben eins Minuslanderdas ganze natürlich mit allen ÜbergangsmatrizenPunkt sie haben in jeder Spaltedas Minus Lander stehenauf der Diagonalenokay soweitund ansonsten haben Sie in jeder Spalte die Summe einsDinge Wahrscheinlichkeitnicht Kommaaus dem Zustand Bda müssen sich die Wahrscheinlichkeiteninsgesamtmit den ich zu Abi CD gehe zu eins addieren sie alles nach oben bringen musste einzelnes Lander stehen und so weiter und so weiter also egal welche Übergangsmatrix sich nehmen oder transponiertÜbergangsmatrix sich nehmen die Ohrmuscheln als Minister lassen weiter als Gesandterstehenund das kann ich jetzt vereinfachen wie können Sie diese DeterminantevereinfachenundOrgane auswenn sie so eine Matrix hätten also eine Determinante hätten dran zwanzig ?? zwanzig ?? zwanzig ?? zwanzigGESTOHLENE irgend ein Unsinnwie können Sie die umformendamit die einfacher wirdsoüberall eins sind die rein zwanzig aus sind sie ziehen aus der ersten Zeile den Faktor dreiundzwanzig rausdir lauter Einsen stehendenn dieses währende Spaltesie habendas Volumenmit einem SpaltenvektorDreifaltigkeit soll das seit neunzehn zwanzigund den verkürzen sie dann auf ein drei Zwanzigstel besser nur noch eins eins eins eins einsdas Volumen von drei zwanzig Wacht und der Vektor ist dann nur noch als als ein Satz eins die ziehen aus der ersten Zeile jetzt gespaltene aus ersten Zeile in Faktor drei zwanzig außenstehender lauter Einsendas ?? hierhier steht also der Faktor eins minus Lambda rausgezogenmalirgendwaswird fürchterlich werden ein Polynom dritten GradesBettes werdenwas auch immer da jetzt steht auf jeden Fall ein Polynom dritten Grades ist den Ort außer ich schon ?? weit dann doch das nur so hinschreibenman sich mal hier stehen jetzt lauter Einsen eins eins eins eins und so weiter und so weiter und so weiterdas Ergebnis der Polynom den Rat eines Windowslander habe ich jetzt abgespaltenGradeswelches auch immer offensichtlich irgendwas mit Lander hoch drei drin man das weiter betrachtetund jetzt sehe ich wenn ich Lander gleich Einsätzenull auseins ist ein Eigenwertalso was zu beweisen war hier sehen Sie jetzt wenn Lander ein Eigenwert ist genau dann wenn man dann Eigenwert ist meiner Matrixmuss das null werdenokay das wird null ?? Lander gleich einsetzeneinfach nur weil die Summe jeder Spaltegleich eins istPunkt was dann darauswas man sieht es muss so einenbesonders den stationären Zustand gebender sich nicht verändert ?? einen Vektor mit Eigenwert einsabschließend noch einmal kurz gezeigt dass es nicht ganz immer so einfach ist die Potenz der Matrix bilden und so weiterdas kommt nicht immerhin einer großen bisschen mehr Gehirnsschmalz reinsteckenPunkt muss malandere Situation anHermes Seite A sie haben Seite Bund die verlinken sich gegenseitigwie sie die Matrix aus wie sie die zweite Potenz von der Matrix ausist sie die dritte Potenz von der Matrix aussehen das mit dem Potenzen ist jetzt leidernoch nicht hundert Prozent das was man machen kannsoich komme aus ABeistrich nicht nach A ich gehe nach B ich komme aus B dann gehe ich nach A und nicht nach B so sind diese Matrix aus eine Spiegelung wenn sie sich erinnernkönnte man auch noch geometrisch auffassen das Quadrat davon ich komme aus A G nach beta muss ich wieder nach Artikel das Quadrat aus Rechner bis offensichtlichwieder die Einheitsmatrixdas Quadrat die dritte Potenz Einheitsmatrixmaldie öffentliche Matrix ist wieder die ursprüngliche MatrixSie klicken dreimalvon A müssen sie nach B von B müssen sie nach Aund von A müssen sie wieder nach B das wieder unser vertauschen und so weiterdie hundertste Potenz wird wieder so aussehen ?? hundert und erste Potenz wird wieder so aussieht das oszilliertwie haben Sie das Phänomendas die hundertste Potenz sich schon irgendwohin konvertiert istes oszilliertauf Dauer das hier machen also muss etwas vorsichtig sein man kenne sich etwas an den hundertste Protestsie können aberschon jetzt nicht aus offensichtlich sie können aber Eigenwert der Eigenvektorenausrechnenwas wenn sie rauskriegen?? Bindestrich rauskriegen dass der Patchring für diese beiden Seiten gleich sein muss sie dann raus kriegen ein halbeinhalbpassen auch sonst wenn sie so stark mit ein halbeinhalbund jeder klicktdannbleibt es auch bei einhalbeinhalb?? das ist ein Phänomen was auftreten kann und an das Phänomen widmet ?? noch erwähnen was auftreten kann ist dass sie mit dem einzelnen Teilnetzwerkehaben die komplett voneinander getrennt sindSolesituationhabendann wird natürlich auch was schief gehendann haben sie nicht nur einen einzigenEigenvektor nicht nur eine einzige Richtung soll ich sagen hat sie nicht nur eine einzigeEinrichtungnicht nur eine einzige Verteilung die gleichbleibt sondernhier in diesem Fall bei so einembei so einem Webkönnen Sie sagen ich nehmefünfzig Prozent meiner Bevölkerung hier rein fünfundsiebzig Prozent meine Bevölkerung darein oderein Drittel darein zwei Drittel darangibt er sich auf weitere Freiheitsgradewenn ihr Netz nicht verbunden istwas ist es nicht ganz so leicht dieser scheint aber die Grundideeist tatsächlich?? lässt jemand zufällig klicken Punktwo ist er oder sie denn dann typischerweisebenutzt das als Maßfür die Wichtigkeiteiner Website