Inside the mind of Watson - Chris Welty - IBM Research
Alussa CH esittelee tiimiä, joka työskenteli projektin Watsonin kanssa parissa. Watson on tietokone, joka vastasi kysymyksiin algoritmien avulla. Tärkeintä koneessa oli : vastaukset itsessään ja päättää todennäköisyys vastauksien oikeellisuuteen. Kone pystyi vastaamaan Natural Language Questions. (Mikä on Watson: http://www-05.ibm.com/innovation/fi/ideasfromibm/library/watson/)
Esimerkkinä: The Jeopardy! Challenge / vaikea ihmisille, vaikea ihmisille.Jeopardy on jenkkitietovisa, jossa pitää tietää kysymys vastauksen perusteella. Ihmiset, jotka pelaavat ovat hyviä, mutta tietokone ei pysty samaan, koska sen pitää verrata niin monta tietoa ennen kuin pystyy antamaan vastauksen. (tutustu peliin: http://www.jeopardy.com/) Yhteistä näillä on laaja ja avoin toimialue, vaikea kieli, korkea päättelykyky, oikea vastaus (väärästä vastauksesta kärsii pisteet), nopea tahti. Watsonin kanssa kilpeiltiin ihmisten kanssa, jotka ovat parhaiten pärjänneet jeopardyssa.
WATSONIN TEKNOLOGIA JA LOGIIKKA
Vuonna 2007 päästiin eteenpäin siinä, miten kone pystyi vastaamaan Jeopardy!-tyyppisiin kysymyksiin.
- Uuden ohjelma paradigmi kehitteillä - Tekee keskeneräisiä tuloksia ja vastauksia.
- Tieto ei ole määränpää - vaan vaihtoehdot. KOne ei voi kääntää koodia välttämättä luonnolliselle kielelle, systeemissä pitää muuttaa tiedon käytön tapa.
- Tietokoneen älykkyys ei ole ihmisen älykkyyttä - Ero tulee siinä, miten paljon virheitä tulee
Watson toimii, jniin, että Watsonilta kysytään kysymys, se alkaa käsitellä kysymystä ja saa paljon dokumentteja hakujen perusteella ja käsittelee ja löytää vaihtoehtoisia vastauksia, 99 % vastauksista näyttää typeriltä, joten se etsii kaikki mahdolliset ja ei-oikeat vastaukset. Se ottaa suuren määrän kandidaattivastauksia ja käy läpi niitä ennen vastauksen antamista.
Ensin on kysymys - >kysymysanalyysi: se käy läpi (keynotes) hakusanat, sanastollisuuden, päivämäärä, paikka ja relaatiot= voi tulla monta erilaista vaihtoehtoa (200-1000 XXX) Jokainen vastaus saa mahdollisuusnumeron, ja korkeimman saanut on koneen mielestä oikea vastaus. Monien eri hakusanojen kautta löytyy vastaus, koska se vertaa monet tekijät keskenään. Joskus voi löytyy samoja lauseita ja lausahduksia, jotka on annettu koneelle, ja kone löytää jotkut, jotka voivat olla lähellä, mutta kone ei koskaan voi kokonaan ymmärtää! Jokainen vastaus saa vektoripisteen jokaisesta ulottuvuusesta ja lopullinen vertailu antaa suurimman mahdollisuuden oikeaan vastaukseen. Esim. Watson sanoo, on 94 % varmuudella oikeassa, mutta se tarkoitaa sitä, että 6 kertaa kymmenestä se on väärässä.
Hypothesis scoring - kuinka hyvin vastaus sopii kysymykseen. Yli kuin 100 hypoteettista vastausmahdollisuutta - yksikään tulos ei ole vastaus itsessään, monet niistä tkeee samanlaista työtä, esim. 12 kirjoitusvaihtoehtoa, 8 riviä, 18 ei-oikeakirjoituksellista komponenttia jne..
WAtsonin avuksi annettiin vanhat Jeopardy-kysymykset, osa internetistä, eli lähteitä oli, tiedon työskentelyn pohjalla oli 80 gigaa muistia ja tietoa.
Language - > knowledge, siinä on iso gap välissä, eikä sitä voi kuroa yhteen. Semanttinen teknologia, ei ole se, mikä on vialla, vaan tuloksen olettaminen on väärin. Miten tietokone voisi puhua natural languagea, eli luonnollista kieltä, ei koodia. Hypoteesi on mahdoton.Lopulta Watson päihitti parhaan Jeopardyn pelaajaan lopulta. Vaikka Watson antaa välillä ihmisen mielestä tyhmiä vastauksia, mutta silti se voitti.
Kilpailutilanne Watsonin kanssa (linkki kuvan lähteeseen)
Watson (linkki kuvan lähteeseen)
www 2013 Esittely
Vuoden 2013 WWW -konferenssi on Brasiliassa, Rio de Janeirossa. 13.-17.5.2013
Käy tutustumassa: http://www2013.org/
Teemat: web ja ympäristö sekä avoin data ja avoin valtio/hallitus.
www2012 Google - Best Papers Awards
Best Paper of the www2012 technical program
Nyt jaetaan palkintoja parhaille tutkimuksille. Ne annetaan töistä, jotka ovat oman alansa parhaita.
- Yksi kategoria on paras opiskelijapalkinto (IBM Research) meni: Who killed my Battery: Analyzing Mobile Browser Energy Consumption. (Narenden Thiangarajan, Gaurav Aggarwalm Angela Nicoara, Dan Boneh ja Jatinder Singh.
- Best paper award-palkinto meni: SPARQL 1.1 Property Paths will prevents adoption of the standard.
- Metadata challenge-palkinto: kilailuun tuli 5 eri app-ehdokasta. 2/3 osaa palkinnosta tulee käyttäjien palautteesta ja 1/3 virallisilta tuomareilta. Appeja kokeiltiin konferenssissa ja muualla maailmassa. Palkinnon saa applikaatio Konf Opper.