Erlebnisbericht von der 25th World Wide Web 2016 Konferenz in Montreal

image00Das ganze Abenteuer fing Anfang Februar an, als wir erfuhren, dass unser Paper Context-based A/B Test Validation auf dem Web Developer Day der 25th World Wide Web Conference in Kanada/Montreal angenommen wurde. Unsere Kontext-basierte A/B Testvalidierung ist Teil unseres neuen Big Data Analytics DashboardsHiermit kann jedermann A/B Tests hinsichtlich des durchgeführten Test-Kontexts analysieren und somit mit geringerem Stichprobenumfang bessere Ergebnisse erzielen. Unser Tool setzt auf PlanOut von Facebook auf.  
Die Konferenz fand vom 11. bis zum 15. April, 2016 im Palais des congrés de Montréal statt.

Das Team freute sich über die Annahme und Sevenval beschloss drei Leute zur Konferenz zu schicken: Roland Gülle (CTO), Michael Nolting (Head of Frontend Analytics) und Eike Seggern (Data Scientist). Damit konnten wir die Forschungsergebnisse hinsichtlich ihres Reifegrades für unsere Produktweiterentwicklung sichten und bewerten.

image03

von links: Michael Nolting, Roland Gülle und Eike Seggern, copyright Shawn M. Jones (genommen von http://ws-dl.blogspot.de/2016/04/2016-04-24-www-2016-trip-report.html).

WWW Developer Day 2016

image02

Nachdem wir alle am Sonntag anreisten und ein gesundes Frühstück eingenommen hatten, ging für uns die Konferenz am Montag mit dem WWW Developer Day los. Hier präsentierte Eike unser Framework und rockte die Bühne. Er erreichte einen hervorragenden zweiten Platz. Der erste Platz ging an Clayton Allen Davis mit BotOrNot.

image07

Zusätzlich hörten wir Vorträge über ein Softwarepaket, welches in der Lage ist zu erkennen, ob ein Twitter-Nutzer ein Bot ist oder nicht bzw. wie ein Bezahlsystem des Internets in der Zukunft aussehen könnte. Wir schlossen den Developer Day mit dem Gewinn einer Apple Watch vom Land Katar ab, da Michael Nolting aus dem Publikum zum besten Teilnehmer gekürt wurde.

Gewinner WWW2016 DevDays

Ganz links Michael Nolting von Sevenval.

Somit ging der erste Tag für uns erfolgreich zu Ende und wir feierten unseren Erfolg mit anderen Teilnehmer mit einem für Montreal klassischen Gericht: Poutine.

image01

Big2016

Am Dienstag besuchten wir den Track Big2016. Folgende Vorträge hatten uns am Meisten beeindruckt:

  1. Big Data and Deep Learning for AI – Yoshua Bengio (University of Montreal)
  2. Lessons learned form building user-centric big data systems – Xavier Amatriain (Quora)
  3. Challenges and Experiences to Derive Big Value from Big Data with an Industrial Big Data System (China Mobile)

image08

Der erste Vortrag von Yoshua Bengio handelte von den Fortschritten im Bereich des Deep Learnings. Das Entwickeln von hierarchischen Architekturen innerhalb der letzten Jahre hat zu Durchbrüchen im Bereich der Bildverarbeitung geführt. So ist es jetzt dort z.B. möglich Genauigkeiten in der Bilderkennung zu erreichen, die die eines Menschen  übertrifft. Man spricht auch von „superhuman“ accuracy. Dadurch werden neue Technologien wie z.B. das autonome Fahren möglich sowie auch die maschinelle Interpretation von Bildern und die Vertextung dieser. Facebook möchte das z.B. einsetzen, um Blinden Bilder vorzulesen.

Xavier Amatriain von Quora (der vorher viele Jahre bei Netflix gearbeitet hatte) betonte in seinem Vortrag, wie wichtig es sei, bei maschinellen Lernverfahren sich auf die richtigen Dimensionen für sein Problem zu konzentrieren. Hierbei – meinte er – benötige man nicht immer sofort Big Data. Im ersten Schritt muss mittels Feature Engineering die richtig wertvollen Features herausgearbeitet werden, damit man weiß, welche Daten man wirklich in guter Qualität benötige.

Diese Idee wurde auch im letzten Vortrag von China Telekom aufgenommen. Hier wurde zusätzlich detailliert dargestellt, welches System dafür aufgebaut wurde, um diese Daten zusammenzuführen und auszuwerten. Hierbei wurde auch eine prägnante textliche Definition von Big Data über die drei Standard-Vs (Volume, Velocity, Variety) hinaus gegeben: Big Data is data sets beyond the ability of commonly used software tools to capture, curate, manage, process within a tolerable time and tolerable cost.

Keynotes

Sir Tim Berners Lee

Sir Tim Berners-Lee sprach darüber, wie wichtig es sei, das Internet zu dezentralisieren, z.B. im Bereich der Datenverwaltung und des Datenmanagements. Nutzer müssten die Möglichkeit haben, ihre Daten selber zu speichern und zu verwalten (z.B. im Bereich des Smart Housing). Zusätzlich müsse weiter im Gebiet der „Web Security“ geforscht werden, um private Daten zu schützen. Um die Nutzbarkeit des Internet zu verbessern, müssen Zahlungen einfacher und sicherer werden sowie die Anbindung von Endgeräten (Internet of Things – IoT).

image05

Dabei sprach er ebenfalls über das Projekt Solid, welches er mit dem Land Katar aktuell treibt. Hierbei ist das Ziel, das Nutzer die Hoheit über die Daten behalten. Nutzer sollen selber darüber entscheiden können, wem sie Zugriffsrechte auf ihre Daten geben und wo diese gespeichert sind. Dies wird ermöglich, indem die Daten bzw. der Inhalt von der Applikation entkoppelt wird.

Ebenso ging er darauf ein, dass komplizierte Cloud Lösungen immer einfacher hochgezogen bzw. deployed werden können. Die damit ansteigende Systemkomplexität kann nur beherrscht werden, wenn die Security-Mechanismen sich genauso verbessern. Daher möchte er im Security-Umfeld verstärkt Standards einführen und schaffen. Seine Vision ist z.B., dass der Browser bei den neuen Securityverfahren stärker in den Vordergrund rückt und hiermit eine Dezentralisierung stattfindet. So möchte er alte zentrale Authentifizierungsverfahren immer mehr abschaffen. Damit könne auch der stetig ständigen Anzahl von Viren wie Trojanern entgegengewirkt werden. Zusätzlich zeigte er auf, dass der vermehrte Wechsel von HTTP zu HTTPS einen steinigen Weg darstellte. Aktuell gäbe es sehr viele Webseiten, die einen Misch aus HTTP- und HTTPS-Elementen auf ihren Seiten einsetzen. Diesen Hinweis fanden wir super spannend, da Sevenval genau hierfür ein Produkt anbietet, um Webseiten ohne großen Aufwand von HTTP auf HTTPS upzugraden.

Zum Schluss ging er auf Bezahlmethoden im Internet ein, die ebenfalls einer weiteren Standardisierung bedürfen – ähnlich zu Authentifizerung. Es gibt wohl eine schiere Anzahl unterschiedlichster Lösungen (wie z.B. Paypal etc.) aber kein Standard-Interface für alle. Zusätzlich müsse es möglich sein, kleine Geldmengen zahlen zu können. Dieser Markt werde von vielen Zahlungsanbietern nicht abgedeckt.

Lady Martha Lane-Fox

Am selben Tag gab es noch eine Abend-Keynote, die von Lady Martha Lane-Fox gehalten wurde. Sie verkündete zu Beginn, dass sie zu Twitter in den Vorstand wechseln werde.

Im Rahmen ihres Vortrags stellte sie allerdings Arbeitsergebnisse von einer Vielzahl von Projekten vor, in den sie in Großbritannien involviert war. Sie postulierte, dass ein Land, welches:

  1. Eine Frauenquote im Technologiebereich hat
  2. Seine Bevölkerung ganzheitlich bzgl. Technologie fördert
  3. Und verstärkt Technologie im öffentlichen Sektor einsetzt

die besten Wettbewerbsvorteile in der Zukunft haben werden.

Den ersten Punkt belegte sie damit, dass es Studien gibt, die zeigen, dass Unternehmen am Erfolgreichsten sind, wenn auch Frauen in den Führungsebenen vertreten sind. Bzgl. des zweiten Punktes hob sie hervor, dass die Technologieförderung schon in den Schulen anfangen müsse. Jeder müsse in der Lage sein, Quellcode schreiben bzw. verstehen zu können. In Bezug auf den dritten Punkt muss die Digitalisierung des öffentlichen Sektors stärker vorangetrieben werden, um vermehrt Prozesse zu automatisieren. Damit könne frei werdende „Human Resources“ für Bereiche eingesetzt werden, in denen diese stärker gebraucht werden wie z.B. in der Altenbetreuung.

Die obigen Punkte hat sie in der DotEveryone Initiative in Großbritannien verankert. Daher möchten auch wir hier an dieser Stelle aufrufen: Liebe Frauen da draußen! Wir brauchen Euch bei Sevenval. Bewerbt Euch bei uns!

Mary Ellen Zurko

Am Mittwochmorgen gab Mary Ellen Zurko von Cisco ihre Keynote. Hier betonte sie noch einmal, wie wichtig Web-Security sei. Sie startete ihren Vortrag damit, dass sie sagte: „The future will be different; so will the attacks and attackers, but only if you are wildly successful.“ Der Erfolg des Internets hat es zu einem spannenden Angriffsziel gemacht. Danach gab sei einen kurzen Abriss über die Entwicklung von Securityverfahren wie z.B. Basic Authentication, S-HTTP und letztendlich SSL/TLS bei HTTPS.

Danach legte sie verstärkt dar, dass das sogenannte „Social Hacking“ immer häufiger auftrete. So werden die Ängste von Endkunden bewusst ausgenutzt, um diese zu schädigen. Es gibt z.B. Unternehmen, die bewerben, dass der eigene Computer unsicher sei und 150$ dafür nehmen, um sich remote auf dem Rechner einzuloggen und auf die Kommandozeile schreiben „Ihr Rechner sei jetzt sicher“. Eine unglaubliche Verarschung!

Peter Norvig

Am Freitagmorgen gab Peter Norvig, Leiter der Forschungsabteilung von Google, seine Keynote zum Thema „Semantic Web“. Die größten Herausforderungen sind hierbei die Bereiche der Informationsextraktion und der verteilten Systeme zusammen zu bringen.

image06

Die korrekte Informationsextraktion (z.B. von unstrukturierten Webseiten) stellt die größte Herausforderung dar. Der kanadische Blogger Cory Doctorow schrieb in seinem Blog einmal, dass die automatische Informationsextraktion von Webseiten so schwierig sei, da Menschen dazu neigen zu lügen sowie faul und dumm sind. Die Informationsextraktion würde also lediglich eine falsche, unkorrekte Wissensbasis erzeugen. Peter Norvig fuhr dann damit fort, dass daher einige Formate definiert wurden wie z.B. DAML, OWL, RDFa und FOAF, um die Informationsextraktion zu unterstützen. Diese Formate wurden allerdings häufig falsch angewendet, da sie sehr aufwendig oder kompliziert waren, was die Thesen von Cory Doctorow belegten.

Um dieses Problem zu lösen wurde das einfache Schema.org Format definiert und von Suchmaschinen bei Website-Betreibern beworben. Website-Betreiber wurden darüber hinaus dadurch belohnt, dass durch Schema.org angebotene Informationen schneller in den Suchergebnissen dargestellt wurden.

Peter Norvig beendete seine Rede damit, dass mehr solcher einfachen Verfahren entwickelt werden müssen und noch viele Herausforderungen ungelöst sind. Seiner Meinung nach müssten mehr Informationsquellen kombiniert werden, um z.B. potentiell nicht korrekte Daten auf Webseiten mit anderen Datenquellen validieren zu können. Zusätzlich müsste man in der Lage sein, auf Amazon z.B. nicht nur ein Buch von einem Autor zu finden sondern auch seine Facebook-Interessen angezeigt zu bekommen. Um dieses große Problem der Zusammenführung von Daten-Silos zu lösen sowie sinnvolle Auswertung darauf zu machen, denkt er, dass Neuronale Netze und Deep Learning spannende Ansätze sein können.

Fazit

Unser Fazit von der WWW Konferenz ist sehr positiv. Wir haben viele spannende Leute kennengelernt und viele neue Impulse aufgenommen. Diese werden wir für unsere Technologien und Beratung unserer Kunden nutzen. Die Konferenz war darüber hinaus sehr gut organisiert und alle Redner waren für Rückfragen jederzeit zugänglich – sogar so Größen wie Peter Norvig, der sich nicht vom Rest abkapselte.