“The Morning Paper” de l'année - Édition 2018

Poursuivant ma tradition établie depuis sa création jusqu'en 2017, voici ma liste d'opinions des articles les meilleurs / les plus intéressants / les plus pertinents / les plus révélateurs présentés dans The Morning Paper par l'incroyable Adrian Colyer pendant le cours. de l'année dernière.

AI et tel

Problèmes concrets et sécurité de l'IA

Entre les techno-utopistes de l'IA et les prophètes de l'IA de la mort, les nerds de l'IA se contentent de penser à leurs problèmes. Les auteurs représentent certaines des institutions de renom qui travaillent dans ce domaine et leur réputation garantit que nous ferons attention. Les taxonomies aident à résumer les connaissances d'un domaine en morceaux digestibles, et le présent document fournit des formulations succinctes et conviviales, telles que le "piratage de récompense". (Ils ne pouvaient aller que jusque-là, succombant finalement à «la fragilité face au changement de répartition», alors que «la confusion dans des environnements inattendus» aurait très bien fonctionné.) Blagues à part, le document est extrêmement accessible et les auteurs ont fait une fantastique travail avec les exemples. En parlant de robots qui cassent les urnes afin d’optimiser les récompenses de nettoyage, le plus drôle, c’est que nous savons que les robots / agents auraient ces problèmes avec de simples fonctions objectives - après tout, les humains n’ont-ils pas ces problèmes tout le temps? (Reportez-vous sur l'histoire de développeurs qui autorisent des bogues dans leur code afin d'obtenir le bonus de correction de bogues.)

Réglementation de l'UE sur la prise de décision algorithmique

Quand la presse spécialisée, la presse grand public et Hacker News parlent tous d'une voix basse et respectueuse à propos d'un règlement de l'UE - un règlement de l'UE! - vous pouvez être sûr que quelque chose se prépare. Eh bien, il s’agit d’une attaque possible (et peut-être même involontaire) au cœur d’une règle tacite de l’évaluation du modèle d’IA: que la preuve soit dans les revenus, tout le reste soit foutu. Jusqu'à ce que le règlement soit réellement mis à l'épreuve en contestation judiciaire, ou peut-être en contournement, son champ d'application reste une question d'interprétation et de spéculation. Néanmoins, accorder aux victimes (ou aux «sujets») d'algorithmes le droit de savoir pourquoi une décision a été prise rend l'exploitabilité une proposition [m | b] illion-dollar.

Mêmes statistiques, différents graphiques

J'ai choisi ceci uniquement pour le T. Rex, pour être honnête.

Recherche d'architecture neuronale avec apprentissage par renforcement

Cet article mettait en lumière certaines des recherches actives menées à l'intersection des tribus de Pedro Domingos The Master Algorithm. Kenneth Stanley a souvent abordé ce sujet avec des articles, des conférences et des podcasts sur la neuroévolution.

Routage dynamique entre les capsules

Une inclusion obligatoire. Nous ne savons pas encore à quel point cela aura un impact, mais certains travaux antérieurs de Hinton ont prouvé, dirons-nous avec un euphémisme flagrant, «plutôt utile».

Réglage automatique du système de gestion de base de données

Dans l'ancien monde ennuyeux d'anciens systèmes d'entreprise ennuyeux, les administrateurs sont systématiquement submergés par les commandes de configuration. Heureux de savoir que les gens pensent aussi à ces administrateurs. Hourra! ML ne se limite pas à distinguer les hot dogs et les golden retrievers. Larry Ellison a poussé le marketing à 11 ans avec son annonce concernant Oracle Autonomous Database Cloud à Oracle OpenWorld 2017, mais de nombreuses recherches ont été menées sur ce sujet.

Cela pose un défi de taille. Plus la boîte noire devient opaque - et la plupart des logiciels d'entreprise sont une jolie boîte opaque -, plus nombreux seront les utilisateurs qui auront à contrôler le comportement de la boîte noire. Cela va être aggravé par le fait que, très probablement, même les constructeurs de la boîte noire seront souvent incapables d'expliquer de manière satisfaisante pourquoi la boîte noire a fait ce qu'elle a fait.

Alors que faire? Indices alternatifs comme les méthodes bayésiennes.

BATEAU: Construire des auto-tuners avec optimisation bayésienne structurée

Et un deuxième participant au sujet des optimisations de système. Un aspect intéressant de cet article est que cela semble faire partie d’un regain d’intérêt pour les méthodes bayésiennes, en partie en réponse à la forte volonté d’explicabilité dans de tels systèmes. Il n’est peut-être pas très intéressant de "comprendre" comment un modèle définit le style de peinture de Van Gogh dans Starry Nights, mais il serait certainement intéressant que le matériel de réseau décide que mettre fin à une connexion particulière est "meilleur dans l'ensemble" et qu'il est alors impossible. expliquer à un utilisateur irrité comment il a déterminé que tel était le cas.

Génie logiciel

Comprendre l'agilité des logiciels

On ne dit pas ça comme ça, mais le papier soutient que nous tombons trop souvent dans le piège du biais de survie, attribuant de manière rétrospective une valeur prédictive, là où il n’en existait aucune, à diverses actions ou événements survenus. Plutôt, il conviendrait d'accepter la complexité (par opposition à la simple complexité) du système - personnes, affaires, technologie, code,… - et d'adopter une approche consistant à prendre de petites mesures, en observant les effets, en étudiant les modifications éventuelles. dans l'environnement, en ajustant si nécessaire, puis en prenant un autre petit pas. Les gens de ML l’appellent «descente de gradient». Les gens du génie logiciel l'appellent «Agile». Cela me ramène au point sur lequel je suis le plus d'accord, au tout début du document, qu'Adrian résume ainsi:

l'esprit original d'Agile a souvent été remplacé par la mise en place de règles et de listes de vérification

Une dissection du processus de développement piloté par les tests

Voici un deuxième article qui étudie un phénomène qui semble fonctionner assez bien dans la pratique et tente de le renforcer avec la théorie. Je soupçonne que le document sera bien accueilli par les gens des deux côtés du clivage religieux autour de TDD car ils s'accordent pour dire que la règle des petits lots est la règle (Toyota, Lean, etc.).

Comment les systèmes complexes échouent

Délicieusement applicable aux systèmes logiciels même si l'auteur est un médecin et écrit dans une perspective de soins de santé! Organisé sous la forme d’une série d’observations, il est vraiment étonnant de constater combien d’entre elles s’appliquent directement aux logiciels. À mon avis, la meilleure observation de ce lot est «Les systèmes complexes fonctionnent donc en mode dégradé comme leur mode de fonctionnement normal», mais il existe plusieurs pépites dignes d'intérêt, par exemple, sur les dangers de la RCA, et sur le producteur / solde de l'opérateur et ce qui se passe quand ils sont la même personne. Avec peut-être juste une petite dose de biais de confirmation, il n'est pas difficile de voir toutes les manières dont cela soutient les systèmes Agile, Lean et DevOps.

Nuage

Informatique sans serveur: impact économique et architectural

Le premier d'une série d'articles sur le changement de paradigme apporté par ce qu'on appelle le serveur sans serveur. Pour moi, le nom dit: bien sûr, il existe un serveur exécutant du code quelque part, mais pour le développeur, il n’ya pas de serveur. Serverless rend le cloud computing entièrement basé sur le code - le développeur ne doit s'inquiéter de rien d'autre. Bien sûr, ce document est très fictif, en dollars et en cents, pour et contre. Pensez-y comme à une version académique d'une présentation à un directeur financier et à un directeur informatique, ou au radar technologique ThoughtWorks. Ce n’est pas conçu pour convaincre qui que ce soit de quelque chose, mais il place sans serveur dans le royaume de, dirons-nous, raisonnablement bien compris.

Occupe le nuage

Vinod Khosla, une fois redevable de la Silicon Valley, a déclaré lors d'une conférence: «Le changement est la seule chose pour laquelle il vaut la peine d'optimiser.» Mesdames et messieurs, je vous présente: sans serveur. Ce deuxième article sur deux que j’ai aimé sur le sujet est plutôt un énoncé de vision plus large qui tente de renforcer l’affirmation selon laquelle les avantages d’une architecture hautement découplée en se concentrant sur la valeur décroissante d’optimisations telles que la colocation calcul / données, notant que «sur AWS EC2, l'écriture sur le stockage distant est plus rapide que le stockage de données sur un seul SSD local». Il est peu probable que le journal convainque les sceptiques, mais cela affaiblira définitivement leur résistance. Je prends un peu de problème avec la formulation "calcul distribué pour 99%". Je préférerais dire «infonuagique pour les 99%», ce qui donnerait à ces 99% un moyen d'utiliser le cloud sans se soucier (trop) de l'informatique distribuée.

Clé

C'était une sorte d'inclusion obligatoire, avec tout le battage publicitaire qui l'entoure. Global! Distribué! Aucun ops! ACIDE! CASQUETTE! Horloges atomiques! Cette annonce avait une valeur de fraîcheur bien au-delà du geekdom de base de données.

BRR: contrôle de congestion basé sur la congestion

Pour le dernier article de ma liste, voici un clin d’œil à ce qui paie mes factures: le réseautage. Aussi discret que la plomberie, aussi important et difficile à nettoyer en cas d’encrassement. Soyons clairs, le tamponnement est un problème étonnamment mal compris dans la mise en réseau (sens commun), et quelque chose que mes collègues experts de Citrix nous ont appris lorsqu’ils travaillent sur les optimiseurs WAN, etc. Adrian a probablement fourni les meilleures visualisations de ses blogs de 2017 expliquant le problème du contrôle de congestion TCP et comment BRR le résout.

Donc là vous l'avez. Le flot d'informations continue et, grâce aux efforts de curation d'Adrian Colyer, nous pouvons en digérer de manière significative une partie.

Dans l’attente des sélections d’Adrian pour 2018!

Bonus Papers

Utilisez la «virtualisation native sur le cloud». La virtualisation prenant en compte l'hyperviseur est tellement dépassée. Aussi connu sous le nom de "cloud is the new operating system".

Bien que leur utilisation à l’échelle du Web soit courante, les filtres de comptage semblent très utiles, mais leur construction est largement sous-utilisée. Je me demande pourquoi.