BLOG

【インタビュー連載】機械学習チームを率いるダビド・クルナポ, Ph.D. – パリから東京へ

InterviewsTechnology

David Cournapeau(ダビド・クルナポ)は、Cogent Labsの機械学習エンジニアチームを率いています。彼はまた、scikit-learnの原作者であり、NumPy やSciPyへの貢献など、オープンソースコミュニティでの活動も行っています。

4回にわたり、今日までのキャリア、研究から得たプロダクト開発に対する彼の考え、Cogent Labsでの経験を取り上げます。

 

トピック1:キャリア – パリから東京へ

Q: 学生時代からのバックグラウンドについてお聞かせください。

フランスの工学系で、典型的な進路をたどりました。高校を卒業した後、予備校のような学校に2年間通い、その後テレコム・パリテック(フランス国立高等電信大学)という工科大学で学びました。専攻はコンピュータ科学と電子工学です。信号の扱い方を数学的に実証する信号処理を研究していました。

その後は、昔から音楽に興味があったので別の修士課程に進み、音声信号処理や音響学など、音楽に応用される各種の技術を1年間研究しました。

修士課程では、6カ月のインターンシップが義務づけられていたのですが、それがきっかけで初めて日本に来ることになりました。
たいていの学生はパリ郊外のどこかで働き口を見つけますが、私は日本の文化にとても関心があったので、日本でインターンができればより充実するのではないかと思ったのです。

インターンとして、株式会社国際電気通信基礎技術研究所(ATR)で仕事をしました。ATRには海外の研究者との協力関係の醸成を目的として日本政府が助成する研究所が集まっています。私がいたのは、情報通信、脳科学、仮想現実を専門に扱う奈良市の近くにある研究所です。インターン期間は6カ月でしたが、研究員としてさらに1年在籍しました。

その後、博士課程に進みたいと考えるようになり、ATRでの仕事を通じて、研究所の上司が京都大学の教授に私を推薦してくれました。日本政府の奨学金を得て、2006年から2009年まで京都大学で博士課程を履修しました。

 

Q: 博士課程では何の研究をしてたのですか?

音声認識です。当時はこの分野の研究が非常に面白い時期でした。今「機械学習」と呼ばれているものをいち早く利用した分野の一つであったからです。現在、画像処理の分野でごく一般的な手法や、Cogent Labsも含めAI企業で使われている手法の多くが、音声認識の当時最先端の研究で用いられ、開発されたものです。80年代から、最先端の音声認識研究は、統計的な手法と大量のデータを使って音声認識を行うシステムを訓練するものでした。このやり方を大規模に行った最初の分野だと思います。

 

Q: 博士課程を修了した後、どんなキャリアを歩みたいかについての考えはありましたか?

2009年に博士課程を修了した当初は、研究職を続けたいと思っていました。しかし、自分を見つめ直してみた結果、研究は本当に楽しいけれど、自分は研究者としてはそこそこで、それほど傑出しているわけではないと気づいたんです。それに、研究の世界には優秀な人がたくさんいて、研究職を目指す人の数は実際のポストの数よりはるかに多いこともわかっていました。なので、自分はどこかで平凡な研究者にはなれたとしても、本当に優秀でない限り、おそらく研究を楽しむことはできないだろうと。それで別の道に進むことにしました。

 

Q: それで産業界に移ることになったんですね。

はい。それで2009年にレコメンデーションシステムを扱うシルバーエッグという大阪の会社に入社しました。そのときの仕事はアルゴリズム研究で、主にバックエンドの仕事を担当しました。これは私のキャリアでほぼ一貫したテーマです。いわゆる「純粋な」エンジニアリングと、機械学習や統計ベースの作業をミックスしようと取り組んでいました。

その会社には1年半勤めました。何らかの責任をもたされた初めての仕事で、学ぶこともたくさんありました。しかし、1年半たって、このまま大阪で外国人としてキャリアを伸ばしていくのかと考えると、少し不安になってきたんです。10年前は、東京にもそれほど多くの求人はなかったので。

それが理由でヨーロッパに戻ることにしました。そのあと、知り合いが多くいたEnthoughtという会社に入るチャンスがあり、そこで6年間勤務しました。アメリカの会社なのですが、2011年にケンブリッジに10人規模の小さいオフィスができることになり、そのオフィスの開設とほぼ同時に入社しました。

Enthoughtはテクノロジー志向の強い小規模な会社で、創業者も含めて社員の7割が博士号を持っていました。要するに、企業に科学的コンサルティングを提供しようというわけです。典型的な例として、ある企業にドメインエキスパートがいて、概念実証ソフトウェアを開発したとします。そこでその企業は私たちに、そのソフトウェアをもとに他の人が使えるソフトウェアを開発してほしいと依頼してきます。ドメインエキスパートにそういう仕事はさせたくないし、かといって、どのソフトウェアエンジニアでもいいというわけにはいかない。その裏にある科学を理解している必要がありますからね。

ある意味で、Enthoughtは常に純粋なソフトウェアエンジニアリングと科学の接点にいたと言えます。社員の大半は科学的な知識に通じているので、科学者と同じ考え方ができますが、ソフトウェアエンジニアリングについて科学者よりも得意です。だから、1人か2人にしか使えないソフトではなく、おそらくは社内全体で使えるものを開発できる。それがEnthoughtの主要な価値提案でした。

この時期には、バックエンドインフラ寄りの仕事も引き受けていました。これはソフトウェア開発をしやすくするために、全ての顧客に再利用できる仕事でした。

 

Q: Cogent Labsの入社は?

6年経って、いろいろ理由があって別のことをやりたくなったんです。転職先を探すに当たっては、製品開発に携わるチャンスがあることを一番に考えました。コンサルティングの仕事はしたくないと思っていました。それに、AIと深層学習がかなり注目され始めていることも知っていました。私が博士課程で学んだのはこうした手法を開拓してきた分野だったので、AI関連の製品に関われればなおいい。もしそれが日本でできるとしたら、ますますいい。そういうわけで、自然な流れでCogent Labsに転職することになりました。

2017年の夏に、最初はシニアリサーチエンジニアとしてCogent Labsに入社しました。それまでの仕事と同じように、研究者とエンジニアリングの橋渡しをする役割を担いました。科学とエンジニアリングの両方の経験があるけれど、科学は研究部門の共同責任者ほど得意ではなくて、むしろエンジニアリングの方に強いということで。

 

Q: 現在は、自ら立ち上げた機械学習エンジニアリングチームを率いていますが、どんな経緯だったのですか?

数カ月経った頃、機械学習専門のエンジニアリングチームが必要だと感じました。そこで2017年の12月頃に、研究チームに元々いたメンバー2人と一緒にチームを立ち上げました。

大企業ではだいたい研究所があって、ソフトウェアエンジニアや営業部門は別の組織で、場合によっては拠点も別々です。そのため、研究が実際の製品になるまでの期間が非常に長くて、何年もかかることさえあります。しかし、小さい会社の場合は特に、そうはいきません。チームを分けずに、一緒に仕事をするのが理想的です。

機械学習エンジニアリングチームの第一の価値提案は、以前私がEnthoughtでやっていたことと似ています。それは、研究とソフトウェアエンジニアリングの接点として働くこと。私たちはAIや深層学習については研究者ほど詳しくないので、論文を書いたり新しい研究をしたりはしませんが、既存の研究論文を読んで最先端の研究を理解することはできます。それをしながら、製品に関わる仕事に力を注いでいます。

 

第2回は、Davidのオープンソースコミュニティにおける活動とこの分野に関する考えについて話を聞きます。

 

この記事をシェア

RSS