機械学習における今後の展開

アクセリアの研究
機械学習研究開発の変化と進歩
 前回のコラムでは、現在の機械学習の中で最も人気のある技術であるニューラルネットワーク、特にCNN (Convolutional Neural Network)を紹介しました。この技術は、過去10年に渡るサービス開発(画像認識、リコメンデーション・システム、自動翻訳等)で大きな変化がありました。
 また、多くの研究者と開発者がこれらのトピックに焦点を当てており、理論的な枠組みと実用的な実装の両方で大きな進歩もありました。(前回のコラムはこちら

 機械学習は今後も変化や進歩が期待できますが、私がその中で注目しているものは、「(1)機械学習に関する機械学習」と「(2)教師なし機械学習」です。
機械学習に関する機械学習が開発されている
 今日では、ニューラルネットワークが何であるかは問題ではなく、それをどのように適用するかが大きな問題です。特に特定の構成と組み合わせが難しく、経験と試行錯誤が必要です。 Google Research Blogから引用すると:

 通常、当社の機械学習モデルは、エンジニアと科学者のチームによって慎重に設計されています。
 可能なすべてのモデルの検索スペースがコンビナトリアルに大きくなるため、マシン学習モデルを
 手動で設計するこのプロセスは困難です。典型的な10層ネットワークは〜10^10の候補ネットワ
 ークを持つことができます。このため、ネットワークの設計プロセスでは、機械学習の重要な専門
 知識を持つ人たちによって多くの時間と実験が必要になることがよくあります。

 一言で言えば、任意のネットワークを構築するだけでは最適な結果が得られません。ネットワークの設計が最も重要です。そこで、Googleの研究者は新しい方向への一歩を踏み出しました。機械学習アルゴリズムを学習し、ニューラルネットワークのレイアウトを設計することです。上記ブログは、機械学習システムが様々な問題に対してより良い性能のニューラルネットワークを生成できることを示しています。

 この開発は、今後数年間に多くの研究の興味関心を呼び起こすでしょう。
問題と答えがセットになっていない、教師なし学習の技術が必要
 今までのコラムで紹介したすべての学習アルゴリズムは、実際の応用学習アルゴリズムと同様に、共通点が1つあります。問題と答えのセットが必要な点です。手書き数字の場合、正解の数字の画像が必要でした。この学習方法は非常に効率的であることが判明しており、ほとんどの開発はこれらの技術に集中しています。

 人間の脳と似たようなシステムと学習能力を生み出すという、機械学習と神経ネットワークの目的を振り返ると、私たちは1つの不一致があることに気付きます。子供がどのように学習するかを見ると、採用されている技術とは大きく異なるのです。子供は、フィードバックなしで学習することもあり、フィードバックありで学習することもあります。

 この学習方法は、教師なし学習や強化学習と呼ばれています。ニューラルネットワークのような教師あり学習とは対照的に、教師なし学習で現在使用されている方法は、過去数年間にわずかな発達しか見られませんでした。技術(主にクラスタリング法)は、長年変わっていません。

 アクセリアでは、異常(攻撃や不正行為など)を探して分析する必要がある膨大なインターネット接続データを扱った研究も行っています。これらのインターネット接続データは「良い」または「悪い」とタグ付けされておらず、いかなる方法でも分類されているものではなく、最も基本的なインターネットプロトコルレベルだけで分類されています。それらの情報を読み、データから学習するには、教師なし学習の技術が必要です。
加速度的に新しい技術が出る機械学習
 機械学習のお陰で社会に大きな変化が起こっていますが、この分野の研究と開発はこれからも加速度的に進み、どんどん新しい技術が出るでしょう。個人的にはより良い教師なし学習アルゴリズムの開発に可能性を感じています。これからもこれにフォーカスし、研究と開発を続けます。

■関連ページ
【アクセリアのサービス一覧】
 ・サービスNAVI

Norbert Preining

アクセリア株式会社 研究開発部 所属
北陸先端科学技術大学院大学ソフトウェア検証研究センター 研究員
ウィーン工科大学 研究員
Debian開発者
TeX User Group (取締役会員)、Kurt Gödel Society (取締役会員)
ACM, ACM SigLog, 日本数式処理学会、ドイツ数学論理学会