自動運転の研究も! 機械学習 × 交通の論文を紹介

行灯Labo 自動運転論文

December 13, 2018

💁🏻

※本記事は Mobility Technologies の前身である JapanTaxi 時代に公開していたもので、記事中での会社やサービスに関する記述は公開当時のものです。

R&D部ではタクシーに関する自動運転や画像処理を使ったプロジェクトも進めています。これらのプロジェクトを推進するために、最新の技術をフォローすることを目的として、論文の輪講会を実施しています。

今回は論文輪講会で紹介された交通と機械学習に関する論文を紹介します。

Learning to Estimate the Travel Time

Conference: KDD2018 Authors: Zheng Wang (Didi Chuxing); Kun Fu (Didi Chuxing); Jieping Ye (Didi Chuxing) URL:

DiDiの到着時間予測をする論文で実際のサービスで使っているモデル

到着時間予測とは
- 出発地から目的地までにかかる時間を予測するタスク
既存のアプローチ
- 経路に基づいて、道路ごとにかかる時間を足し合わせて到着時間を予測する → 誤差が累積してしまう
- 経路に関係なく実際の走行ログを使って機械学習を使って予測 → データのカバレッジに問題
提案するアプローチ：Wide-Deep-Recurrent Learning
- 特徴の異なる３つのモデルをconcatして予測
- Wideモデル：FactorizationMachineで特徴量を抽出したものにロジスティック回帰で処理。ドライバー・乗客などのパーソナルな特徴を表現
- Deepモデル：MultiLayerPerceptronで処理。グローバルな特徴を表現
- Recurrentモデル：経路に従って道路ごとの特徴ベクトルをLSTMで再帰的に処理。ローカルな特徴を表現
実験結果
- 提案手法の精度が高く、特にRecurrentモデルが有効
- 通勤ラッシュや休日の予測が外れやすい
- サービス上でA/Bテストを実施し有効性を確認

実際のサービス上で動かしているものをトップカンファレンスに通せているのが素晴らしいですね。手法に関しても、課題感からシンプルなアプローチを選択しています。

End to End Learning for Self-Driving Cars

Conference: なし Authors: Mariusz Bojarski, Davide Del Testa, Daniel Dworakowski, Bernhard Firner, Beat Flepp, Prasoon Goyal, Lawrence D. Jackel, Mathew Monfort, Urs Muller, Jiakai Zhang, Xin Zhang, Jake Zhao, Karol Zieba(NVIDIA Corporation) URL:

カメラの画像のみを入力にして自動運転車のハンドル操作を推定する論文
- 走行データ実際にカメラを取り付けた自動車を走らせて、多様な道、天気、光の状況の画像データとハンドル操作を収集
Data Augmentation
- ハンドル操作をずらす、画像をずらす、左右のカメラを学習に使用
モデル
- 5層のCNN層を含む9層のネットワーク
- 最終層は1/radiusを学習（radius：曲率半径）
実験
- 実際に18kmを走行し、自動走行時間は98%
- CNNの層を確認すると道路に沿ったアウトラインを確認

end-to-endの自動運転は実用は難しそうですが、技術的に面白いですね。道路のラインを直接学習していないのにCNN層でラインを認識しています。また、時間方向の情報を一切使わなくても操作ができている点も興味深いです。

Learning Combinatorial Optimization Algorithms over Graphs

Conference: NIPS2017 Authors: Hanjun Dai, Elias B. Khalil, Yuyu Zhang, Bistra Dilkina(Georgia Institute of Technology), Le Song(Ant Financial) URL:

NP困難なグラフ問題のタスクに対してニューラルグラフ埋め込みと強化学習を適用した論文
NP困難なグラフ探索とは
- 例えば、巡回セールスマン問題（TSP）
  - 全てのノードをちょうど一度ずつ巡り出発ノードに戻る巡回路の総移動コストが最小のものを求める
グラフ埋め込み：structure2vec
- 𝜇(𝑡+1)𝑣⟵𝐹(𝑥𝑣,{𝜇(𝑡)𝑢}𝑢∈𝑁(𝑣),{𝑤(𝑣,𝑢)}𝑢∈𝑁(𝑣);Θ)
  - 𝑥: ノードの特徴量
  - 𝜇: ノードの特徴ベクトル
  - 𝑁(𝑣): 近接ノード集合
  - 𝑤(𝑣,𝑢): ノードv,u間の重み
  - 𝐹: 非線形関数（ニューラルネットワーク）
  - Θ: パラメータグラフの構造を反映しながらイテレーションを繰り返す
強化学習：Deep Q-learning
- 𝑦=Σ𝑛−1𝑖=0𝑟(𝑆𝑡+𝑖,𝑣𝑡+𝑖)+𝛾𝑚𝑎𝑥𝑣′𝑄̂ (ℎ(𝑆𝑡+𝑛),𝑣′;Θ)
  - 𝑄: 選択した行動がどれだけいいかを計算する非線形関数（ニューラルネットワーク）
  - 𝑟: 報酬。TSPの場合、移動距離
  - 𝑆: 状態。TSPの場合、部分的なノード遷移
  - 𝑣: ノード
  - 𝛾: 割引率
  - Θ: パラメータ
実験
巡回セールスマン問題、最小頂点被覆問題、最大カット問題で実験
人手で設定した貪欲法よりも近似解に近い

グラフ埋め込みやDQNといったイマドキな技術を使って、グラフ問題に対するアプローチを一般化している論文。弊社で取り組んでいるタクシーの配車支援システムでも部分的に巡回セールスマン問題を解く必要があり、参考になりそうです。

まとめ

交通と機械学習をテーマに論文を３本紹介しました。交通の諸問題は、データサイエンス、画像処理、グラフなど機械学習で解くアプローチが多数あります。

💁🏻

※本記事は Mobility Technologies の前身である JapanTaxi 時代に公開していたもので、記事中での会社やサービスに関する記述は公開当時のものです。

Mobility Technologies では共に日本のモビリティを進化させていくエンジニアを募集しています。話を聞いてみたいという方は、是非募集ページからご相談ください！