フィジカルAI業界専門の求人サイトから、5件のAI・機械学習エンジニア求人をお届けします。Tesla Optimus・Figure 02・UnitreeなどフィジカルAI企業の最新求人を掲載中。
ヒューマノイドロボットに実装する次世代Embodied AIの研究開発を担当します。視覚・言語・触覚を統合したマルチモーダルモデルによる物体操作・タスク計画の研究に取り組み、実機実験まで一貫してお任せ...
Tesla Optimusチームにて、ロボットが人間の動作を理解・模倣・自律実行するためのAIモデル開発を担当します。大規模動作データセットを活用した基盤モデルの学習・評価・デプロイパイプラインの構築...
Atlasロボットの知覚・操作AIを担当するエンジニアを募集。3Dビジョン・深度センサー・触覚センサーを統合したリアルタイム環境認識と、ニューラルネットワークベースの動作生成モデルの研究開発をお任せし...
MUJINのインテリジェントロボットコントローラーに搭載する、汎用物体把持・マニピュレーションAIの研究開発を担当します。多様な形状・素材の物体に対応するロバストな把持計画・実行システムの実装をお任せ...
NEOヒューマノイドロボットに全身協調制御AIを実装するMLエンジニアを募集。脳に相当する「World Model」の研究開発から実機展開まで、少数精鋭チームで世界最高水準のEmbodied AIを作...
AI・機械学習エンジニア(AIエンジニア・MLエンジニア・ディープラーニングエンジニア・生成AIエンジニアとも呼ばれます)は、ヒューマノイドロボットの「脳」を開発する職種です。コンピュータビジョン(画像認識)・自然言語処理(NLP)・強化学習・模倣学習・LLM(大規模言語モデル)などを活用し、ロボットが自律的に環境を認識・判断・行動するためのAIモデルを設計・学習・デプロイします。企業によってはパーセプションエンジニア・Embodied AIエンジニア・データサイエンティストと表記されることもあります。
年収700万〜3,000万円。特にEmbodied AI・大規模行動モデル(LBM)分野のAI研究者やディープラーニングエンジニアは世界的に不足しており、高い報酬が提示されます。
Foundation Modelのロボティクス応用やSim-to-Real転移技術の進歩により、AIエンジニア・MLエンジニアの需要はロボット業界全体で急拡大中。博士号保持者に限らず、実装力のある機械学習エンジニアにも多くの機会があります。
「AI・機械学習エンジニア」は企業や求人媒体によって以下のような名称で募集されることがあります。
AIエンジニアのロボット応用ポジションは、Web系・データサイエンス系のAIエンジニア経験が3年以上あれば転職可能です。特にPyTorch・TensorFlowでの深層学習モデル構築経験、Computer Visionや強化学習の実装経験があれば、ロボット業界未経験でも採用されるケースが多数あります。完全未経験からの場合は、まずAIエンジニアとしてキャリアを積んでからロボット業界へ移るルートが現実的です。Embodied AIや模倣学習の論文を実装したポートフォリオがあると強力です。
ロボットAI開発のAIエンジニアは、Web系AIエンジニアと同等以上の年収水準です。国内では700万〜2,000万円、Embodied AIや大規模行動モデル(LBM)の専門性があれば年収2,500万円以上のポジションも珍しくありません。米国Tesla・Figure AI・1XのAIリサーチ職は年収3,000万〜5,000万円+ストックオプションが標準です。Web系より人材プールが小さく希少性が高いため、報酬は高水準で推移しています。
研究職(リサーチサイエンティスト)は博士号保持者が中心ですが、AIエンジニア・MLエンジニアのポジションは修士・学士でも応募可能です。実装力と業績(OSS貢献・論文・Kaggle・ロボットコンペ実績)があれば博士号なしでも年収1,500万円以上のオファーを獲得できます。Foundation ModelやLLMのロボット応用プロジェクトでの実装経験は強力なアピール材料です。
コンピュータビジョン(CV)はロボットAIの中核要素技術の一つです。ロボットAIはCVに加えて、強化学習・模倣学習・モーションプランニング・センサーフュージョン・Sim-to-Real転移など、物理世界での行動生成までを含みます。CVエンジニアからロボットAIへの転身は親和性が高く、画像認識・物体検出スキルを土台にロボット制御の知識を追加することでキャリアアップできます。
Embodied AI(身体性AI)エンジニアは、物理身体を持つロボットの認識・判断・行動を統合的に学習させる職種です。従来の画像認識AIや言語AIと異なり、センサー入力から運動出力までエンドツーエンドで学習するモデル(Vision-Language-Actionモデル等)を扱います。Tesla Optimus・Figure 02・1X NEOなどの人型ロボットの中核技術であり、世界的に最も需要が伸びている領域です。