「推論モデル」の検索結果: ユーザー 0件・記事 6件
リード Google DeepMindは2026年5月10日(現地時間)、推論特化モデル「Gemini 2.5 Ultra」をGoogle AI StudioおよびVertex AI経由で一般公開した。MMLU-Proで92.3%、コード生成ベンチマークSWE-bench Verifiedで63.1%を記録しながら、推論トークン単価を前世代「Gemini 2.5 Pro」比で約67%削減。「性能を...
リード 推論過程を外部に開示する「思考連鎖型(Chain-of-Thought)」LLMの企業導入が、2026年上半期に質的な転換点を迎えた。単なる回答精度の向上ではなく、AIが「なぜそう判断したか」を監査可能な形で示せるようになったことで、これまで人間専任だった高付加価値業務への実装障壁が下がっている。 何が起きているのか 推論特化型モデルの系譜は2024年9月のOpenAI「o1」リリースに遡...
リード クラウドへのデータ送信なしに複雑な推論をこなす「オンデバイスAI」が、2026年5〜6月にかけて複数ベンダーで実用水準に達した。Qualcomm Snapdragon 8 Elite 2搭載端末上で動く13Bパラメータモデルが、MMLU・MATH・HumanEvalの3ベンチマークでGPT-4(2023年版)比95%以上のスコアを記録したと報告されており、「クラウドAI前提」の企業インフラ...
リード 「PoC(概念実証)フェーズは終わった」——PwCとClifford Chanceが2026年6月15〜16日に公表した業務データは、AIエージェントが知識労働の本流に食い込んだことを数字で示した。デューデリジェンス・契約レビュー・税務ドキュメント処理の一部工程において、人間の専門家の作業時間が最大73%削減されたという報告は、法務・会計・コンサルティング業界の「稼ぎ方の構造」に直結する。...
リード ChatGPT Imagesの最新版(Images 2.0)が、画像生成と画像編集の双方のベンチマークでGemini 3.1を上回り首位に浮上した。単なるスコア更新ではなく、注目すべきは生成プロセスの設計そのものが変わった点だ。プロンプトに即座に反応していた従来モデルと異なり、Images 2.0は「出力前に推論ステップを挟む」構造を採用している。 何が起きているのか X上では5月8〜9日...
リード 推論モデルが「正確」なのは周知の事実になった。問題は、その正確さのコストが想定より高くつくことだ。2026年に入り複数のプロバイダーが「思考トークン」の課金体系を本格導入。コードの1行を修正させるだけで数十円が飛ぶケースも出てきている。 何が起きているのか 2025年末から2026年前半にかけて、OpenAI・Anthropic・Google DeepMindの3社が相次いで「推論(Rea...