検索

「推論モデル」の検索結果: ユーザー 0件・記事 6件

記事（6）

Google DeepMindがGemini 2.5 Ultraを一般公開——推論コスト1/3でGPT-4o超えのベンチ結果

リード Google DeepMindは2026年5月10日（現地時間）、推論特化モデル「Gemini 2.5 Ultra」をGoogle AI StudioおよびVertex AI経由で一般公開した。MMLU-Proで92.3%、コード生成ベンチマークSWE-bench Verifiedで63.1%を記録しながら、推論トークン単価を前世代「Gemini 2.5 Pro」比で約67%削減。「性能を...

AIニュース2026年5月11日 1

「推論型LLM」が企業導入の主流へ——思考プロセス可視化が意思決定業務を塗り替える

リード推論過程を外部に開示する「思考連鎖型（Chain-of-Thought）」LLMの企業導入が、2026年上半期に質的な転換点を迎えた。単なる回答精度の向上ではなく、AIが「なぜそう判断したか」を監査可能な形で示せるようになったことで、これまで人間専任だった高付加価値業務への実装障壁が下がっている。何が起きているのか推論特化型モデルの系譜は2024年9月のOpenAI「o1」リリースに遡...

AIニュース2026年6月1日 1

オンデバイス推論AIが臨界点——スマートフォン単体でGPT-4水準の精度を達成

リードクラウドへのデータ送信なしに複雑な推論をこなす「オンデバイスAI」が、2026年5〜6月にかけて複数ベンダーで実用水準に達した。Qualcomm Snapdragon 8 Elite 2搭載端末上で動く13Bパラメータモデルが、MMLU・MATH・HumanEvalの3ベンチマークでGPT-4（2023年版）比95%以上のスコアを記録したと報告されており、「クラウドAI前提」の企業インフラ...

AIニュース2026年6月5日 1

AIエージェントが「法務・会計・コンサル」の知識労働に本格侵入——2026年上半期、PwC・Clifford Chanceが実数を公表

リード「PoC（概念実証）フェーズは終わった」——PwCとClifford Chanceが2026年6月15〜16日に公表した業務データは、AIエージェントが知識労働の本流に食い込んだことを数字で示した。デューデリジェンス・契約レビュー・税務ドキュメント処理の一部工程において、人間の専門家の作業時間が最大73%削減されたという報告は、法務・会計・コンサルティング業界の「稼ぎ方の構造」に直結する。...

AIニュース6日前 1

ChatGPT Images 2.0が画像生成ベンチマーク首位——「生成前に計画を立てる」推論型アーキテクチャが分岐点

リード ChatGPT Imagesの最新版（Images 2.0）が、画像生成と画像編集の双方のベンチマークでGemini 3.1を上回り首位に浮上した。単なるスコア更新ではなく、注目すべきは生成プロセスの設計そのものが変わった点だ。プロンプトに即座に反応していた従来モデルと異なり、Images 2.0は「出力前に推論ステップを挟む」構造を採用している。何が起きているのか X上では5月8〜9日...

AIニュース2026年5月8日 0

「思考トークン」課金の実態——推論AIが生む見えないコストを検証した

リード推論モデルが「正確」なのは周知の事実になった。問題は、その正確さのコストが想定より高くつくことだ。2026年に入り複数のプロバイダーが「思考トークン」の課金体系を本格導入。コードの1行を修正させるだけで数十円が飛ぶケースも出てきている。何が起きているのか 2025年末から2026年前半にかけて、OpenAI・Anthropic・Google DeepMindの3社が相次いで「推論（Rea...

霧島ヒカリ2026年6月12日 0