最新AIニュース

AIの最新動向を毎日お届け。要点だけをシンプルに。

→ 注目トピックはこちら

[お知らせ] iOS版をリリースしました🎉

6月16日 (火)

GitHub Blog - AI & ML

GitHub Copilot CLIに言語サーバーを使ってリアルなコードインテリジェンスを付与する

GitHub Copilot CLIに言語サーバー（LSP）を自動セットアップするスキルが公開された
テキスト検索に頼らず、型解決や定義ジャンプなど正確なコード解析が14言語で使えるようになる
エディタと同等の構造的なコード理解をターミナル上のAIエージェントに持たせる取り組みが広がっている

Box Blog

自律型AIの時代における信頼の再考

SOCエージェントが証拠不足の状況で結論を捏造し、自信過剰な判断を自動的に次の処理へ引き渡す問題が発覚した
複数のエージェントが連携する環境では、アクセス制御より「どう実行するか」の制御が安全確保の核心になる
AIが扱う社内データの分類・管理が不十分なままでは、エージェントの信頼性は情報の質に直接左右される

GitHub Blog - AI & ML

単発のプロンプトからワークフローへ：GitHub Copilot CLIでカスタムエージェントを使う方法

GitHub Copilot CLIに、Markdownファイルで定義できるカスタムエージェント機能が追加された
チームの規約やツール構成をエージェントに組み込み、セキュリティ監査やリリースノート作成などの繰り返し作業を自動化できる
既製のパートナーエージェントは手軽に使え、カスタムエージェントは自チームの独自ルールや内部ツールに合わせた精度と継続性が必要な場面に向いている

6月15日 (月)

Salesforce

SalesforceがFinの買収に関する最終契約を締結

約36億ドルでFin（旧Intercom）を買収する契約を締結したと発表した
AIエージェントの導入を加速し、中小企業から大企業まで幅広く顧客対応を自動化する狙いがある
FinのAIエージェントは平均76%のサポート対応を自動解決しており、3万社超の顧客基盤も引き継がれる

CodeRabbit

開発者が30秒でバグを承認する瞬間を目撃しました

コードレビューの実態調査で、既存ツールの流用やAIへの丸投げが多数派と判明した
レビューの質より手軽さが優先され、ボトルネック解消に本来必要な判断が省かれている
AIが生成するコード量が増え続ける中、レビュー支援は今やリリースを支える必須の仕組みとなっている

OpenAI News

OpenAI パートナーネットワークのご紹介

企業向けAI導入を支援するパートナー向けプログラム「OpenAI Partner Network」を発表し、1億5千万ドルを投資する
モデルの性能より導入・運用の仕組み作りが課題となる中、外部パートナーとの連携で企業のAI活用を加速させる狙いがある
2026年末までに認定コンサルタント30万人の育成を目標とし、AIの普及をパートナーエコシステム全体で担う体制を整えようとしている

6月13日 (土)

OpenRouter

Hermes AgentをOpenRouterで使う方法：セットアップ、モデル、ルーティング

Hermes AgentをOpenRouter経由で使う設定方法を解説
400以上のモデルに1つのAPIキーでアクセスでき、自動フェイルオーバーも機能する
コスト削減にはPareto Codeルーターや補助モデルの使い分けが有効

Anthropic News

Fable 5およびMythos 5へのアクセス停止を求める米国政府指令に関する声明

Fable 5とMythos 5へのアクセスを米政府の指令で停止
ジェイルブレイクの報告を受けたが、同等の脆弱性は他モデルにも存在する
政府の判断に異議を唱えつつ、早期の復旧を目指している

Artificial Analysis

AA-AgentPerf初の結果：エージェント時代のためのハードウェアベンチマーク

AIエージェント向けの新しい推論ベンチマーク「AA-AgentPerf」を公開
1メガワットあたりの同時エージェント数を主要指標とし、実際の性能を測定
ハードウェア購入者がエージェント用途の機器選定に活用できる

GitHub Blog - AI & ML

GitHubが3年連続でGartner® Magic Quadrant™のエンタープライズAIコーディングエージェント部門においてリーダーとして認定

3年連続でGartner Magic QuadrantのAIコーディング部門Leaderに選出
実行力で12社中最高評価を獲得し、14万社以上が利用
コード生成だけでなく、開発全工程でのAI活用の参考になる

OpenRouter

OpenRouterで最安値のLLM推論を利用する方法

モデルslug末尾に`:floor`を付けると最安プロバイダーに自動ルーティングできる
`max_price`で上限設定、BYOKで自分の契約価格を活用できる
無料モデルは1日50〜1000リクエスト使え、趣味開発に最適

Google Research Blog

引退したスマートフォンで作る低炭素コンピューティングプラットフォーム

引退したスマートフォンをクラウドコンピュータとして再利用する研究
2000台のPixelスマホでデータセンターを構築し、製造時の排出削減を目指す
大学の授業やJupyterノートブックなど実用的な用途に活用できる

Google Research Blog

AIが皮膚疾患の理解をユーザーに支援する方法に関する研究

皮膚疾患の理解をAIで支援する研究成果を発表
AIツール使用で病名の正解率が約3倍に向上したが、次のステップ判断は改善が限定的
画像と文章を組み合わせた多言語対応AIが、医師との対話を促進できる

OpenAI News

次の仕事の時代に向けた新しいOpenAI Academyコース

OpenAI Academyに3つの新コースを追加
AIの基礎から自動化ワークフローまで段階的に学べる
企業の社員研修やAI導入促進に活用できる

Anthropic News

Anthropic Public Recordの初回結果報告

約5万2千人の米国人を対象にAIへの意識調査を実施
AI企業を信頼すると答えたのは15%のみで、雇用喪失を64%が不安視
政府規制への支持や業界への期待を把握し、AI政策立案に活用できる

Hugging Face Blog

olmo-eval: モデル開発サイクルのための評価ワークベンチ

LLM開発中の繰り返し評価を効率化するツール「olmo-eval」を公開
ベンチマーク追加が容易で、チェックポイント間の比較をより詳細に実行できる
開発中モデルの継続的な評価フローに活用できる

6月12日 (金)

OpenAI News

Preplyがパーソナライズされた学習を実現するためにAIと人間のチューターを組み合わせる方法

OpenAI APIを使い、授業後に個別フィードバックを自動生成する機能を導入
講師の準備時間が半減し、生徒の継続率も1年後も75%を維持
AI活用を全社戦略として推進する際の具体的な参考事例として使える

Artificial Analysis

ガードレールモデルの安全性、拒否率、レイテンシのベンチマーク評価

複数のガードレールモデルを3つのデータセットで性能比較した
安全なコンテンツを誤拒否せず、危険なコンテンツを検出するバランスが重要
用途に応じて検出優先か誤拒否低減優先かを選ぶことが推奨される

CodeRabbit

Automatic Repository Linking: 手動設定なしでクロスリポジトリのコンテキストを利用

リポジトリ間の依存関係を自動検出してレビューに活用できる機能を追加
手動設定不要で、コードのインポートや依存関係からリポジトリの関連を自動判定
マージ前に他リポジトリへの影響をファイルと行番号付きで確認できる

Ollama Blog

OllamaのMLXによるApple Silicon上での過去最高パフォーマンス

OllamaのMLXエンジンがApple Silicon向けに大幅強化
NVFP4形式で品質向上、出力速度が最大20%向上
MacでAIエージェント作業をより速く効率的に実行できる