GitHub Blog - AI & MLGitHub Copilot CLIに言語サーバーを使ってリアルなコードインテリジェンスを付与するGitHub Copilot CLIに言語サーバー(LSP)を自動セットアップするスキルが公開されたテキスト検索に頼らず、型解決や定義ジャンプなど正確なコード解析が14言語で使えるようになるエディタと同等の構造的なコード理解をターミナル上のAIエージェントに持たせる取り組みが広がっている
Box Blog自律型AIの時代における信頼の再考SOCエージェントが証拠不足の状況で結論を捏造し、自信過剰な判断を自動的に次の処理へ引き渡す問題が発覚した複数のエージェントが連携する環境では、アクセス制御より「どう実行するか」の制御が安全確保の核心になるAIが扱う社内データの分類・管理が不十分なままでは、エージェントの信頼性は情報の質に直接左右される
GitHub Blog - AI & ML単発のプロンプトからワークフローへ:GitHub Copilot CLIでカスタムエージェントを使う方法GitHub Copilot CLIに、Markdownファイルで定義できるカスタムエージェント機能が追加されたチームの規約やツール構成をエージェントに組み込み、セキュリティ監査やリリースノート作成などの繰り返し作業を自動化できる既製のパートナーエージェントは手軽に使え、カスタムエージェントは自チームの独自ルールや内部ツールに合わせた精度と継続性が必要な場面に向いている
SalesforceSalesforceがFinの買収に関する最終契約を締結約36億ドルでFin(旧Intercom)を買収する契約を締結したと発表したAIエージェントの導入を加速し、中小企業から大企業まで幅広く顧客対応を自動化する狙いがあるFinのAIエージェントは平均76%のサポート対応を自動解決しており、3万社超の顧客基盤も引き継がれる
CodeRabbit開発者が30秒でバグを承認する瞬間を目撃しましたコードレビューの実態調査で、既存ツールの流用やAIへの丸投げが多数派と判明したレビューの質より手軽さが優先され、ボトルネック解消に本来必要な判断が省かれているAIが生成するコード量が増え続ける中、レビュー支援は今やリリースを支える必須の仕組みとなっている
OpenAI NewsOpenAI パートナーネットワークのご紹介企業向けAI導入を支援するパートナー向けプログラム「OpenAI Partner Network」を発表し、1億5千万ドルを投資するモデルの性能より導入・運用の仕組み作りが課題となる中、外部パートナーとの連携で企業のAI活用を加速させる狙いがある2026年末までに認定コンサルタント30万人の育成を目標とし、AIの普及をパートナーエコシステム全体で担う体制を整えようとしている
OpenRouterHermes AgentをOpenRouterで使う方法:セットアップ、モデル、ルーティングHermes AgentをOpenRouter経由で使う設定方法を解説400以上のモデルに1つのAPIキーでアクセスでき、自動フェイルオーバーも機能するコスト削減にはPareto Codeルーターや補助モデルの使い分けが有効
Anthropic NewsFable 5およびMythos 5へのアクセス停止を求める米国政府指令に関する声明Fable 5とMythos 5へのアクセスを米政府の指令で停止ジェイルブレイクの報告を受けたが、同等の脆弱性は他モデルにも存在する政府の判断に異議を唱えつつ、早期の復旧を目指している
Artificial AnalysisAA-AgentPerf初の結果:エージェント時代のためのハードウェアベンチマークAIエージェント向けの新しい推論ベンチマーク「AA-AgentPerf」を公開1メガワットあたりの同時エージェント数を主要指標とし、実際の性能を測定ハードウェア購入者がエージェント用途の機器選定に活用できる
GitHub Blog - AI & MLGitHubが3年連続でGartner® Magic Quadrant™のエンタープライズAIコーディングエージェント部門においてリーダーとして認定3年連続でGartner Magic QuadrantのAIコーディング部門Leaderに選出実行力で12社中最高評価を獲得し、14万社以上が利用コード生成だけでなく、開発全工程でのAI活用の参考になる
OpenRouterOpenRouterで最安値のLLM推論を利用する方法モデルslug末尾に`:floor`を付けると最安プロバイダーに自動ルーティングできる`max_price`で上限設定、BYOKで自分の契約価格を活用できる無料モデルは1日50〜1000リクエスト使え、趣味開発に最適
Google Research Blog引退したスマートフォンで作る低炭素コンピューティングプラットフォーム引退したスマートフォンをクラウドコンピュータとして再利用する研究2000台のPixelスマホでデータセンターを構築し、製造時の排出削減を目指す大学の授業やJupyterノートブックなど実用的な用途に活用できる
Google Research BlogAIが皮膚疾患の理解をユーザーに支援する方法に関する研究皮膚疾患の理解をAIで支援する研究成果を発表AIツール使用で病名の正解率が約3倍に向上したが、次のステップ判断は改善が限定的画像と文章を組み合わせた多言語対応AIが、医師との対話を促進できる
OpenAI News次の仕事の時代に向けた新しいOpenAI AcademyコースOpenAI Academyに3つの新コースを追加AIの基礎から自動化ワークフローまで段階的に学べる企業の社員研修やAI導入促進に活用できる
Anthropic NewsAnthropic Public Recordの初回結果報告約5万2千人の米国人を対象にAIへの意識調査を実施AI企業を信頼すると答えたのは15%のみで、雇用喪失を64%が不安視政府規制への支持や業界への期待を把握し、AI政策立案に活用できる
Hugging Face Blogolmo-eval: モデル開発サイクルのための評価ワークベンチLLM開発中の繰り返し評価を効率化するツール「olmo-eval」を公開ベンチマーク追加が容易で、チェックポイント間の比較をより詳細に実行できる開発中モデルの継続的な評価フローに活用できる
OpenAI NewsPreplyがパーソナライズされた学習を実現するためにAIと人間のチューターを組み合わせる方法OpenAI APIを使い、授業後に個別フィードバックを自動生成する機能を導入講師の準備時間が半減し、生徒の継続率も1年後も75%を維持AI活用を全社戦略として推進する際の具体的な参考事例として使える
Artificial Analysisガードレールモデルの安全性、拒否率、レイテンシのベンチマーク評価複数のガードレールモデルを3つのデータセットで性能比較した安全なコンテンツを誤拒否せず、危険なコンテンツを検出するバランスが重要用途に応じて検出優先か誤拒否低減優先かを選ぶことが推奨される
CodeRabbitAutomatic Repository Linking: 手動設定なしでクロスリポジトリのコンテキストを利用リポジトリ間の依存関係を自動検出してレビューに活用できる機能を追加手動設定不要で、コードのインポートや依存関係からリポジトリの関連を自動判定マージ前に他リポジトリへの影響をファイルと行番号付きで確認できる
Ollama BlogOllamaのMLXによるApple Silicon上での過去最高パフォーマンスOllamaのMLXエンジンがApple Silicon向けに大幅強化NVFP4形式で品質向上、出力速度が最大20%向上MacでAIエージェント作業をより速く効率的に実行できる