<< DN 2025-10-23 | DN 2025-10-25 >>

Thread by @AnthropicAI

Thread by @vercel

Thread by @aisdk

Thread by @vercel_dev

Nimo - A new home for your AI work

Nimo - A new home for your AI work

How to build AI products that are actually good

How to build AI products that are actually good

  • プロンプト最適化は必要ですが十分条件ではないため、評価(エvals)を仕組み化して継続的に品質を測定し改善することが重要です。
  • エvalsの基本構成は「データセット(入力例)」「タスク(評価対象機能)」「スコア関数(良し悪しの判定)」の三つで成り立ちます。
  • 期待出力(答え)と実出力を比較してスコアリングし、差分からプロンプトやコンテキストの改善点を特定します。
  • スコアリングはルールベースやコード検証だけでなく、第二のモデルを用いた主観評価(トーン、明瞭性など)にも対応できます。
  • 本番運用のログ(入力・出力・補助情報・ユーザー評価)を収集し、同じ基準で再評価することで「本番→テスト」の改善ループを回せます。
  • 大規模アプリは多数かつ長大なプロンプトを抱えるため、管理コストと推論コストの最適化が必要になります。
  • Braintrustはエvalsの実行・ログ収集・スコアリング・プレイグラウンド・品質/安全ゲートを提供し、NotionやStripeなどが採用しています。
  • BraintrustはVercelのプレビューリンクを活用して顧客要望に迅速対応し、フロントエンドはNext.jsで高速に反復開発しています。

China’s New AI Strategy Explained

China’s New AI Strategy Explained

  • 中国政府(発改委・国家能源局)がエネルギー分野へのAI統合を加速すると発表し、2027年までの広範実装と2030年の世界的リーダー化を目標に据えました。
  • 水力・火力・原子力・油ガス・石炭まで全電源でAI活用を進め、需要予測・運転最適化・保守・安全監視を高度化する方針を示しました。
  • 水力では高寒・高地や複雑流域での予測精度と運用最適化を強化し、火力では燃料管理と運転制御を改善して効率と信頼性を高める計画を掲げました。
  • 原子力では早期警報、運転記録の追跡分析、自動起動・停止など安全支援を重視し、核融合の制御予測にもAIを活用する方針を示しました。
  • ロシア産化石燃料の割安調達で短期の供給安定を得つつも、地政学リスクを踏まえ依存を抑え、再エネ加速とAIで「基盤電源の安定化」を狙っています。
  • 中国は太陽光・風力の製造・輸出で攻勢を強め、余剰設備をメキシコやアフリカ諸国などに販売し、AI連携技術で顧客国を囲い込む構図を描いています。
  • 米国は半導体とモデル開発で強みがある一方、公益・インフラ領域での実装が進まず、再エネ容量でも中国に遅れ、国家安全保障上の課題が指摘されました。
  • 米国企業の試行は始動したものの、投資の分散や人材不足でPoC止まりが多く、技術そのものより「適切で一貫した投資設計」の不足がボトルネックになっています。
  • 米中のAI観は対照的で、中国はエネルギーという入力面の強化・最適化に再投資し、米国は生産性向上やコスト削減の即効性に期待し過ぎる傾向があると分析されています。
  • 成否はまだ不明であり、米国側が自国の評価軸で中国を過小評価すると、戦略判断を誤りAI競争で不利になりかねないと警鐘を鳴らしています。

Two days after OpenAI’s Atlas, Microsoft relaunches a nearly identical AI browser

Two days after OpenAI’s Atlas, Microsoft relaunches a nearly identical AI browser

  • MicrosoftはEdgeのCopilot Modeを強化し、タブ横断の要約・比較やフォーム入力、ホテル予約など「Actions」を可能にすると発表しました。
  • 「Journeys」機能によって、開いているタブ間の関連や文脈をたどれるようにし、ブラウジングの流れをAIが把握できるようにしました。
  • 見た目やUXがOpenAIの新ブラウザー「Atlas」と非常に似ており、同週に同コンセプトが並んだことでAIブラウザー競争が一気に本格化しました。
  • EdgeのCopilot Mode自体は7月に正式ローンチしており、今回の発表は機能の再強化と位置づけを明確化した点がポイントです。
  • 実際の差異はUIよりも基盤モデルやOS連携に依存し、ユーザー体験の優劣は「どのモデルがどれだけ正確に行動できるか」で決まる可能性が高いです。

olmOCR – Open-Source OCR for Accurate Document Conversion

olmOCR – Open-Source OCR for Accurate Document Conversion

  • olmOCRはPDFと画像から構造化されたMarkdownを生成し、見出し・段落・表・数式・手書き文字を正しい読順で抽出します。
  • Qwen2-VL-7B-Instructを基盤に微調整し、SGLangやvLLMでの推論最適化により1,000,000ページあたり約$190で処理できます。
  • 「ドキュメント・アンカリング」によりPDF内のテキスト/メタデータをプロンプトに埋め込み、画素+テキストの併用で精度を高めました。
  • 250,000ページの多様データで学習し、人手評価でMarker、MinerU、GOT‑OCR 2.0を上回るELO>1800を達成しました。
  • 完全オープンソースとしてモデル重み、学習データ、学習/推論コード、効率化済みパイプラインを公開しています。
  • マルチGPUでスケールし、よくあるパース失敗やメタデータ不備に対処するヒューリスティクスを備えています。
  • コマンド一発でGPUマシン上で実行でき、バッチ処理や大規模変換ワークロードに適しています。

Work smarter with your company knowledge in ChatGPT

Work smarter with your company knowledge in ChatGPT

  • Slack、SharePoint、Google Drive、Gmail、GitHubなどを接続して、ChatGPTが横断的に情報を収集し、業務に即した回答を出します。
  • 回答には明確な引用元と引用スニペットが付き、ワンクリックで原典へ遷移できるため、根拠を確認しながら意思決定を進められます。
  • 企業内の既存権限を尊重し、ユーザーが閲覧可能な範囲のみを参照します。OpenAIはデフォルトで学習に利用しません。
  • サイドバーで参照中のソースや利用方法を可視化し、完了後に使用ソースの一覧と抜粋を提示します。
  • あいまいな問いに対して複数ソースを突き合わせ、相違点をまとめるなど“決まっていない状況”にも対応します。
  • 時系列の理解に強く、日付フィルターや新しさ・品質指標でソースをランクし、最新状況や特定期間の状況を要約します。
  • 具体例として、顧客ミーティング準備、顧客フィードバックの要約と次アクション提示、リリース計画のToDo整理などに活用できます。
  • 管理面ではRBACでアプリ接続権限を細かく制御でき、SSO/SCIM、IPアロウリスト、監査向けEnterprise Compliance APIに対応します。
  • 現時点の制限として、Company knowledgeを手動オンにする必要があり、オンの間はウェブ検索やグラフ・画像生成が使えません(順次統合予定)。
  • 新コネクタとしてAsana、GitLab Issues、ClickUpなどが追加され、対応ツールは拡大予定です。

Builders, Solvers and Cynics

Builders, Solvers and Cynics

  • 著者はソーウェルの「制約されたビジョン(Builders)」と「制約されていないビジョン(Solvers)」に加え、第三の勢力「Cynics(シニック)」がオンラインで影響力を持ち始めたと指摘しました。
  • Buildersは世の中の制約と蓄積された知恵に敬意を払い、漸進的に作ることを善とすると説明しました。正直さの基準を「fidelity(忠実さ)」と捉えました。
  • Solversは大きな課題を設計して解決することを善とし、意図や動機を重視すると述べました。正直さの基準を「sincerity(誠実さ・善意)」としました。
  • Cynicsは「だまされないこと」を徳とし、未解決の曖昧さや進行中のプロジェクトを嫌悪すると説明しました。正直さの基準を「authenticity(本物らしさ)」と定義しました。
  • 「本物らしさ」至上主義は、未確定な新技術や挑戦を「不誠実(非本物)」と断じやすくし、失敗や後退の瞬間に快楽を感じる模倣的ゲームへ拡散すると分析しました。
  • シニックの心理的核としてフロイトの「投影」や「死の欲動」を援用し、緊張や曖昧さを過去状態に戻して解消しようとする衝動が反進歩に働くと説明しました。
  • シニックは「非常にオンライン」で、過去の技術に博識なため、現在の最前線を巧みに批判できると指摘しました。技術そのものではなく「未解決の最前線」に敵対すると整理しました。
  • 近年はSolversとCynicsの利害が一致しやすく、両者がBuildersへの不満で連帯しうる構図が危険だと警告しました。社会の「正直さ」の規範から「fidelity」が抜け落ちるリスクを示しました。
  • 希望的側面として、BuildersとSolversは共に「不確実性への耐性」を持ち、ここに連携の余地があると述べました。シニックの態度を変える最善策は説得ではなく、プロダクト体験による自己効力感の獲得だと提案しました。
  • 実践的含意として、進歩側はシニックと論争せず、良い製品を届けて使いこなす自信を育てることに集中する重要性を強調しました。

Thread by @Docker

Thread by @oreilly_japan

Thread by @shaneguML

インテル、黒字転換も再建遠く 「先端半導体量産」に顧客は半信半疑 - 日本経済新聞

インテル、黒字転換も再建遠く 「先端半導体量産」に顧客は半信半疑 - 日本経済新聞

  • 2025年7〜9月期にインテルが7四半期ぶりの最終黒字を計上しました。コスト削減とアルテラ株式の一部売却が黒字化に寄与しました。
  • 売上高は前年同期比3%増の136.53億ドル、最終損益は40.63億ドルの黒字となりました。市場予想を上回り、時間外で株価が一時約9%上昇しました。
  • 主因はリストラの進展であり、過去の過剰投資に伴う減損・人員削減費用を吸収しました。
  • 中核と位置づけるファウンドリー事業は依然赤字で、7〜9月期の売上高は2%減の42.35億ドル、営業損失は23.21億ドルでした。
  • 先端ノード「18A」(約2nm級)の生産をアリゾナで開始しましたが、当面は自社製品向けであり外部顧客の量産受託には至っていません。
  • 顧客の信頼が不十分で、エヌビディアは製造委託について「評価継続」と慎重姿勢を示し、インテルCEOも「複数顧客と協議中」と説明にとどめました。
  • 2nm級の量産技術ではTSMC優位との見方が強く、技術呼称が自己申告で比較が難しい中でも量産適性とサービス総合力でTSMCが先行しています。
  • 設備投資規模の差が拡大しており、インテルは2025年約180億ドル、TSMCは400〜420億ドルを計画しています。2026年もインテルは約160億ドルを想定しています。
  • 8月以降に米政府・エヌビディア・SBGから約159億ドルの出資が決まり株価は年末比で約2倍になりましたが、資金調達だけでは技術遅れを解消できません。
  • 再成長には研究開発と設備増強への継続的投資を通じて、性能・歩留まりの実証と顧客信頼の確立が不可欠です。

OpenAIとメタの危うい猛進 SNS・AI融合が混乱の火種に - 日本経済新聞

OpenAIとメタの危うい猛進 SNS・AI融合が混乱の火種に - 日本経済新聞

  • OpenAIが動画生成AI「Sora 2」を搭載したSNSアプリ「ソラ」を提供し、音声付きの高精細動画を簡単に作成・投稿できるようにしました。
  • ユーザー自身を忠実に再現して出演させる「カメオ機能」を売りにし、友人間の創造的コミュニケーションを志向すると説明しました。
  • ドゥームスクロールや依存、偏りなど従来SNSの課題に対して、ウェルビーイング重視や閲覧調整の促しで対抗すると主張しました。
  • 他方で、生成力の高さがディープフェイクの蔓延やカメオの悪用(なりすまし・誹謗中傷)を招く懸念が強いと論じました。
  • 著作権や肖像権の論争が公開直後から発生し、説明や運用の緻密さが不足している印象があると指摘しました。
  • MetaはユーザーとAIの対話内容をコンテンツ・広告表示に活用し始め、体験向上を名目に深層データの収益化が進む懸念があると述べました。
  • ケンブリッジ・アナリティカ事件の教訓やファクトチェック後退などを踏まえ、SNS×AIのデータ利用にはより強い警戒が必要だと主張しました。
  • 子ども保護の強化は評価しつつ、大人にも依存対策や安全策が必要であり、「自己責任」で片付けるべきではないと結論づけました。
  • OpenAI自身も「自由と安全のバランス」を掲げるが、資金調達と高速展開の勢いが安全配慮の不足につながっているように見えると批判しました。
  • AGIを目指す企業には拙速ではなく、透明性・説明責任・段階的導入など「細心」の姿勢が求められると締めくくりました。

世界のテック借金200兆円、10年で4倍 AI投資で膨らむ「バブルの芽」 - 日本経済新聞

世界のテック借金200兆円、10年で4倍 AI投資で膨らむ「バブルの芽」 - 日本経済新聞

  • 世界のテック約1300社の有利子負債は約1兆3,500億ドル(約200兆円)となり、10年前の約4倍に増加しました。
  • 増加の主因はAI向けデータセンター投資であり、ソフト中心の軽資産モデルから重資産型ビジネスへ軸足が移りました。
  • 米オラクルは有利子負債が1,116億ドル、DEレシオが4.6倍となり、4年でAIインフラに5,000億ドル投資を計画しました。
  • 巨大テック5社(MS、メタ、アルファベットなど)の負債は合計4,570億ドルで、10年前の2.8倍に拡大しました。
  • 中国勢も借入が増加し、テンセントは負債が10年前の4.5倍、アリババはデータセンター資金調達で社債を発行しました。
  • 投資家需要が強く、社債発行は好調でしたが、低利調達が続く保証はなく、金利や信用スプレッドの反転がリスクになります。
  • 有形固定資産回転率は平均3.15回へ低下し、資産が膨らむ一方でAI関連収益の立ち上がりは追いついていません。
  • ベンダーファイナンスが広がり、エヌビディア—コアウィーブのように、サプライヤーと顧客の資金循環が複雑化しました。
  • コアウィーブはDEレシオ3.8倍でレバレッジ依存度が高く、GPU陳腐化や評価減で資金繰りが悪化する懸念があります。
  • 全体の約9割は返済に耐え得る財務基盤を持ちますが、過大レバレッジの企業は景況悪化時に淘汰リスクが高まります。

AI席巻のアメリカ、ブルーカラーを選ぶ若者たち 電気料金2倍が現実に - 日本経済新聞

AI席巻のアメリカ、ブルーカラーを選ぶ若者たち 電気料金2倍が現実に - 日本経済新聞

  • AIの進展により大卒若年層の就職が難しくなり、職業訓練校への入学が前年比12%増と急伸しました。
  • 20〜24歳の失業率が9.2%まで上昇し、特にソフトウエア開発などAIに代替されやすい領域で雇用が約20%減少しました。
  • データセンター投資が加速し、建設・発電分野に労働力と資金が集中して他産業を圧迫する「クラウディングアウト」が発生しています。
  • データセンター由来の電力需要増で電気料金が上昇し、データセンター近接地域では過去5年で倍増する例が見られました。
  • 北東部では28年までに家庭の電気料金が月約70ドル(約¥10,500)増えるとの予測があり、石炭火力の延命が進んで脱炭素に逆行しています。
  • 米政府は中国との競争を背景にAIの開発スピードを重視し、著作権や安全性などのルール整備が後回しになるリスクが指摘されています。

円建てステーブルコイン「JPYC」、27日から発行 - 日本経済新聞

円建てステーブルコイン「JPYC」、27日から発行 - 日本経済新聞

  • JPYCが27日から発行を開始し、1JPYC=1円の価格連動を目指す設計になっています。
  • 購入はJPYCのサイトで申し込み、銀行振込を行うと平日日中は概ね10分以内にウォレットへ反映されます。
  • 利用には秘密鍵を自分で管理するウォレットが必要で、MetaMaskなどのアプリが代表的な選択肢として挙げられています。
  • 大阪・関西万博の「EXPO2025デジタルウォレット」が11月からJPYCに対応し、暗号資産購入やレンディングも可能になる見込みです。
  • ナッジなど国内フィンテック企業がJPYC決済対応を進めるなど、周辺サービスの拡大が始まっています。
  • 世界ではUSDCやUSDTが市場を牽引し、米国では7月にステーブルコインの包括法(通称「ジーニアス法」)が成立して制度整備が進んでいます。
  • 日本ではメガバンク連合も共同発行に動きつつ、低金利や既存金融の利便性の高さが普及のハードルとして指摘されています。