<< DN 2025-10-27 | DN 2025-10-29 >>

Thread by @iwashi86

Thread by @thinkymachines

Thread by @github

Thread by @tmiyatake1 - X (formerly Twitter)

Thread by @tmiyatake1 - X (formerly Twitter)

AI Integration Is the New Moat - O’Reilly Media

AI Integration Is the New Moat

  • 優れたAIチャットボットがあっても、情報が次の担当者やシステムに引き継がれなければ顧客体験は改善しないと指摘しています。
  • ガス会社の例では、記録連携やフォローアップのワークフローが欠けており、AI以前に基盤の業務設計が破綻していると描写しています。
  • 「AIはノーマルテクノロジー」であり、魔法ではなく、既存の業務・データ基盤と再設計して使って初めて成果につながると論じています。
  • 競争優位の源泉はモデルの知能ではなく、組織のシステムと人間の仕事にAIを統合する力だと結論づけています。
  • 統合には、データ共有、権限設計、責任の引き継ぎ、例外処理の運用など、面倒だが継続的な組織変革が必要だと示しています。

Build AI Agents with MongoDB - Atlas - MongoDB Docs - MongoDB Documentation Team

Build AI Agents with MongoDB - Atlas - MongoDB Docs

Build beautiful frontends with OpenAI Codex - YouTube

  • Codexはコード補完に留まらず、画像(スケッチやスクリーンショット)を理解し、意図したUIを生成する能力を備えていると説明されました。
  • モデルは自分でブラウザを開き、スクリーンショットを撮って見た目を確認し、差分修正を繰り返す「自己チェックのループ」を実行できると紹介されました。
  • 3D地球儀(Three.js)を用いたホーム画面の再設計を、手描きスケッチ+指示から自動実装し、PR作成とローカル検証まで行ったデモが示されました。
  • 追加画面「Travel Log」のデザインでは、デスクトップとモバイルの両方のスクリーンショットを撮影し、レスポンシブ表示の破綻を自動チェックしたことが強調されました。
  • Playwright MCPやクラウド上のブラウザツールを使い、ローカルでもクラウドでも同様のエージェント的開発ループを構築できると説明されました。
  • ホワイトボードの粗いスケッチからFigmaレベルの具体画まで、入力の精度に応じてUI実装の忠実度を調整できる柔軟性が示されました。
  • オープンデータ(NYCタクシー)を読み込み、一次的な可視化ダッシュボードを素早く生成する「使い捨てWebアプリ」作成のユースケースが紹介されました。
  • ライト/ダークモードや複数ブレークポイントでの外観チェックをプロンプトに含め、PR前の自動検証に組み込める実践例が挙げられました。
  • フロントエンドだけでなく、今後はモバイルやデスクトップアプリ開発にも同様のマルチモーダル自己チェックを広げていく展望が語られました。

週刊生成AI with AWS – 2025/10/20 週 - Amazon Web Services

週刊生成AI with AWS – 2025/10/20 週

Build AI Agents with MongoDB - Atlas - MongoDB Docs - MongoDB Documentation Team

Build AI Agents with MongoDB - Atlas - MongoDB Docs

Non-obvious pricing advice for startups - Product for Engineers

Non-obvious pricing advice for startups

  • 価格モデルはプロダクトの使われ方と顧客体験を規定するため、ICP(理想顧客像)から逆算して設計します。
  • 無料で配るより何でもよいので課金を始めることで、支払う顧客から本質的な学びを得られます。
  • 価格は間違える前提で頻繁に改定し、価値提供と請求単位の整合性を高め続けます。
  • フリーティアは原則を明文化し、口コミ促進・競合より寛大・粘着性向上の要素を適切に無料化します。
  • 課金と請求は必ずボトルネックになるため、専任体制と柔軟・高信頼の仕組みを内製または強化します。
  • 「単純さ」より「予測可能性と透明性」を重視し、料金ページ・使用量可視化・上限設定・返金ポリシーを整えます。
  • 価格変更時は十分な予告・猶予・割引・旧価格維持の選択肢など、丁寧な顧客コミュニケーションを行います。

Claude for Excel - @claudeai

Claude for Excel

  • Claudeはワークブック全体を読み取り、シートや複数タブに跨る依存関係やネストした数式を把握して説明します。
  • 各説明にはセル単位の参照(セルレベルの引用)を含め、根拠を検証しやすくします。
  • 前提条件を変更しても数式や依存関係を保ったまま全体へ反映し、変更箇所をハイライトしながら影響を説明します。
  • REF!、VALUE!、循環参照などのエラーを発生源までトレースし、修正方法を提示します。
  • 要件に基づくドラフトの財務モデルを新規作成したり、既存テンプレートへ最新データを流し込みつつ構造と数式を保持します。
  • 数式・構造・フォーマットの整合性(Formula integrity)を重視し、変更をリアルタイムに可視化します。
  • 企業向けのコンプライアンス枠組みに沿って動作することを想定したエンタープライズセキュリティを掲げています。
  • 具体的な問いかけ例として「Q3売上予測の前提は何か」「成長率+2%で終価への影響を示す」「G145のNPVが#VALUE!の理由は何か」などを想定しています。
  • 現在はベータのリサーチプレビュー段階で、ウェイトリスト登録が案内されています。

DGX Sparkと「nanochat」でゼロから丸一日学習させてLLMを自作してみた - Zenn

DGX Sparkと「nanochat」でゼロから丸一日学習させてLLMを自作してみた

  • nanochatは約$100・約4時間でChatGPT風の対話LLMをゼロから学習できる実験的ソフトとして公開され、トークナイザ学習から始めるのが特徴だと説明しました。
  • クラウドでは$100相当かかる学習を、DGX Spark(1 PFLOP、128 GBメモリ)上で約21時間かけて電気代のみで実行できたと報告しました。
  • 学習フローは「トークナイザ→事前学習→中間学習→教師ありSFT」で、オプションでRLも可能だと述べました。
  • DGX Spark向けにspeedrun.shを改変し、セットアップの分離、バッチ/イテレーション調整、評価の省略で安定動作させたと説明しました。
  • NUM_ITERATIONS=1000で対話が成立し、100では会話にならないため、反復回数が品質に直結することを示しました。
  • 学習後はpython -m scripts.chat_webでWeb UIを起動し、0.0.0.0:8000にアクセスして動作確認できると案内しました。