コンテンツへスキップ
  • About MapleHarp AI Labs
MapleHarp AI Labs

家庭内AIクラスタとローカルLLMの研究室

  • ホーム
  • About MapleHarp AI Labs
MapleHarp AI Labs

家庭内AIクラスタとローカルLLMの研究室

  • 自作AI基盤

家庭内AIクラスタに自己修復機能を入れた ― Dead Worker Retry と per-worker キュー設計

この記事では、Worker死亡・ゾンビタスク…

  • Hiro
  • 2026年6月2日
  • 自作AI基盤

Web検索Workerを常駐化し、「最新情報が必要な質問」を自動でWeb検索に回す

この記事では、Web検索WorkerをsystemdでA…

  • Hiro
  • 2026年6月1日
  • 自作AI基盤

ローカルLLMにWeb検索を追加する — SearXNG + Workerで自前RAG前夜を実現

この記事では、SearXNGをDockerでローカル…

  • Hiro
  • 2026年5月31日
  • 自作AI基盤

GPUタスクはGPU Workerへ — Redisキュー分離とcapability routingで能力ベースのLLM振り分けを実装する

この記事では、RedisキューをGPU用・CPU用…

  • Hiro
  • 2026年5月30日
  • 自作AI基盤

OpenWebUIからローカルLLMクラスタをつなぐ — Pipe FunctionとWorker実負荷ルーティングの実装

この記事では、OpenWebUIのPipe Function…

  • Hiro
  • 2026年5月28日
  • 自作AI基盤

WSL2のOllamaをLAN公開する — 固定IP・systemd・nvidia-smiのハマりどころ全部まとめ

この記事では、WSL2上のOllamaをLAN内の他…

  • Hiro
  • 2026年5月26日
  • 自作AI基盤

1BモデルでLLMの問いをcode/math/japaneseに分類する — 軽量ドメイン判定の実装

この記事では、1BパラメータのLFM2.5モデ…

  • Hiro
  • 2026年5月24日
  • 自作AI基盤

複数モデルを速度・ドメイン適性でスコアリングして自動ルーティングする仕組み

この記事では、複数のローカルLLMモデルを…

  • Hiro
  • 2026年5月23日
  • 自作AI基盤

OllamaタスクをRedisキューで非同期処理する — ローカルLLM推論の並列化設計

この記事では、OllamaへのAI推論タスクをR…

  • Hiro
  • 2026年5月21日
  • 自作AI基盤

自宅サーバーでOllamaを動かす — ホームラボ分散AI推論基盤の作り方【第1回】

この記事では、自宅の余っているPCにOllam…

  • Hiro
  • 2026年5月17日
前へ
1 2 3

最近の投稿

  • 会話メモリ producer のライブ給餌で項目6を完全クローズ ── そして「引き継ぎ資料より実機を見る」規律が二重実装を防いだ話
  • 会話メモリを実装したのに、同じスレッドで「この市」が通じなかった ― クロスセッション記憶とライブ文脈は別物だった話
  • AIは会話を覚えていた。でも“どの会話か”は記録していなかった ― thread_id が producer まで届かず、スレッド記憶の通り道が静かに死んでいた話と、ライブ給餌での解決
  • AIに会話の記憶を思い出させたら、その思い出を“また記憶”するループ寸前だった ― 会話メモリ consumer と、原文/注入版を分けてPGを汚さない設計
  • 会話を覚えるAIに『何を覚えないか』を先に教えた ― 抽出モデル6本の計測バトルと、few-shotが弱いモデルを壊した話

最近のコメント

表示できるコメントはありません。

アーカイブ

  • 2026年6月
  • 2026年5月

カテゴリー

  • 自作AI基盤
Copyright © 2026 - WordPress Theme by CreativeThemes