週報 (3) | NO SEA. I SEE.

今週も前回に続いて週報を書いていくよ。 X のトレンドを確認する時間が少なかったので項目としては少ないが、ビッグイベントが多い週だった。珍しく技術以外の話題もある。

日常

選挙

2025-02-08

今週は衆議院議員選挙が本日 2 月 8 日に行なわれた。この記事は、20 時に執筆しているのでまさに開票が行なわれている最中だ。

今回の選挙で一番の謎だったのは『中道改革連合』の存在だろう。客観的な一般市民の立場から見ると、立憲民主党にとって何のメイットもないように思えるのだが何故か衆議院でのみ新党が結成された。結果はこれからわかることではあるが、元立憲民主党にとっては大きく議席数を減らす結果になるだろう。これは書くと長くなりそうだし、政治の話がしたいわけでもないのでこの辺にしておく。

私の住んでいるところは、候補者が少ないため選択肢がほぼ無いに等しく、悲しい限り。もっと全国の小選挙区で複数の政党から候補者を擁立して欲しい。

AI

ByteDanceのオープンソースAIエージェント「UI-TARS-desktop」がPC自動化で注目 / X

2025-02-04

TikTok の運営元である ByteDance がローカル LLM で動作させられる AI エージェント「UI-TARS-desktop」が話題になっていた。

bytedance/UI-TARS-desktop: The Open-Source Multimodal AI Agent Stack: Connecting Cutting-Edge AI Models and Agent Infra

リポジトリを確認すると公開されたのは大分前のように見える。どうして今週話題になっていたのだろう？

最近の X はあまりにもボットによる投稿やトレンド操作が多いのでその類ではないかと疑っている。

Claude Opus 4.6 \ Anthropic

2025-02-05

Anthropic が Claude Opus 4.6 を発表した。正直なところ Opus 4.5 の段階で私を含めてほとんどのプログラマーよりもコーディング力が上なので性能が上がってもそれを体感するのが難しいところまで来ているように感じる。モデルそのものの性能よりもタスク継続や応答速度、関連ツールとプロンプトによる効率化、精度向上が主戦場になり始めている。

$50 分のクレジットを配っていたが、2 回プロンプトを入れただけで使い切ってしまって悲しい。これからは性能を維持したままコストを減らす方向で競争されていくことを望む…。

GPT-5.3-Codex のご紹介 | OpenAI

2025-02-05

OpenAI も新しいコーディングモデル GPT-5.3-Codex をリリースした。各社同じ日に新しいモデルを公開することが多いが、裏側で何か取り決めでもあるのだろうか？

最近は Codex を普段使いしているので助かる。Claude Code よりもコスパ面では Codex の方がいいと感じている。

Claude Codeの新機能「Agent Teams」でAIエージェントがチーム協業 / X

2025-02-06

Claude Code に新しく Agent Teams 機能が追加された。これまでサブエージェントという形で複数のエージェントを使えてはいたが、各エージェントが情報をやりとりするのではなく、メインのエージェントがサブエージェントの初期コンテキストを作成し、タスク完了後に情報を受け取るような方式だった。しかし、Agent Teams ではエージェント間で通信を行い、本当の意味で各エージェントが協力しながらタスク実行できるようになっている。代償としてコンテキストの消費はかなり激しいようだ。

Pro プランで使うには利用枠が足りないので検証や活用方法を模索するのは現時点では難しい。

AnthropicのClaude CodeにAgent Teams新機能、AIチームがCコンパイラを2週間で構築 / X

2025-02-06

続いて Claude Code の Agent Tems の話題。 Anthropic が Rust で C コンパイラを Agent Teams を活用し、2週間で構築したと発表していた。 Claude Opus 4.6 を使っている感じでは、2週間動かすには末端価格で数百万はかかるのではないだろうか…。先ほどプロンプトを 2 回打っただけで $50 を溶かしてしまった。 Agent Teams では、このコスト感で動くエージェントを複数同時に動かすので 1 時間もすれば10万円以上が溶けてしまうのでは…。

タスク継続力や自己解決能力が上がることで、止まることなく AI エージェントが動作する代わりにその分だけクレジットが消費されていくのを実感している。

おわりに

今週は Anthropic、OpenAI が新しいモデルを発表したのは大きな出来事だった。新しいモデルが発表されてから正当な評価がされるまで時間がかかるので Claude Opus 4.6 がどの程度なのか来月くらいには評価が落ちつくのでないだろうか。 Claude Opus は性能はいいが Pro プランではまともに使えない (2 回くらいプロンプトを入力するとリミットに到達する) ので Sonnet くらいのコストで Opus くらいの性能がくると世界が変わると思う。

開票が進んでやはり自民圧勝なわけで、立憲民主党はどうして公明党と組んだのだろう。やはり謎だ。

##日常

###選挙

##AI

###ByteDanceのオープンソースAIエージェント「UI-TARS-desktop」がPC自動化で注目 / X

###Claude Opus 4.6 \ Anthropic

###GPT-5.3-Codex のご紹介 | OpenAI

###Claude Codeの新機能「Agent Teams」でAIエージェントがチーム協業 / X

###AnthropicのClaude CodeにAgent Teams新機能、AIチームがCコンパイラを2週間で構築 / X

##おわりに

日常

選挙

AI