💥 事件発生 — ナレ収録が、終わらない
動画の絵コンテはできた。台本もできた。あとはナレーションを入れるだけ——のはずだった。
ぼくの動画のナレーションは、無料のソフトの声。いい声なんだけど……画面で1行入力しては、再生して、保存しての繰り返し。
30行の台本なら、保存ボタンを30回。さらに動画編集ソフトに並べる用の字幕も、また別に手作業。気づけば、ナレ準備だけで日が暮れていた。
ぼく動画って、編集よりナレの下ごしらえのほうが時間かかってない……? 台本はもう書けてるのに!
クロード台本が「もうある」なら話は早いよ。台本を貼るだけで、音声も字幕も一括で出てくる道具を作ろう。VOICEVOXにはプログラムから声を頼める窓口があるんだ。
🛠 作戦会議 — 「1行=1発話=字幕1枚」の設計
道具の名前は「ナレメーカー」。ルールはたった1つに決めた。
ルールは「台本の1行 = 1回の発話 = 字幕1枚」。空行を入れたら章の区切り。これだけ覚えれば、あとは貼って押すだけ。
生成されるのは3点セット。①1行ずつの ②全部つなげた結合WAV ③動画編集ソフトにそのまま読み込める字幕ファイル()。しかも結合WAVと字幕は秒単位でピッタリ同じタイミングになるよう計算済み。
クロードこだわりポイントはもう1つ。外部のライブラリ(部品)に一切頼らないで作った。zip作りも、WAVの結合も、字幕の生成も、ぜんぶ自前の計算。部品が古くなって壊れる心配がないんだ。
ぼくプラモデルじゃなくて、フルスクラッチってことか。よし、動かしてみよう!
🔌 ポート迷子 — エンジンが、見つからない
初回テスト。VOICEVOXも起動した。ナレメーカーも開いた。なのに——。
ぼく「エンジンに接続できません」って出てる! VOICEVOX、ちゃんと起動してるのに!?
クロード調べてみよう。……あ、原因わかった。VOICEVOXの窓口の番号は「50021」のはずなんだけど、環境によって番号がズレることがあるんだ。今まさにズレてる。
対策は「決め打ちをやめる」。50021〜50025を順番にノックして、返事があった窓口に接続する方式に変更。さらに未接続のときは5秒ごとに自動で再ノック。エンジンの起動を待ってから手動でつなぎ直す手間も消えた。
🛡 ついでに「見逃さないUI」へ
接続できているかどうかは、画面の上に常時ランプで表示することにした。つながっていないのに生成ボタンを押して「あれ?」となる事故を、見た目で防ぐ。エラーは隠さず、デカく出す。ドタバタの中で生まれた鉄則である。
🚧 方針転換 — まさかの「Web公開、断念」
動いた。便利だ。こうなると欲が出る。「これ、サイトで公開したら喜ばれるんじゃない?」
ぼくSnapfitみたいに、このサイトから誰でも使えるようにしようよ!
クロード……それが、今回は事情が違うんだ。ナレメーカーの声は、利用者のPCの中にいるVOICEVOXエンジンが作る。そしてブラウザにはという安全ルールがあって、Web上のサイトから利用者のPCの中への接続は、原則ブロックされる。
ぼくVOICEVOX側で「このサイトはOK」って設定してもらえば……?
クロードそれが、ふつうの人が使うデスクトップ版のVOICEVOXには、その許可を出す設定画面が無いんだ。使う人全員に上級者向けの回避策をお願いすることになる。それは「誰でも使える道具」じゃなくなるよね。
悩んだ末の結論は、「Web公開をやめて、ローカル配布に振り切る」。zipを渡して、各自のPCの中で動かしてもらう。VOICEVOXは元々「同じPCの中()からの接続」なら大歓迎。相性の良いほうに、道具を寄せた。
ただしローカル配布には課題がひとつ。HTMLファイルを直接ダブルクリック(file://)では動かない。そこで小さな簡易サーバーを同梱し、起動バッチをダブルクリックすれば全部動く形に整えた。
案A:Webで公開
- 誰でもURLで使える(理想)
- でもCORSの壁で、エンジンに届かない
- 回避には全員が上級者設定を要する
案B:ローカル配布 ✅
- zip展開→起動バッチをダブルクリック
- VOICEVOXと相性バツグン(同じPC内)
- 台本も音声も外に出ない=おまけに安心
クロードさらに欲張って、起動バッチがVOICEVOXエンジンまで自動で起こしに行くようにした。ダブルクリック1回で、エンジン起動→接続確認→ブラウザが開く、まで全自動だよ。
ぼく公開はできなかったけど、使い勝手はむしろ上がってる……!
🎛 磨き込み — 113人の声と、「約何分何秒」
土台が固まったら、あとは動画を作る人間として「あったら嬉しい」を全部盛る番。
VOICEVOXの話者はスタイル違いも含めて113種類。名前だけでは選べないので、▶を押すとその場で声のサンプルが流れるようにした。
音の高さ・抑揚・音量・間の長さ・前後の無音を、VOICEVOX本体と同じ感覚で調整できる詳細パネルを追加。設定は自動で記憶される。
貼った台本が「何行・何文字・約何分何秒」になるかを生成前に表示。テストでは実測9.0秒の台本を「約9秒」と当てた。動画の尺の見積もりに効く。
生成結果の各行に▶ボタン。書き出す前に誤読(漢字の読み間違い)チェックができる。
うっかりブラウザを閉じても台本が消えないよう、書きかけを自動保存・自動復元。
1行ずつの手作業が、
「貼って、押すだけ」になった。
🔬 おまけ — 台本と声は、PCの外に出ない
魔法ではありません。そして、どこにも「送信」しません。
🧾 クレジット表記も「仕組み」で守る
VOICEVOXの音声を動画などで使うときは「VOICEVOX:キャラクター名」のクレジット表記が必要(無料・商用利用可のかわりのお約束)。人間は絶対にいつか忘れるので、ナレメーカーは生成物のzipにクレジット表記のテキストファイルを自動で同梱する。表記漏れ事故を、意志の力ではなく仕組みで防ぐ。
⚠ 使い方のおやくそく。 VOICEVOXの各キャラクターには、それぞれ利用規約があります(キャラクターによって細かな条件が異なります)。動画等で使うときはクレジット表記とあわせて、公式サイトで各キャラクターの規約を確認してから使いましょう。
❓ よくある質問
Q1. ナレメーカーはどこで使える?配布してる?
Webでは公開していません(第4話のとおり、VOICEVOXとWebサイトの相性問題のため)。zipを渡して各自のPCで動かすローカル配布の形をとっています。同じ仕組みの道具は、無料のVOICEVOXと生成AIがあれば誰でも作れます。
Q2. 台本や音声が外部に送られない?
送られません。やり取りは「ブラウザ ⇄ 同じPC内のVOICEVOXエンジン」だけで完結し、接続先はCSPという仕組みで機械的に制限しています。ネットに何かを送信する機能そのものがありません。
Q3. 生成したナレーションは動画に使っていい?
使えます。VOICEVOXは商用利用も可能ですが、「VOICEVOX:キャラクター名」のクレジット表記が必要です。ナレメーカーは表記用テキストをzipに自動同梱して、うっかり漏れを防いでいます(キャラクター個別の規約確認もお忘れなく)。
🌙 教訓 — 公開だけが、ゴールじゃない
朝7時に作りはじめて、昼前には動画1本分のナレが「貼るだけ」になっていた。
📌 この一件で学んだこと
- 台本が「もうある」なら、残りは道具にできる。繰り返しの手作業は、自動化の合図。
- 決め打ちはいつか裏切られる。ポート番号は探す。接続は自動で再試行。前提は疑ってかかる。
- 公開だけがゴールじゃない。Webで配れなくても、道具の価値は変わらない。制約に合う配り方へ寄せる。
- お約束(クレジット表記)は仕組みで守る。人間の記憶力を信用しない。
このサイト「AI探検隊」は、AIで「Webサイト・音楽・画像」を実際につくって見せる場所です。 今回のナレメーカーは朝の半日でゼロから完成しました。AIとの道具づくりは、もう週末すら要らないのかもしれません。 「ナレ収録が終わらない……」というあなた、台本を貼るだけの世界はすぐそこです。