spacevision

ガジェット好きのアマチュアサイクルフォトグラファー

音声入力でブログは書けるのか。ChatGPT相手に試してみた。

音声入力は、正直ちょっと半信半疑だった。

勝間和代さんがポッドキャストで、
「文章を書くときに音声入力をかなり活用している」という話をしていた。
メルマガのような長めの文章も、まずは音声で話し、それを文字起こしして原稿にしていくのだという。

なるほど。理屈は分かる。
分かるのだが、実際に自分がやるとなると少し抵抗がある。

一人でスマホに向かって、ずっと独り言をしゃべるわけである。
冷静に考えると、まあまあ怪しい。

ただ、試さずに否定するのも違う。
ということで、ChatGPTの音声入力を使って、実際に2分ほどしゃべってみた。

2分しゃべるだけで、意外と文章量は出る

やってみて最初に思ったのは、

「あれ、意外としゃべれるな」

ということだった。

キーボードで文章を書くときは、どうしても最初から整った文章にしてしまう。
書き出しを考え、言い回しを選び、ちょっと書いては戻り、また直す。

その点、音声入力は雑でいい。
頭に浮かんだことを、そのまま口に出せばいい。

もちろん、話している途中で言い直す。
脱線もする。
同じことを何度も言う。
「えー」とか「なんか」とか「まあ」も大量に入る。

でも、それでいいのだと思った。

音声入力の価値は、きれいな文章を一発で作ることではない。
頭の中にあるものを、とりあえず外に出すことにある。

これは結構大きい。

キーボードより、話す方が思考に近い

今回試してみて、少し感覚が変わった。

私は普段、ブログを書くときも、仕事の文章を書くときも、
基本的にはキーボードで考えている。

考えながら打つ。
打ちながら考える。

それが普通だと思っていた。

でも、実際には「考える速度」と「打つ速度」は一致していない。
キーボード入力は、思考に対して少し遅い。

その遅さが悪いわけではない。
むしろ、整理しながら書けるという意味ではメリットもある。

ただ、レース観戦直後の感想や、現地で感じた空気感のようなものは、
帰宅して、写真を取り込み、選別して、現像しているうちに、

「あれ、あの時なにを感じたんだっけ」

となる。

これがもったいない。

サイクルロードレースの観戦記で大事なのは、リザルトの説明ではない。
どこで見たのか。
どの瞬間に空気が変わったのか。
どの選手の動きに引っかかったのか。
なぜその場所でシャッターを切ったのか。

そういうものは、現地にいた直後の自分が一番よく覚えている。

ならば、帰る前に数分だけしゃべっておく。
これはかなりアリだと思った。

ただし、音声入力は完成原稿ではない

一方で、ここを勘違いすると危ない。

音声入力で出てきた文章は、完成原稿ではない。

実際、文字起こしされた文章を見てみると、かなり散らかっている。
話は前後するし、同じことを何度も言っているし、言い回しも粗い。

そのままブログに貼ったら、たぶん読みにくい。

つまり、音声入力は「執筆」ではない。
あくまで「素材採取」だ。

ここを分けて考えた方がいい。

音声入力でやるべきことは、完成度の高い文章を書くことではない。
その時にしか出てこない感情や違和感、現地の記憶を捕まえること。

魚をさばく前に、まず釣ってくるようなものだ。
釣った魚をそのまま皿に置いても料理にはならない。
でも、釣らなければ何も始まらない。

音声入力は、その「釣る」部分に向いている。

ChatGPTに評価されて、少し違和感があった

今回、音声入力した内容をChatGPTに投げてみた。

すると、ChatGPTは内容を整理したうえで、

「ここは良い」
「ここは注意した方がいい」
「この使い方なら有効」
「ただし運転中は危ない」

という感じで返してきて、少し違和感があった。

いや、今回はただ試しにしゃべってみただけなんだけど。
いきなり評価されてもなあ、という気持ちである。

こちらとしては、まずは清書してほしかった。
余計な評価はいらない、という感覚も少しあった。

ただ、話しているうちに分かった。

これはChatGPTの使い方を間違えると、そう感じるのだ。

ChatGPTを単なる清書係として使うなら、評価は邪魔になる。
しかし、壁打ち相手として使うなら、評価はむしろ必要になる。

清書係ではなく、壁打ち相手として使う

今回いちばん納得したのはここだ。

音声入力で思いついたことをしゃべる。
それをChatGPTに整理させる。
その整理結果を見て、自分が違和感を持つ。
違和感をもとに、もう一度考える。
最後に自分で書き直す。

この流れがいい。

ChatGPTに全部任せると、たぶん文章はそれなりに整う。
でも、それは「それっぽい文章」になるだけだ。

読者が読みたいのは、きれいに整った一般論ではない。
その人が実際に見て、感じて、考えたことだ。

だから、ChatGPTは清書係ではなく、壁打ち相手として使う方がいい。

自分の話した内容のどこが面白いのか。
どこがくどいのか。
どこに主張があるのか。
どこを削れば読みやすくなるのか。

それを一度、外から見てもらう。

そのうえで、最後は自分で判断する。

ここを手放してはいけない。

サイクルロードレース観戦記とは相性が良さそうだ

この使い方は、サイクルロードレース観戦記とかなり相性が良さそうだ。

レースを見終わった直後は、頭の中にいろいろ残っている。

あの逃げは良かった。
あの選手の表情が印象的だった。
あのコーナーは撮影しやすかった。
逆に、あの場所は思ったより難しかった。
観客の雰囲気が去年と違った。
会場の導線が良かった、あるいは悪かった。

こういう情報は、あとから思い出そうとしても抜ける。

特に写真を撮っていると、帰宅後は写真選別に意識を持っていかれる。
1万枚、2万枚と撮った日には、もうそれだけで一仕事である。

その前に、観戦直後の自分にしか残っていない言葉を拾っておく。
これは記事の質を上げると思う。

リザルトは誰でも書ける。
公式情報も誰でも拾える。

でも、「その場にいた自分が何を見たか」は、自分にしか書けない。

そこを音声入力で残せるなら、かなり強い。

とはいえ、運転中にやるものではない

ただし、これも大事。

車の中でしゃべれるからといって、運転中に長々とやるのは違う。

音声入力は手で打つより安全に見える。
しかし、頭の中ではかなり文章を組み立てている。

レース展開を思い出し、構成を考え、言葉を選びながら話す。
これは普通に注意力を使う。

だから、やるなら出発前の家の駐車場。
それから途中のサービスエリア。
レース会場を出る直前の駐車場。

「忘れる前に残す」ことが目的であって、運転中まで作業することが目的ではない。

結論:音声入力は、思考を捕まえる網である

今回試してみて、音声入力への見方が少し変わった。

音声入力は、ブログを自動で書いてくれる魔法の道具ではない。
完成原稿を一発で出すものでもない。

でも、思考や記憶を新鮮なうちに捕まえる道具としては、かなり使える。

特に、サイクルロードレース観戦後のように、現地で感じたことが時間とともに薄れていく場面では有効だ。

話す。
文字にする。
ChatGPTに整理させる。
違和感を見つける。
最後は自分で書く。

この流れなら、ブログ執筆はかなり変わるかもしれない。

音声入力は、執筆そのものではない。
思考を捕まえるための網である。

そしてChatGPTは、その網にかかったものを見ながら、

「これは残すべき」
「これは捨てていい」
「ここに本音がある」

と一緒に仕分けしてくれる壁打ち相手。

そう考えると、これは単なる時短ツールではなく、ブログを書く前の“記憶の回収装置”なのかもしれない。

これは、次の観戦後にも試してみたい。