秋桜舎

実務翻訳・翻訳支援技術・英語講習・日本語講習

文章処理の小技(0.2版)

日外アソシエーツ様のメールマガジン「読んで得する翻訳情報マガジン」で「山本ゆうじの翻訳道具箱」を連載していました。


秋桜舎の密かな人気コーナー、主にOffice文書と文章処理に関する、ちょっと便利かもしれない技術的な情報です。ここでのOfficeとは基本的にMicrosoft Office 2000/XP/2003です。 応用が利くテクニックもありますが、それ以前、以後のバージョンでは適用できない可能性もあります。もっといい方法があるよ、という方はお知らせいただければ幸いです。ちなみに金のかかる方法はあったとしてもあまり紹介していません。また一切の保証はありませんので、情報のご利用は自己責任でどうぞ。

Windowsキーについての誤解

あるキーボード屋の店員が「できる方はWindowsキーのないキーボードを選びますよ」と真顔でいっていました。よくある勘違いです。「Windowsキーのないキーボード」はいかにも事情がわかった人が買いそうです。ですが、Windowsキーとアプリケーションキーは、ゲーマーはともかく、ビジネスユーザーが正しく使いこなせば、能率化に大きく貢献します。通常のショートカット(Windowsのヘルプを参照)はもちろん、キーボードランチャーと組み合わせて、さまざまなスクリプトをキーボードから一発起動する際には欠かせません。あまり使ったことのない人は研究してみてはいかがでしょうか。

IME――ATOKの推測変換ほか

私は長年ATOKは使用してきませんでしたが、ATOK15になって初めて本格的に使用するようになりました。ATOK15もMS-IME2002もほとんど似たような機能を備えていますが、いくつかの点ではどちらかにしかない機能というものがあります。ATOK15の推測変換機能はMS-IMEにはない機能で、これまでのところ非常に役に立っています(この機能はATOK15以前からあるようです)。携帯電話の文字入力と同じように一度入力したことがある語句を再利用できる機能です。ただしATOK15ではOffice XPの音声認識が使えないため、常にATOK15を使用しているわけではなく、場合によっては切り替えて使っています(たとえば、この文書の入力には音声認識を使用しています)。言い方を変えれば、ATOKはMS-IMEと比較して、推測変換機能と、変換精度がわずかに良いかもしれないという点の二つしか、目に見えて優位な点はないともいえます。ただし推測変換機能は、それだけでもATOKを使用する理由になるほど便利なものです。今後のIMEには必須の機能だと思います。

ATOK15の問題点としては、再変換に専用の辞書を使っているため、再変換するときにすべての候補が使用できないという点があります。ATOKにもカタカナ語英語辞書がありますが、MS-IMEでは英語→カタカナへの変換もできるのに対し、ATOKではカタカナ→英語の変換しかできません。英語→カタカナ変換は、英日翻訳でけっこう役立つことがあるので、これは非常に残念です。

えっ? まだ「ダブルクリック」を使ってるの?

パソコン初心者がつまずく大きな原因だったダブルクリック。Windowsの設定を変えれば、ダブルクリックはほとんどしなくてすみます。エクスプローラの[ツール]→[フォルダ オプション...]で変更できます。上級者の方でも、ファイルを開くときはダブルクリックする方はけっこう多いでしょう。でも本当は、矢印キーで開くファイルを選択し、Enterキーで開く方が、ずっと早く、楽で、間違いも少ないです。指にかかる緊張を大きく減らせます。新しい操作方法は、慣れるまでたいへんかもしれませんが、これから何年も使うやり方であれば、よいやり方を身につけたいものです。

UI設計では、「ダブルクリックでも操作できる」のはともかく、「ダブルクリックでしか操作できない」インターフェイスは避けるべきだと考えています。

マウス、ポインティング・デバイスについて

パソコンを長時間使用する人は、長期的に考えると、指への負担は可能な限り減らすことを考えた方がいいでしょうね。

まず、それぞれのソフトのキーボードのショートカットを覚えることによって、マウス操作を減らせます。 基本的な操作のショートカットはソフト間で共通するものも多く(たとえば保存はCtrl+Sなど)、一度覚えると他のソフトに使えることもあります。

マウスのドライバでクリック・ロック機能を使うと、指にかかる負担がかなり減ります。ドラッグしている間にボタンを押し続けたままにする必要がなくなるわけです。切手などをつまもうとするときに、指先をなめてから「ぺたっ」とくっつける感じです(私は実際にはしませんが)。選択範囲の指定も楽です。ただし全部のマウスで、この機能が使えるわけではありません。慣れは必要ですが、いったん慣れるとその便利さが分かります。

私は、右手にMicrosoft TrackBall Explorer、左手にIntelliMouse Opticalを使っています。どちらも5ボタンですが、追加のボタンの機能では「コピー」と「貼り付け」、ホイールのクリックには「閉じる」をあてています。さらに、場合によってはタブレットを使います。

音声認識の併用も、指への負担を減らせます。ただし、カタカナ語の認識には難があるため、常に役立つというわけではありません。

指への負担が限りなくゼロに近いポインティング・デバイスが、そのうち開発されることを望んでいます。

カタカナ語を英語に

MS-IME 2000と2002では、「カタカナ語英語辞書」というものがあります。翻訳作業で「テキスト」を"text"としたい場合、あるいは"text"を「テキスト」としたい場合、打ち込みなおさなくても、選択して「再変換」(あるいはスペースキー)を押すだけで変換できます。辞書を追加していなければ、IMEのプロパティで追加する必要があります。

Wordで操作を繰り返す

Wordでは [Ctrl]+Y で、直前の操作を繰り返すことができます。書式設定などのややこしい手順をこのショートカットだけで繰り返せます。中には「繰り返す」ことが不可能な操作もあり、また複数段階の操作は最後の操作しか繰り返せませんので、自分でいろいろ試してください。

Wordでテキスト形式を扱う

Wordでは長文のテキスト形式を扱った後、そのままテキスト形式で保存すると、改行が抜けることがあるという困った不具合があります。テキストエディタではこのようなことは起きないのですが、Wordには強力なVBAマクロという魅力があります。テキスト形式だからといって、作業を大幅に効率化できるWordのマクロを使わない手はありません。そのため、Wordでテキスト形式を扱うときは、以下の方法を取るのが安全です。

  1. オリジナルのテキストファイルのコピーを作成する。

  2. コピーをWordで開いてマクロなどで文書整形など編集をする。

  3. オリジナルのファイルをエディタで開き、内容を全消去する(オリジナルのファイル名をそのまま使うためです)。

  4. Wordの文書を全選択し、コピーする。

  5. エディタに貼り付けて、テキスト形式で保存する。

少々手間がかかりますが、これでWordでもテキストを安全に扱うことができます。(場合によってはこれでも改行が抜けるケースもあるようです。エディタで最終的に確認した方がいいでしょう。)

スタイルをつかおう

WordやFrontPageの機能で一般に活用されていないことが多いのが、「スタイル」です。改行で段落の間隔をとるのはお勧めできません。思いついたままに書式をつけていると、文書全体の体裁の統一がとれず、また複数の文書間での体裁の統一もできません。文書内、文書間の構造をきっちり把握するためにもスタイルの活用は必須です。Word2002では [作業ウィンドウ] で、 スタイルの統一がかなりしやすくなっています。理想的には、文書を作る段階でアウトラインを使用し、スタイルを決めておきます。

スペルチェックをつかおう

スペルチェックが使える場合は使いましょう。Office以外の文書でスペルチェック機能がない場合や辞書にないコードが頻出する場合はともかく、スペルチェック機能があるアプリケーションで作成された文書でスペルチェックがされていない(つまりスペルミスがある)と、プロとしてのスキルが疑われます。提出したり納品したりする前に、スペルチェックをかける習慣をつけておきたいものです。

複数のテキストファイル対象の一括置換

Yamashita-Y氏のフリーウェア「TextSS」が お勧め。改行コードを含む複数行の置換もできます。Office文書のHTML化との応用もありそう。Word文書が検索対象の場合、また置換時の確認が必要なら拙作「換の玉 for Word」もどうぞ。

複数のHTML文書の検索・置換

これもフリーウェア「TextSS」が お勧め。

またHTML文書をFrontPageのWebにしてしまえば、サブディレクトリを含む複数のHTML文書で検索・置換ができます。「HTMLビューで検索」をするとソースを検索対象にできます。FrontPageで 自動生成される不必要なディレクトリやファイルにご注意。Office文書のHTML化と組み合わせると応用が広がります。

複数のOffice文書、HTML、テキスト、PDFの内容検索

Windows2000では、複数のOffice文書、HTML、テキスト、PDFの内容を検索するのにインデックスサービスが使えます。[マイ コンピュータ]を右クリックして [管理...] →[サービスとアプリケーション] → [インデックス サービス] です。正規表現も使えます。Windows2000に慣れてない人には使い方がちょっとややこしいかも。F1キーでヘルプを参照してみてください。Windows95/98/MEではOffice FindFastでこれとある程度まで似たことができます。(ただしFindFastではPDFは検索できません。)

PDFは、Windows2000でインデックスサービスにAdobe PDF IFilter 4.1Adobe PDF IFilter 4.1用ダブルバイト・リソースを追加することで検索できるようになります。

Office文書をどこでも置換(Office文書のHTML化

Office2000ではHTMLにした後、完全に元のOffice形式に戻すことができます(ラウンドトリップ)。この機能を最大限活用するといろんなことができます。たとえばExcel2000ではテキストボックス内の置換はできませんが、HTMLにしてしまえばできるようになります。基本的に他のOffice文書もHTMLにすれば文字の部分はHTMLの中ではプレーンテキストになります。タグを不用意にいじらなければ編集後のHTMLから元のOffice文書に戻すこともできます。ただし、英語から日本語にした場合は欧文フォントを日本語フォントに変更する必要がある場合もあります。(と言ってもHTMLソースで置換するだけですね。)Office文書をHTMLにする応用は他にもあります。

Office文書の文字カウント

Office文書のHTML化の応用。Word、PowerPoint、ExcelなどのOffice文書をHTML形式で保存し、それをInternet Explorerで表示して、 ブラウザからテキス���形式で保存しカウントすればテキストボックス内も数えることができます。 (Wordから直接テキスト形式にした場合、テキストボッ視されてしまいます。)PowerPointのHTML文書ではフレームが使用されるので、その構造を把握しておく必要があります。

複数のファイルを結合(テキスト、HTML)

テキストやHTMLは以下のMS-DOSコマンドで結合できます。(Windows 2000でもコマンドプロンプトで利用可能)

同じディレクトリにあるすべてのHTMLを all.txt テキスト文書にまとめる場合。

type *.htm > all.txt

テキスト文書をまとめる場合、入力と出力の拡張子を

type *.txt > all.txt

のように同じにすると、all.txt自体も数えてしまうので、拡張子を適当に変更して

type *.txt > all.txx

などにして後でall.txtに直すとよいでしょう。

ちなみにHTMLを結合して何の意味があるのか。上記の文字カウントの記事を参照してください。

PDFをRTF/Word形式に変換

Acrobat Readerの[環境設定]→[一般]の[デフォルトページレイアウト]を [連続]にしておくとCtrl+Aで文章を全選択できます。(メニューの[表示]での切り替えもできます。)Wordにそのまま貼り付ければRTF(Word)形式になります。この方法だと書式は維持されますが、日本語などがうまく変換できない場合もあります。また下記の方法と違い、コラムが正しい順番にならないことがあります。

PDFをテキスト形式、HTML形式に変換

Acrobat Reader 5.0/6.0ではテキスト形式で保存できますが、不要な改行が残ります。Wordやエディタに直接コピーするのが早そうです。

Office文書のHTMLをスリムに

Office2000では、文書をHTMLに変換するとOffice固有のタグが多数挿入されてファイルのサイズが大きくなります。(これはこれで意味があるわけで、文句を言ってもはじまりません。)Office Updateで入手できるHTML Filter 2.1を使えば シンプルなHTMLにすることができます。ただし元のOffice形式で編集することはできなくなります。Office XP/2003では直接、シンプルなHTMLとして保存できます。

Wordのルビをテキスト形式文書に含める

一度HTML形式で保存し、Internet Explorerで表示して、 ブラウザからテキスト形式で保存すればルビを()内に入れてテキスト形式文書に含めることができます。(Word 2000から直接テキスト形式にした場合、ルビはすべて無視されてしまいます。)なお、Word 2002でルビ付きの文書をテキスト形式で保存すると、ルビは()内に含まれるようになっています。


更新履歴

0.04 Office XP関連の情報を更新。(01/09/17)

0.05 一部追加。(01/10/20)

0.06 一部追加。(01/10/27)

0.07 一部追加。(01/11/18)

0.08 「マウス、ポインティング・デバイスについて」を追加。(02/02/14)

0.10 「IME――ATOK15の推測変換ほか」を追加。(02/06/10)

0.11 情報の更新。(02/07/06)

0.12 情報の更新。(03/06/19)


※ 各製品名はMicrosoft、Adobeと各社の商標または登録商標です。