公報に付与されているFタームを集計して出力するツールとしてpft.rbを用意していますが、 例えば4G146AA11がナノチューブ、ナノ繊維、ナノファイバーだと日本語で意味が出てきた 方が好ましいという人が多いようですので、Fターム辞書を作成を支援するmft.rbを用意して います。
特許電子図書館で提供されて いるパテントマップガイダンス(PMGS)を使用します。ここで、Fターム紹介の部分に4G146と入力して、照会ボタンをクリック すると、Fターム4G146のリストが表示されます。
ここで、表示されているFタームのリストを何も考えずにコピーして、Excelにペースト し、ファイル名をテーマコードと同じ4G146.xlsとして保存しま す(Excel2007以降では拡張子がxlxsとなるため、ファイル名は4G146.xlsxとなりますが、 問題ありません)。ここで、以下のように入力することで、Excelファイル中のFタームの 一覧と対応する意味を出力します。
D:\Patent>ruby mft.rb 4G146.xls
4G146AA01 ・炭素 4G146AA02 ・・黒鉛 4G146AA03 ・・・熱分解黒鉛、パイログラファイト 4G146AA04 ・・ダイヤモンド 4G146AA05 ・・ダイヤモンドライク、水素化アモルファス 4G146AA06 ・・活性炭 4G146AA07 ・・フラーレン類、ナノカーボン 4G146AA08 ・・・フラーレン、Cn(炭素クラスター) 4G146AA09 ・・・・C60、C70 4G146AA10 ・・・・重合体又は(Cn:n≧120) 4G146AA11 ・・・ナノチューブ、ナノ繊維、ナノファイバー 4G146AA12 ・・・・シングル(単層)ナノチューブ
問題がなければ、mft.rbの出力をFターム辞書(デフォルトのファイル名は fterm.lst)に保存します。
D:\Patent>ruby mft.rb 4G146.xls > fterm.lst
既存のFターム辞書に追加する場合には、「>」ではなく、「>>」を使用します。
D:\Patent>ruby mft.rb 4G169.xls >> fterm.lst
mft.rbはセル結合している場合は読み取りに失敗します。Fタームに対応するFIの数が 多い場合にはセル結合される場合がありますので、この場合は手動でセル結合を解除して 余分な行を削除する必要があります。
pft.rbの使い方も他のツールと同じようになります。オプション「--sort」を指定する と、次のようにTSVファイル中の出願頻度が多い順に出力します。Fターム辞書にないFターム がある場合には、Fタームの意味が出力される欄は空白となります。
D:\Patent>ruby pft.rb sample2.tsv --sort | more 34 4G146AD22 ・・導電材、導電性 30 4G146AA11 ・・・ナノチューブ、ナノ繊維、ナノファイバー 17 4G146AC03 ・・ミクロ・ナノ形状(ナノチューブ径等) 15 4G146AB07 ・膜、フィルム 14 4G146BC44 ・・・鉄族(Fe、Ni、Co)含有* 14 4G146BA12 ・・炭化水素(炭素と水素のみからなる) 13 4G146CB19 ・複合(CB31-39も付与) 13 4G146BC09 ・・化学蒸着、プラズマCVD 13 4G146CB35 ・・有機物、ピッチ、タール* 12 4G146AD28 ・デバイス 11 4G146AB06 ・繊維状、ウィスカー
指定したFタームの出現頻度を調べる場合には、調べたいFタームが記載されたファイル (デフォルトのファイル名は、target.lst)を用意します。ここでは、Fターム辞書をそのまま コピーして使用してみます。
D:\Patent>copy fterm.lst target.lst 1 個のファイルをコピーしました。 D:\Patent>ruby pft.rb sample.tsv | more 1 4G146AA01 ・炭素 1 4G146AA02 ・・黒鉛 0 4G146AA03 ・・・熱分解黒鉛、パイログラファイト 0 4G146AA04 ・・ダイヤモンド 0 4G146AA05 ・・ダイヤモンドライク、水素化アモルファス 0 4G146AA06 ・・活性炭 1 4G146AA07 ・・フラーレン類、ナノカーボン 2 4G146AA08 ・・・フラーレン、Cn(炭素クラスター) 0 4G146AA09 ・・・・C60、C70 0 4G146AA10 ・・・・重合体又は(Cn:n≧120) 30 4G146AA11 ・・・ナノチューブ、ナノ繊維、ナノファイバー 9 4G146AA12 ・・・・シングル(単層)ナノチューブ
デフォルトのtarget.lstを使用しない場合には、次のようにオプションで指定します。
D:\Patent>ruby pft.rb --target 4G169AA sample2.tsv
オプション「--target」を指定しても、「--sort」を指定した場合には、「--sort」 が優先されます。