公報に付与されているFタームの出力

公報に付与されているFタームを集計して出力するツールとしてpft.rbを用意していますが、 例えば4G146AA11がナノチューブ、ナノ繊維、ナノファイバーだと日本語で意味が出てきた 方が好ましいという人が多いようですので、Fターム辞書を作成を支援するmft.rbを用意して います。

Fターム辞書の作成

特許電子図書館で提供されて いるパテントマップガイダンス(PMGS)を使用します。ここで、Fターム紹介の部分に4G146と入力して、照会ボタンをクリック すると、Fターム4G146のリストが表示されます。

ここで、表示されているFタームのリストを何も考えずにコピーして、Excelにペースト し、ファイル名をテーマコードと同じ4G146.xlsとして保存しま す(Excel2007以降では拡張子がxlxsとなるため、ファイル名は4G146.xlsxとなりますが、 問題ありません)。ここで、以下のように入力することで、Excelファイル中のFタームの 一覧と対応する意味を出力します。

    D:\Patent>ruby mft.rb 4G146.xls
    4G146AA01       ・炭素
    4G146AA02       ・・黒鉛
    4G146AA03       ・・・熱分解黒鉛、パイログラファイト
    4G146AA04       ・・ダイヤモンド
    4G146AA05       ・・ダイヤモンドライク、水素化アモルファス
    4G146AA06       ・・活性炭
    4G146AA07       ・・フラーレン類、ナノカーボン
    4G146AA08       ・・・フラーレン、Cn(炭素クラスター)
    4G146AA09       ・・・・C60、C70
    4G146AA10       ・・・・重合体又は(Cn:n≧120)
    4G146AA11       ・・・ナノチューブ、ナノ繊維、ナノファイバー
    4G146AA12       ・・・・シングル(単層)ナノチューブ

問題がなければ、mft.rbの出力をFターム辞書(デフォルトのファイル名は fterm.lst)に保存します。

    D:\Patent>ruby mft.rb 4G146.xls > fterm.lst

既存のFターム辞書に追加する場合には、「>」ではなく、「>>」を使用します。

    D:\Patent>ruby mft.rb 4G169.xls >> fterm.lst

mft.rbはセル結合している場合は読み取りに失敗します。Fタームに対応するFIの数が 多い場合にはセル結合される場合がありますので、この場合は手動でセル結合を解除して 余分な行を削除する必要があります。

公報に付与されたFタームの頻度を集計して出力する

pft.rbの使い方も他のツールと同じようになります。オプション「--sort」を指定する と、次のようにTSVファイル中の出願頻度が多い順に出力します。Fターム辞書にないFターム がある場合には、Fタームの意味が出力される欄は空白となります。

    D:\Patent>ruby pft.rb sample2.tsv --sort | more
    34      4G146AD22       ・・導電材、導電性
    30      4G146AA11       ・・・ナノチューブ、ナノ繊維、ナノファイバー
    17      4G146AC03       ・・ミクロ・ナノ形状(ナノチューブ径等)
    15      4G146AB07       ・膜、フィルム
    14      4G146BC44       ・・・鉄族(Fe、Ni、Co)含有*
    14      4G146BA12       ・・炭化水素(炭素と水素のみからなる)
    13      4G146CB19       ・複合(CB31-39も付与)
    13      4G146BC09       ・・化学蒸着、プラズマCVD
    13      4G146CB35       ・・有機物、ピッチ、タール*
    12      4G146AD28       ・デバイス
    11      4G146AB06       ・繊維状、ウィスカー

指定したFタームの出現頻度を調べる場合には、調べたいFタームが記載されたファイル (デフォルトのファイル名は、target.lst)を用意します。ここでは、Fターム辞書をそのまま コピーして使用してみます。

    D:\Patent>copy fterm.lst target.lst
          1 個のファイルをコピーしました。

    D:\Patent>ruby pft.rb sample.tsv | more
    1       4G146AA01       ・炭素
    1       4G146AA02       ・・黒鉛
    0       4G146AA03       ・・・熱分解黒鉛、パイログラファイト
    0       4G146AA04       ・・ダイヤモンド
    0       4G146AA05       ・・ダイヤモンドライク、水素化アモルファス
    0       4G146AA06       ・・活性炭
    1       4G146AA07       ・・フラーレン類、ナノカーボン
    2       4G146AA08       ・・・フラーレン、Cn(炭素クラスター)
    0       4G146AA09       ・・・・C60、C70
    0       4G146AA10       ・・・・重合体又は(Cn:n≧120)
    30      4G146AA11       ・・・ナノチューブ、ナノ繊維、ナノファイバー
    9       4G146AA12       ・・・・シングル(単層)ナノチューブ

デフォルトのtarget.lstを使用しない場合には、次のようにオプションで指定します。

    D:\Patent>ruby pft.rb --target 4G169AA sample2.tsv

オプション「--target」を指定しても、「--sort」を指定した場合には、「--sort」 が優先されます。


[Powered by FreeBSD Logo]

連絡先:webmaster@nanodesu.jp

Valid XHTML 1.0 Strict