ここでは、出願人毎に解析したり、特定の特許分類が付与された公報に対して解析した りする方法について説明します。
書誌情報として最低限必要なものは、①出願日、②審査請求日、③登録日、④STの4つ でした。検索式は同じで構いませんので、追加の書誌情報として、⑤出願人識別番号、 ⑥出願人・権利者名、⑦FI、⑧Fタームを指定して書誌情報の一覧をダウンロードして 下さい。ここでは、ダウンロードしたファイルをsample2.tsvとします。
検索式でヒットした全ての公報に対して、グラフを描かせるには、以下のように入力 すれば良かったのでした。
D:\Patent> ruby pana.rb sample.tsv | ruby pmap.rb
仮に、sample.tsvが特定の出願人の公報だけになってくれれば、Excelのグラフは 特定の出願人だけのものになる筈です。つまり、検索式のキーワードに特定の出願人 を指定して公報を絞ってやれば、目的のグラフになります。これを調べたい出願人の 数だけ繰り返せば良いのですが、出願件数上位10社についてやろうとなると結構面倒 です。
簡単な使い方で使ったsample.tsvには書誌情報と して出願人に関する情報は必須ではありませんでした。しかし、今回準備した sample2.tsvには出願人の情報が含まれています。
例えば、パナソニック株式会社の公報だけをsample2.tsvから抜き出して、pana.rb 以下で処理してやれば、パナソニック株式会社の公報に対してグラフを描かせることが できます。この目的の為に、pgrep.rbが用意されています。
D:\Patent> ruby pgrep.rb パナソニック sample2.tsv > パナソニック.tsv D:\Patent> ruby pana.rb パナソニック.tsv | ruby pmap.rb --title パナソニック
上のようにすれば、目的のグラフが描けます。対象とする企業の数だけ書誌情報を ダウンロードするという苦行からは解放されました。
pgrep.rbは、指定したキーワードが含まれている行を抜き出すという仕事をします。
ruby pgrep.rb キーワード 入力ファイル
「>」で出力先をファイルに指定すると結果はファイルになりますが、何も指定しない と出力は画面に流れます。「|」を指定するとコマンドの出力を他のプログラムの入力 にできます。この機能を利用することで、無駄にファイルを作る手間が省けます。
D:\Patent> ruby pgrep.rb パナソニック sample2.tsv | ruby pana.rb | ruby pmap.rb --title パナソニック
pgrep.rbは指定したキーワードが入っている行を抜き出してくれますので、キーワード にFIやFタームを指定してやれば、指定したFIやFタームが付与された公報に対してグラフ を描かせることができます。pgrep.rbの出力をpgrep.rbの入力にすることもできます。
D:\Patent> ruby pgrep.rb パナソニック sample2.tsv |^ More? ruby pgrep.rb 5H029AJ12 |^ More? ruby pana.rb | ruby pmap.rb --title パナソニック
上の例では1行に収まらなくなったので、分割しています。「^」を入力すると継続 しているとみなしてくれます。「More?」と出力されますので、その後に実行したい コマンドを入力して下さい。もちろん、「^」を使用しないで1行で入力しても構いません。
ここまで説明してきて、同じコマンドを毎回入力するのは面倒だと思いませんか? Unix の場合、シェルスクリプトを作成することで一連のコマンドを繰り返し入力する手間を省く ことができます。Windowsのコマンドプロンプトの場合も、バッチファイルを作成すること で手間を省くことが可能です。
ruby pgrep.rb %2 %1 |^
ruby pgrep.rb %3 |^
ruby pana.rb | ruby pmap.rb --title "%1 %2 %3"
上の3行をメモ帳で入力して、run.batという名前で保存して下さい。こうすると、 以下のように入力することで、先ほどと同じグラフが描けます。
D:\Patent> run sample1.tsv パナソニック 5H029AJ12
コマンドプロンプトにはヒストリ機能がありますので、カーソルキー「↑」を入力すると 過去に入力したコマンドが表示されます。異なるキーワードでグラフを描かせる場合には、 キーワードを適切に修正してEnterキーを押してください。