Thursday, December 24, 2009

Python 下用來處理 bibtex 的函式庫 -- pybtex

最近在寫報告的時候,需要和同事整合各自的參考 bibliography),我本身是採用 JabRef 來做書目管理, JabRef 使用的格式為 bibtex。為了檢查大家的參考書目書目有沒有重複,尋找了一下python 的函式庫,找到以下兩套:


1. python-bibtex
2. pybtex

python-bibtex 是書目管理工具,類似 JabRef,不過需要在 Linux 環境才能運作,所以就放棄了。
pybtex 是用來取代 latex 中的 bibtex 軟體,基本上功能和 bibtex 相同。好消息是 pybtex 有提供方便的函式可以直接剖析 bib 檔,用法大致如下:

from pybtex.database.input import bibtex
parser = bibtex.Parser(encoding="UTF-8")
bib_data = parser.parse_file('foo.bib')
print bib_data.entries.keys()
for k in bib_data.entries.keys():
    print bib_data.entries[k].fields['title']
有了 bibtex 這個工具之後,剩下來就只是比較 title 等簡單的工作了。

No comments:

Post a Comment