Thursday, December 24, 2009

找出文章中的所有引用

最近在用 Word 寫計畫報告,我在引用參考資料時,是使用 [xx] 這種格式。[xx] 是個交互參照,用來連到文章的引用列表。到目前為止一切順利,不過後來發現引用列表中有不少項目是沒有被引用到的,為了節省空間要,要找出沒有被引用的的項目把他們刪除。
但是自己用眼睛看過30頁的文章實在太累,所以寫了一個 Python script 來幫我找出有用到的參考並加以排序。程式如下:


import re

refdict = {}
fin = open('doc.txt')
for line in fin:
    refs = re.findall('\[\d+\]', line)
    for ref in refs:
        num = int(ref[1:-1])
        refdict[num] = 1

used_ref = refdict.keys()
used_ref.sort()
print used_ref

No comments:

Post a Comment