Skip to content

Latest commit

 

History

History
73 lines (53 loc) · 4.26 KB

README.md

File metadata and controls

73 lines (53 loc) · 4.26 KB

Get Bibtex from Google Scholar

本仓库分成两种不同的使用方式,一种是使用python中谷歌学术中批量获取Bibtex,另一种是使用浏览器插件直接在dblp中获取Bibtex。

1. Python 批量获取 Bibtex

根据关键词列表谷歌学术或者dblp中搜索,批量获取对应的第一个Bibtex。

注:谷歌学术或者dblp均搜索支持模糊搜索,所以可以直接把pdf或word的文献引用一整条复制直接作为关键词,这样搜索已经足够精确了,完全没必要开高级搜索。

注:dblp不需要Cookie,但是谷歌学术需要Cookie,所以如果你没有Cookie,可以只使用dblp。

使用方式

  1. words.txt中添加关键词,以换行分隔。
  2. (可选)根据下图,访问https://scholar.google.com/scholar?hl=zh-CN&as_sdt=0%2C5&q=1&btnG=获取Cookie,将Cookie填入global_settings.pyheaders['Cookie']=""中。 get-cookie
  3. 运行words_to_bibtex.py
  4. 查看result_bibtex.txtresult_cite.txt中的结果。
  5. 如果你是使用代理的,可以在words_to_bibtex.py中启用set_proxy函数。

谷歌学术搜索有人机验证,如果跑着跑着突然报错了,只需要在浏览器再次访问https://scholar.google.com/scholar?hl=zh-CN&as_sdt=0%2C5&q=1&btnG=,手动过掉这个页面上的人机验证、复制一个新Cookie就OK。

更多配置

  1. 如果你找到了更多网站的支持方式,可以在global_settings.py中添加更多的searchUrlBases,并提交PR;
  2. 如果你只期望在单个网站中检索,可以在global_settings.py中修改searchWay
  3. 如果你发现自己无论如何都无法访问谷歌,可以在global_settings.py中修改proxy_relatedTrue,并在set_proxy函数中填入你的代理。

示例

输入(查找关键词前会去掉words.txt中所有已经在done.txt中的关键词):

# done.txt

# words.txt:
[6]	Cheng Kai, Li Qiang, Wang Lei, et al. DTaint: Detecting the Taint-Style Vulnerability in Embedded Device Firmware[C] //Proc of the 48th Annual IEEE/IFIP Int Conf on Dependable Systems and Networks (DSN). 2018: 430-441

输出(查找到结果后done.txt会新增一行,不过words.txt中的内容不会立即被删除):

# done.txt
[6]	Cheng Kai, Li Qiang, Wang Lei, et al. DTaint: Detecting the Taint-Style Vulnerability in Embedded Device Firmware[C] //Proc of the 48th Annual IEEE/IFIP Int Conf on Dependable Systems and Networks (DSN). 2018: 430-441
# result_bibtex.txt:
@inproceedings{cheng2018dtaint,
  title={DTaint: detecting the taint-style vulnerability in embedded device firmware},
  author={Cheng, Kai and Li, Qiang and Wang, Lei and Chen, Qian and Zheng, Yaowen and Sun, Limin and Liang, Zhenkai},
  booktitle={2018 48th Annual IEEE/IFIP International Conference on Dependable Systems and Networks (DSN)},
  pages={430--441},
  year={2018},
  organization={IEEE}
}
# result_cite.txt:
[6]	\cite{cheng2018dtaint}

2. 浏览器插件直接获取 Bibtex

这个脚本安装之后页面左下角会出现一个按钮,可以通过选项去配置按钮是否出现。

用处:当选中文本之后,会自动在dblp中搜索并返回第一个搜索结果对应的Bibtex到剪切板上。

使用方式

  1. 首先,你需要安装油猴插件,如果不知道怎么装请看我的视频:【浏览器脚本入门】①下载油猴_哔哩哔哩_bilibili
  2. 其次,你可以通过 Greasy Fork 安装我的脚本:选择文本并自动获取BibTex到剪切板

可加功能

  • 改写成浏览器插件,支持选中关键词直接右键获取Bibtex;
  • words_from_pdf: 从文献pdf中提取参考文献列表,将其直接作为关键词;
  • words_from_doc: 从文献doc中提取参考文献列表,将其直接作为关键词;
  • cite_to_bibtex: 将文本中的索引号直接变成bibtex的latex引用,比如[6]变成\cite{cheng2018dtaint}