起源
起源
文章目录
  1. 项目地址
  2. 数据分析
  3. 数据集合
  4. 案例展示
  5. 贡献&讨论

chinese-poetry中文诗文数据库

Build StatusLicenseimg

中文诗歌主页是一个基于浏览器的诗词网站, 包含唐诗三百首、宋词三百首等文集.

最全的中华古典文集数据库, 包含5.5万首唐诗、26万首宋诗和2.1万首宋词. 唐宋两朝近1.4万古诗人, 和两宋时期1.5K词人. 数据来源于互联网.

为什么要做这个仓库? 古诗是中华民族乃至全世界的瑰宝, 我们应该传承下去, 虽然有古典文集, 但大多数人并没有拥有这些书籍. 从某种意义上来说, 这些庞大的文集离我们是有一定距离的。而电子版方便拷贝, 所以此开源数据库诞生了. 你可以用此数据做任何有益的事情, 甚至我也可以帮助你.

古诗采集没有记录过程, 因为古诗数据庞大,目标网站有限制, 采集过程经常中断超过了一个星期.2017年新加入全宋词, 全宋词爬取过程及数据分析.

项目地址

数据分析

一些简单的高频分析

唐诗高频词唐诗作者作品榜
唐诗高频词唐诗作者作品榜
宋诗高频词宋诗作者作品榜
宋诗高频词宋诗作者作品榜
宋词高频词宋词作者作品榜
宋词高频词宋词作者作品榜
两宋喜欢的词牌名
两宋喜欢的词牌名

数据集合

待补充

  • 清代诗词
  • 元曲

案例展示

贡献&讨论

提交PR或者通过issue讨论来优化完善此数据库, 你也可以联系我的邮箱 gaojunqi@outlook.com

项目作者: jackeyGao

项目链接: https://github.com/chinese-poetry/chinese-poetry

项目执照: MIT 许可证.

支持一下
扫一扫,支持Sailim
  • 微信扫一扫
  • 支付宝扫一扫