国泰安量化舆情数据库
国泰安量化舆情数据库目前监测沪深300所属上市公司的新闻,后续会扩大到5000家上市公司的新闻资讯。数据库中收录了36个字段,包含新闻来源、时间、抓取对象、正文等基本信息及点击量、回复数、听众数、转载数等热度指标,并且提供基于正负面词汇权重计算得出的文章调性指标。
该数据库具有以下特色:
1. 中国首创学术类舆情数据库:国泰安量化舆情数据库∞是目前市场上针学术市场的唯一舆情数据库。中国的量化舆情研究刚刚起步,本数据库可以满足高校老师和研究者对量化舆情研究的需求。
2. 数据类型全:媒体类型涵盖了网络、论坛、博客㊣和微博,可以满足不同〗客户的多样化数据需求。
3. 抓取范』围广:可覆盖境内外30万⌒ 网络站点源,为数据的完整性提供保障。
4. 实时数据量⊙大:数据日更新量在几十万级别,重要新闻网∩站每15分钟抓取一次。
5. 量化字段多:根据新☆闻时效性、热度、调性和相关♂性提取新闻里的信息,可以为客户带来便捷化的查找体验和更多的衍生应用。
6. 字段设置提供定制服务:可根据用户的研究方向筛选新闻ㄨ的抓取对象,减少数据容量@,提高研究效率;
量化实证〇性强:量化舆情数据库可服务于量化因子的提取,服务于量化投资。