淘宝用户评论数据采集及其价值分析—以only店铺为例(论文16000字)
摘要
首先,在当今这个信息化时代,随着互联网技术的发展,计算机和智能手机的使用群体越来越庞大,人们的衣食住行各种信息都存在于互联网之中,互联网已经逐渐和我们的生活融合,成为我们生活的一部分,网络购物也日渐繁荣,成为了最受大众欢迎的购物方式之一。
其次,在如今信息科学高速发展的今天,大量数据分布于互联网,大量数据未充分利用,互联网里隐藏了不可估量价值的数据,如果将如此庞大的数据提取出来,并进行进一步的分析,挖掘更深层次的信息,其价值是不可估量的。淘宝用户评论作为大数据的一份子,对其进行挖掘分析既可以方便买家更加高效地做出购物选择,又能帮助卖家进行口碑营销,实现淘宝买家与卖家的双赢。充分挖掘分析淘宝用户评论就是本文的主要工作。
本文以only店铺为例,通过对该店铺的用户评论数据采集,对采集到的数据进行情感倾向分析,给买家提供购物选择的建议,同时分析出买家对某类商品的喜好。
关键词:淘宝评论数据采集网络爬虫文本挖掘情感分析
Taobao user reviews data collection and data value analysis
——Taking only store as an example
ABSTRACT
First of all, in today's information age, with the development of Internet technology, the use of computers and smart phones is becoming more and more large.People can use the Internet for their daily activities and information acquisition.The Internet has become submerged in our lives. In part,online shopping is booming andit is also becoming increasingly in vogue.
Secondly, in today's rapid development of information science, massive data is presented on the Internet, however,it has not been fully tapped and has notmade full use of all the data. The Internet hides the data of immeasurable value. When you extract so much data, do furtheranalysis and extract deeper information, its value is not measurable. Level of information, its value is immeasurable. As a part of big data, Taobao user comments can not only facilitate buyers to make shopping choices more efficiently, but also help sellers to promote word-of-mouth marketing and achieve a win-win situation for Taobao buyers and sellers. Fully mining and analyzing Taobao user reviews is the main work of this article.
This article takes the only store as an example, through the user's comment data collection of the store, analyzes the sentiment tendency of the collected data, provides buyers with suggestions for shopping choices, and analyzes the buyer's preference for certain types of products.
Keywords:Taobao comment; data collection; web crawler; text mining; sentiment analysis
目录
摘要 I
ABSTRACT II
目 录 III
第一章 绪论 1
1.1 选题背景 1
1.1.1网络购物发展的现状 1
1.1.2网络购物的优势 2
1.1.3淘宝评论分析的必要性 3
1.2 研究目的及意义 4
1.3 研究内容与研究方法 4
1.3.1研究内容 4
1.3.2研究方法与研究结构 4
第二章 文献综述 6
2.1淘宝评论研究现状 6
2.2网络爬虫研究现状 7
2.3文本挖掘研究现状 9
2.4文本情感分析研究现状 10
第三章 淘宝用户评论数据采集 11
3.1爬虫功能需求分析 11
3.2爬虫采集相关数据流程 11
3.3爬虫优化 16
3.4数据抓取结果 20
第四章 数据处理 22
4.1数据预处理 22
4.2数据处理过程的缺点 31
4.3数据处理结果 32
第五章 数据分析 33
5.1运用TF-IDF算法抽取淘宝评论关键词并运用词云进行可视化 33
5.2淘宝用户评论数据情感分析 37
5.3针对服装类商品的淘宝消费者喜好分析 42
第六章 结束语 43
6.1结论 43
6.2不足与展望 43
参考文献 45
致谢 48
|