Python评论提取关键词制作精美词云的方法-编程学习网

今天小编给大家分享一下Python评论提取关键词制作精美词云的方法的相关知识点，内容详细，逻辑清晰，相信大部分人都还太了解这方面的知识，所以分享这篇文章给大家参考一下，希望大家阅读完这篇文章后有所收获，下面我们一起来了解一下吧。

一、抓取全部评论

Python评论提取关键词制作精美词云的方法

评论情况： {'android': 545 次, 'ios': 110 次, 'pc': 44 次, 'uniapp': 1 次}

一个小细节：给我评论的设备中，安卓苹果比是 5:1。

Building prefix dict from the default dictionary ... Loading model cost 0.361 seconds. Prefix dict has been built successfully.

1、找到评论接口

打开 chrome 浏览器，开发者模式
点击评论列表（图标 1）
点击接口链接（图标 2）
查看 response 返回值（评论结果的 json 格式）

Python评论提取关键词制作精美词云的方法

2、Python 获取评论

def get_comments(articleId):    # 确定评论的页数    main_res = get_commentId(articleId,1)    pageCount = json.loads(main_res)['data']['pageCount']     comment_list,comment_list2 = [],[]    source_analy = {}    for p in range(1,pageCount+1):        res = get_commentId(articleId, p)        try:            commentIds = json.loads(res)['data']['list']            for i in commentIds:                commentId = i['info']['commentId']                userName = i['info']['userName']                nickName = i['info']['nickName']  ## 获取用户名                source_dvs = i['info']['commentFromTypeResult']['key']   # 操作设备                content = i['info']['content']                comment_list.append([commentId, userName, nickName, source_dvs, content])                comment_list2.append("%s 丨 %s"%(userName, nickName))                if source_dvs not in source_analy.keys():                    source_analy[source_dvs] = 1                else:                    source_analy[source_dvs] = source_analy[source_dvs] + 1                # print(source_analy)        except:            print('本页失败！')    print('评论数：' + str(len(comment_list)))    return source_analy, comment_list, comment_list2

二、文本分词、词云制作

1、文本分析

西红柿采用的是结巴分词, 和 wordcloud。

# -*- coding:utf8 -*-import jiebaimport wordcloud

代码实现：

seg_list = jieba.cut(comments, cut_all=False)  # 精确模式    word = ' '.join(seg_list)

2、生成词云

背景图西红柿采用的是心形图片

pic = mpimg.imread('/Users/pray/Downloads/aixin.jpeg')

完整代码：：

def word_cloud(articleId):    source_analy, comment_list, comment_list2 = get_comments(articleId)    print("评论情况：", source_analy)    comments = ''    for one in comment_list:        comment = one[4]        if 'face' not in comment:            comments = comments + comment    seg_list = jieba.cut(comments, cut_all=False)  # 精确模式    word = ' '.join(seg_list)     pic = mpimg.imread('/Users/pray/Downloads/aixin.jpeg')    wc = wordcloud.WordCloud(mask=pic, font_path='/Library/Fonts/Songti.ttc', width=1000, height=500,                             background_color='white').generate(word)

3、初步效果-模糊不清

Python评论提取关键词制作精美词云的方法

西红柿发现文字模糊、图像曲线边缘不清晰的问题。

于是，指定分辨率，高清整起来。

# 保存plt.savefig('xin300.png', dpi=300) #指定分辨率保存

4、最终效果-高清无马

Python评论提取关键词制作精美词云的方法

以上就是“Python评论提取关键词制作精美词云的方法”这篇文章的所有内容，感谢各位的阅读！相信大家阅读完这篇文章都有很大的收获，小编每天都会为大家更新不同的知识，如果还想学习更多的知识，请关注编程网行业资讯频道。

文章详情

Python评论提取关键词制作精美词云的方法

一、抓取全部评论

1、找到评论接口

2、Python 获取评论

二、文本分词、词云制作

1、文本分析

2、生成词云

3、初步效果-模糊不清

4、最终效果-高清无马

软考中级精品资料免费领

相关文章

猜你喜欢