利用R语言对QQ群之间的关系进行分析_光环大数据培训机构

来源:互联网 由 光环IT学院 贡献 责任编辑:鲁倩  
http://hadoop.aura-el.com

利用R语言对QQ群之间的关系进行分析_光环大数据培训机构

偶然一次机会,老江问我03化学的群当中有哪些人很少说话,甚至从没说过话。很好奇的就去查了一下,发现腾讯的QQ群只可以查到群成员最近一次说话的时间,没有更为详细的比如哪位成员发言多,具体有多少,活跃天数怎样等。于是恰好想拿这个数据出来玩玩。,就打算开工做一个呗。

数据源:2011-01-01至2012-09-04的多人汇总聊天记录(由于QQ不在线不接受群聊记录,所以结合多人聊天记录去重汇总)

分析工具: R (涉及包有stringr, plyr, rmmseg4j, igraph)

1. 整体发言量排行榜,按聊天记录汇总倒序。本人,大马,阿铁蝉联三甲,包军同学说是黑榜,原因是他总有几次群内说话而出现在榜单当中。

表一:群内发言量TOP 10

2. 基于有部分同学,很少上网。但一上网就收不住。说上好几页的。于是按天次做了下面这个统计,即一天在群内不管多少次发言,只算一次,从而分析群内成员的活跃天数。钱妹子毅然进入前三,哈哈,而缪静同学在群里说话不多,但是每天要说上几句。

表二:群内活跃天数 TOP 10

http://hadoop.aura-el.com

3. 赠送两个分析:谁发起群聊话题;谁发言大家就沉默了?哈哈,很有意思的东西,不过数据处理有点小复杂,群聊话题是何时开始,何时结束的? 细看了聊天记录,发现一般情况下大部分群聊半个小时内没人回复,基本上这个话题就结束了,正好跟之前网站分析的会话(session)雷同,于是将所有数据按时间排序,间隔超过30分钟认为是一个新话题的开始,这样共得到280个聊天话题,剔除说一句话没人理的话题,最后得到159个至少有两个人参与的话题。从表三中看出发起话题前三甲的还是原来三个最无聊的人。

表三:发起群聊话题次数 TOP 10

4. 看看自己曾经做过多少次聊天杀手,即话一出,群内至少沉默半个小时以上。哈哈,其实以表四做为聊天杀手并不公平,因为聊天活跃的人结束话题的概率肯定要大。于是计算结束群聊话题与发起群聊话题比值做为杀手指数(即表三与表四数值的比值),如图一。最终发现聊天杀手前三名是老江(4.0),老缪(3.33),大马(1.63);而最受欢迎的是夏老(0.25), 小邓(0.33), 阿铁(0.33). 其中一位是老师、一位美女,一位班长。

表四:结束群聊话题次数TOP 10

5. 同时将所有聊天记录提取出来,做了分词,并绘制标签云图,发现群里大家聊的最多的是“我们”、“你们”、“现在”、“怎么样”、“做什么”。对一个已毕业5年的群,现在聊的话题应该也正是这些东西。

http://hadoop.aura-el.com

同时按不同群成员提取聊天记录做了分词。可以发现群不同群成员聊天特征标签,图三中分别提取了群内聊天记录TOP3成员,不同的群成员有不同的说话风格,也就具有不同的标签,尤其是群成员3,很具有特色。其他二位的标签与整体标签相似,都是“我们”,“你们”,“同学”。

6. 来自五湖四海的同学,毕业后大家都为了生活又去了五湖四海,没有时间和精力像在学校那样谈笑风生了。整个群内的交流主要由几位重要节点带动,也正因为这几个节点,把整个群成员连接成一个网络。

将整个聊天记录分割成为多个会话(话题), 参与话题的群成员当作网络中的一个节点,在一个会话中有互动(参与聊天)即各个成员之间存在关系,也就形成连接不同节点的边。如图四,整个群成员之间的相互作用主要由“肖嘉敏”,“李源栋”,“钱海燕”等几点重要的节点组织在一起。

为什么大家选择光环大数据!

大数据培训、人工智能培训、Python培训、大数据培训机构、大数据培训班、数据分析培训、大数据可视化培训,就选光环大数据!光环大数据,聘请大数据领域具有多年经验的讲师,提高教学的整体质量与教学水准。讲师团及时掌握时代的技术,将时新的技能融入教学中,让学生所学知识顺应时代所需。通过深入浅出、通俗易懂的教学方式,指导学生较快的掌握技能知识,帮助莘莘学子实现就业梦想。

光环大数据启动了推进人工智能人才发展的“AI智客计划”。光环大数据专注国内大数据和人工智能培训,将在人工智能和大数据领域深度合作。未来三年,光环大数据将联合国内百所大学,通过“AI智客计划”,共同推动人工智能产业人才生态建设,培

http://hadoop.aura-el.com

养和认证5-10万名AI大数据领域的人才。

参加“AI智客计划”,享2000元助学金!

【报名方式、详情咨询】

光环大数据网站报名:http://hadoop.aura-el.com

手机报名链接:http:// hadoop.aura-el.com /mobile/

以下内容为系统自动转化的文字版,可能排版等有问题,仅供您参考:

光环大数据--大数据培训&人工智能培训 http://hadoop.aura-el.com 利用 R 语言对 QQ 群之间的关系进行分析_光环大数据培训机构

偶然一次机会,老江问我 03 化学的群当中有哪些人很少说话,甚至从没说 过话。很好奇的就去查了一下,发现腾讯的 QQ 群只可以查到群成员最近一次说 话的时间, 没有更为详细的比如哪位成员发言多, 具体有多少, 活跃天数怎样等。 于是恰好想拿这个数据出来玩玩。 ,就打算开工做一个呗。

数据源:2011-01-01 至 2012-09-04 的多人汇总聊天记录(由于 QQ 不在线不 接受群聊记录,所以结合多人聊天记录去重汇总)

分析工具: R (涉及包有 stringr, plyr, rmmseg4j, igraph)

1. 整体发言量排行榜, 按聊天记录汇总倒序。 本人, 大马, 阿铁蝉联三甲, 包军同学说是黑榜,原因是他总有几次群内说话而出现在榜单当中。

表一:群内发言量 TOP 10

2. 基于有部分同学,很少上网。但一上网就收不住。说上好几页的。 于是按天次做了下面这个统计,即一天在群内不管多少次发言,只算一次,从而 分析群内成员的活跃天数。钱妹子毅然进入前三,哈哈,而缪静同学在群里说话 不多,但是每天要说上几句。

表二:群内活跃天数 TOP 10

光环大数据 http://hadoop.aura-el.com

光环大数据--大数据培训&人工智能培训 http://hadoop.aura-el.com

3. 赠送两个分析:谁发起群聊话题;谁发言大家就沉默了?哈哈,很有 意思的东西,不过数据处理有点小复杂,群聊话题是何时开始,何时结束的? 细 看了聊天记录,发现一般情况下大部分群聊半个小时内没人回复,基本上这个话 题就结束了,正好跟之前网站分析的会话(session)雷同,于是将所有数据按时 间排序,间隔超过 30 分钟认为是一个新话题的开始,这样共得到 280 个聊天话 题,剔除说一句话没人理的话题,最后得到 159 个至少有两个人参与的话题。从 表三中看出发起话题前三甲的还是原来三个最无聊的人。

表三:发起群聊话题次数 TOP 10

4. 看看自己曾经做过多少次聊天杀手,即话一出,群内至少沉默半个 小时以上。哈哈,其实以表四做为聊天杀手并不公平,因为聊天活跃的人结束话 题的概率肯定要大。于是计算结束群聊话题与发起群聊话题比值做为杀手指数 (即表三与表四数值的比值),如图一。最终发现聊天杀手前三名是老江(4.0), 老 缪 (3.33) ,大马 (1.63); 而最受欢迎的是 夏老 (0.25), 小邓 (0.33), 阿铁 (0.33). 其中一位是老师、一位美女,一位班长。

表四: 结束群聊话题次数 TOP 10

5. 同时将所有聊天记录提取出来,做了分词,并绘制标签云图,发现 群里大家聊的最多的是“我们” 、 “你们” 、 “现在” 、 “怎么样” 、 “做什么” 。对一 个已毕业 5 年的群,现在聊的话题应该也正是这些东西。

光环大数据 http://hadoop.aura-el.com

光环大数据--大数据培训&人工智能培训 http://hadoop.aura-el.com 同时按不同群成员提取聊天记录做了分词。 可以发现群不同群成员聊天特征 标签,图三中分别提取了群内聊天记录 TOP3 成员,不同的群成员有不同的说话 风格,也就具有不同的标签,尤其是群成员 3,很具有特色。其他二位的标签与 整体标签相似,都是“我们” , “你们” , “同学” 。

6. 来自五湖四海的同学,毕业后大家都为了生活又去了五湖四海,没有时 间和精力像在学校那样谈笑风生了。整个群内的交流主要由几位重要节点带动, 也正因为这几个节点,把整个群成员连接成一个网络。

将整个聊天记录分割成为多个会话(话题), 参与话题的群成员当作网络中 的一个节点,在一个会话中有互动(参与聊天)即各个成员之间存在关系,也就形 成连接不同节点的边。 如图四, 整个群成员之间的相互作用主要由 “肖嘉敏” , “李 源栋” , “钱海燕”等几点重要的节点组织在一起。

为什么大家选择光环大数据!

大数据培训、 人工智能培训、 Python 培训、 大数据培训机构、 大数据培训班、 数据分析培训、大数据可视化培训,就选光环大数据!光环大数据,聘请大数据 领域具有多年经验的讲师,提高教学的整体质量与教学水准。讲师团及时掌握时 代的技术,将时新的技能融入教学中,让学生所学知识顺应时代所需。通过深入 浅出、通俗易懂的教学方式,指导学生较快的掌握技能知识,帮助莘莘学子实现 就业梦想。

光环大数据启动了推进人工智能人才发展的“AI 智客计划” 。光环大数据专注国内 大数据和人工智能培训,将在人工智能和大数据领域深度合作。未来三年,光环大数据 将联合国内百所大学,通过“AI 智客计划” ,共同推动人工智能产业人才生态建设,培

光环大数据 http://hadoop.aura-el.com

光环大数据--大数据培训&人工智能培训 http://hadoop.aura-el.com

养和认证 5-10 万名 AI 大数据领域的人才。

参加“AI 智客计划” ,享 2000 元助学金!

【报名方式、详情咨询】 光环大数据网站报名:http://hadoop.aura-el.com 手机报名链接:http:// hadoop.aura-el.com /mobile/

光环大数据 http://hadoop.aura-el.com


  • 与《利用R语言对QQ群之间的关系进行分析_光环大数据培训机构》相关:
  • R语言建立回归分析_光环大数据培训机构
  • 用R语言对城管事件数据分析_光环大数据培训机构
  • R语言方差分析_光环大数据培训机构
  • R语言与Excel之数据分析功能比较_光环大数据培
  • 基于R语言的数据分析和挖掘方法总结_光环大数据培训
  • R语言中的情感分析与机器学习_光环大数据培训机构
  • 利用R语言获取最新所有股票数据_光环大数据培训机构
  • 利用R语言对游戏用户进行深度挖掘_光环大数据培训机
  • 为什么R是你下一个要学的编程语言_光环大数据培训机
  • 基于词库的情感分析-R语言_光环大数据培训机构
  • 本站网站首页首页教育资格全部考试考试首页首页考试首页职业资格考试最近更新儿童教育综合综合文库22文库2建筑专业资料考试首页范文大全公务员考试首页英语首页首页教案模拟考考试pclist学路首页日记语文古诗赏析教育教育资讯1高考资讯教育头条幼教育儿知识库教育职场育儿留学教育高考公务员考研考试教育资讯1问答教育索引资讯综合学习网站地图学习考试学习方法首页14托福知道备考心经冲刺宝典机经真题名师点睛托福课程雅思GREGMATSAT留学首页首页作文
    免责声明 - 关于我们 - 联系我们 - 广告联系 - 友情链接 - 帮助中心 - 频道导航
    Copyright © 2017 www.xue63.com All Rights Reserved