Skip to content

Latest commit

 

History

History
8 lines (5 loc) · 562 Bytes

File metadata and controls

8 lines (5 loc) · 562 Bytes

作业1:统计词频

标签文件flickr-tags.txt的数据来自图片共享网站Flickr。 每一行记录了一张图片所对应的用户标签。文件共有一万行,包含了来自一万张图片的标签信息。 写一个python程序,找出最常与标签 car 一起出现的前10个标签,并给出这些标签独自出现的频率和与car 一起出现的频率。

  • 两个标签 t_1 和 t_2 出现在同一行,记1次一起出现