这是generateData 版本alpha.6。
alpha.2更新说明
- 修正了选择供应商的喜好标签的一处关键错误;
- 添加了时间戳功能。
alpha.3更新说明
- 修改了程序的执行方式。现在,您需要进入generatedData.py文件中,手动修改dirX的值为当前文件所在路径。您需要执行generatedData.py,生成的数据文件会放在该目录的gen文件夹下。
- 修改了算法,使得用户、朋友、店铺和标签之间存在一些关联。
- 修正了alpha.2中的“关注”关系为互相的“朋友”关系。
- 修正了alpha.2中的朋友最小数目。
- 加入了更多的输入选项。注意:传播的保留百分比越高,相关度越高;传播次数越高,耗时越长。
alpha.4更新说明
- 在生成用户访问数的时候采用了新的算法,加入了允许负数的选项以拉大访问数差距。
alpha.5更新说明
- 修改了生成时间戳的算法。现在类别相同的时间戳应该更加相似。
- 修改了标签生成的算法,由于程序变动,现在在您输入标签传播比例的时候,请保证该值大于0.8,否则可能出现用户标签为空的情况。
- 由于时间戳生成算法修改,产生时间戳的函数发生变动。现在您不需要输入时间戳的变动次数了。
- 修正了店铺、类别的数据文件存放位置不同的bug。现在它们应该统一位于gen文件夹下。
- 修正了一处店铺生成的关键错误。
alpha.51更新说明
- 修复了当用户浏览次数基准小于10的时候random函数报错的问题。
alpha.6更新说明
- 新增生成音乐数据集功能,其结构与lastfm数据集相同。使用方法为:打开generateMusicData.py,手动修改dirX的值为当前文件所在路径然后执行。
- 音乐数据集中取消了允许负数权重的选项,但取决于您输入的参数仍有可能出现负数。
alpha.61更新说明
- 给出了参数的参考文档。
- 按照需求,取消了权重允许负数情况的出现。请注意:朋友之间的共同店铺权重与非朋友之间的共同店铺的权重的差距可能有所缩小。
- 修复了一处文件名错误引起的文件丢失的问题。
alpha.62更新说明
- 按照FCIC的要求,修复了有些用户没有标签的问题,目前,有限的测试结果表明FCIC可正常运行。
- 修改了dirX的逻辑,现在,在进入文件时,请修改dirX的值为输出文件的存放位置。