j****e 发帖数: 140 | 1 设想:量化文章价值
口号:即使是灌水,也得是与众不同的水
想法:以以往文章为标准,测量文章的冗余度.
操作方法:1 版主维护本版相当数量的文章(不需要被整理),打包压缩
为ZIP文件.大小为A
2 新文章大小为B,将其加入打包文件,ZIP文件增大ΔS.
3 该文章的信息指数为ΔS, 新颖指数为ΔS/B,灌水指数为
(B-ΔS)^2/AB.
限制:必须保证新文章的可读性先.
小结:初步尝试,鉴于计算复杂性无法投入实际使用.
学信息的朋友,有没有现成的计算方法?好像在哪偷听过一耳朵信息熵
啥的是不是能干这个? |
|