博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
数据挖掘中哪些算法使用率较高?
阅读量:4310 次
发布时间:2019-06-06

本文共 919 字,大约阅读时间需要 3 分钟。

美国2006年机器学习和知识发现年会中的现场投票结果可以给我们一点线索。下面是最近12个月中使用各种算法的人次(共203人投票)。 决策树 Decision Trees/Rules (127) 62.60% 回归 Regression (104) 51.20% 聚类 Clustering (102) 50.20% 描述性统计分析 Statistics (descriptive) (94) 46.30% 可视技术Visualization (66) 32.50% 关联法则 Association rules (53) 26.10% 时序 Sequence/Time series analysis (35) 17.20% 神经网络 Neural Nets (35) 17.20% 支持向量机 SVM (32) 15.80% 贝叶斯 Bayesian (32) 15.80% Boosting (30) 14.80% 近邻 Nearest Neighbor (26) 12.80% 模型合成 Hybrid methods (24) 11.80% 其它 Other (23) 11.30% 遗传算法Genetic algorithms (23) 11.30% Bagging (22) 10.80% 由于是自愿投票,对投票人的背景,行业,和工作领域没有任何控制,因此这个结果在代表性方面当然是不够完整的。但是,我们还是可以通过这个调查粗略了解到目前数据挖掘算法的使用态势。总的来说,用于分类和预测的决策树和回归算法,以及用于描述的聚类分析占有主导地位。对于有志于从事数据挖掘的毕业生和专业人士来说,掌握和精通这几种算法有最广阔的应用前景。 决策树和逻辑回归从技术角度看,都不是太高深的算法。但是能得到普遍的应用,说明它们在解决不同行业,不同领域中的数据挖掘问题上都有很好的功效,说明企业的管理人员对这些算法的接受程度较好;也反映了企业拥有的数据并不是复杂到非需要高深的算法才可以对付的程度。此外不可忽略的是,这些算法在计算速度上有一定优势。

转载于:https://www.cnblogs.com/u0mo5/p/3973713.html

你可能感兴趣的文章
利用正则表达式群发定制邮件
查看>>
【原】RDD专题
查看>>
第三周——构建一个简单的Linux系统MenuOS
查看>>
Docker 的两类存储资源 - 每天5分钟玩转 Docker 容器技术(38)
查看>>
Codeforces 257D
查看>>
常用的20个强大的 Sublime Text 插件
查看>>
ajaxfileupload.js在IE中的支持问题
查看>>
tensorflow学习之(十)使用卷积神经网络(CNN)分类手写数字0-9
查看>>
当document.write里含有script标签时
查看>>
工作中常见问题
查看>>
JAVA 从一个List里删除包含另一个List的数据
查看>>
外国的月亮比较圆吗?外籍团队工作有感
查看>>
CentOS 关闭烦人的屏保
查看>>
分布式系统事务一致性解决方案
查看>>
ShuffleNet总结
查看>>
前后台验证字符串长度
查看>>
《算法导论 - 思考题》7-1 Hoare划分的正确性
查看>>
UVa 10491 奶牛和轿车(全概率公式)
查看>>
[Hadoop]-HDFS-架构篇
查看>>
Metronic-最优秀的基于Bootstrap的响应式网站模版
查看>>