永发信息网

数据挖掘需要哪些语言

答案:2  悬赏:0  手机版
解决时间 2021-01-02 11:34
数据挖掘需要哪些语言
最佳答案
问题一:数据挖掘的话,用什么语言比较方便 python, 提供了现成的挖掘工具开发包,祝你一生幸福问题二:做数据挖掘一般是用什么编程语言比较好 看什么领域了吧,
比如在社会经济领域,spss,sas,modeler等工具
一般的excel也可以
其他领域,编程能力强的可以用MATLAB,Python,R等语言
上面这几种最好都学一下问题三:数据挖掘所要学的语言有啥呀? C C++ java matlab vba sas 都可以。。。。问题四:问题做数据挖掘一般是用什么编程语言比较好 研究类的用matlab,应用类的用python,R,大牛用C,C++问题五:研究生人工智能与数据挖掘方向需要学什么语言吗?比如java或者c++之类? 我研究生是数据挖掘的方向 人工智能主要是学一些理论知识 因为人工智能能在任何一个计算机方向上得到运用 所以老师并没有指定一门语言 而是希望我们在自己的方向上用上这些知识
数据库挖掘的话 我们导师是要求我们看下java sql还有sqlserver 毕竟研究生阶段还是要帮老师做项目的 我们这都用java做的项目 并且很多课程都是建议我们用java编程实现 所以学点java还是有好处的问题六:学习数据挖掘需要那些基础知识? 入门推荐你看《机器学习实战》,不需要你跑去学习算法和数据结构,不需要解析几何的知识,但是数理统计的基础你必须要有,期望、方差、常用的几种概率分布,尤其注意一下条件概率,因为朴素贝叶斯模型你一定要懂,线性代数至少你要明白矩阵乘法、行列式计算,再就是微积分知识,不然你看不懂所有基于梯度下降法的文献,行业内用的比较多的是c++,java和python,推荐你用python,很多模型不需要你造轮子,python有相关的第三方模块,很方便。
数据挖掘涉及的内容比较泛,机器学习、数据挖掘、人工智能,但实际上这些知识大多是相通的,机器学习实战这本书是我看的启蒙书里很好的一本了,该有的都有,难度较小,有理论有实践,可以较快的对各种知识有个大概的了解,但是想要长期在这个行业发展,还需要学习更多的知识,比如说提到回归模型,你不仅仅要知道最小二乘法,你还要想到怎么进行数据清洗、哪些数据需要清洗,怎么规范数据,数据是否过多,要不要进行归约和降维,采用哪种回归模型,精确度大致要达到什么水平,要不要考虑过拟合和欠拟合,要不要进行交叉验证,几折交叉验证效果好,如果回归模型不适用,有哪些备选方案。比如说决策树模型,书上简单的讲了个if-then就完了,按照什么规则生成树,怎么分层,要不要剪枝,最终的效果怎么样,造成误差的原因是模型太复杂还是太简单,怎么综合其他模型对决策树进行改进,数据的聚类方法用k均值还是DBSCAN,需要对数据进行分类的时候要考虑数据量大不大,SVM还是神经网络,数据量计算机吃不吃得消,一次吃不消该怎么做,等你对这些有了大致的了解之后,好好看看《统计学习方法》这本书,深入地了解一下理论部分,看一看核心部分的数学模型,看一看如何算法实现,着重理解一下拉格朗日微分法和拉格朗日对偶,解决等式约束和不等式约束很有用,这个也是使用智能算法尝试解决NP完全问题的一个结合点。
除了看书以外,其他时间全部用在学习编程上,python常用的numpy、matplotlib、scipy、sklearn、nltk这些包你都要大致了解怎么用,推荐你看看图灵程序设计丛书里的《python学习手册》《python自然语言处理》《python科学计算》,至少要知道怎么定义类、方法、属性,常用模块里有哪些好用的方法,常见的异常怎么排除,其他的在有时间的时候随用随学,至于算法和数据结构,有时间的话看看《算法导论》,肯定有所收获。
至于说书单就上豆瓣搜一搜,评分高的一般都比较靠谱,英文版的也比较靠谱问题七:学习数据挖掘一般要学哪些软件和工具 1、WEKA
WEKA 原生的非 Java 版本主要是为了分析农业领域数据而开发的。该工具基于 Java 版本,是非常复杂的,并且应用在许多不同的应用中,包括数据分析以及预测建模的可视化和算法。与 RapidMiner 相比优势在于,它在 GNU 通用公共许可证下是免费的,因为用户可以按照自己的喜好选择自定义。
WEKA 支持多种标准数据挖掘任务,包括数据预处理、收集、分类、回归分析、可视化和特征选取。添加序列建模后,WEKA 将会变得更强大,但目前不包括在内。
2、RapidMiner
该工具是用 Java 语言编写的,通过基于模板的框架提供先进的分析技术。该款工具最大的好处就是,用户无需写任何代码。它是作为一个服务提供,而不是一款本地软件。值得一提的是,该工具在数据挖掘工具榜上位列榜首。另外,除了数据挖掘,RapidMiner 还提供如数据预处理和可视化、预测分析和统计建模、评估和部署等功能。更厉害的是它还提供来自 WEKA(一种智能分析环境)和 R 脚本的学习方案、模型和算法。
RapidMiner 分布在 AGPL 开源许可下,可以从 SourceForge 上下载。SourceForge 是一个开发者进行开发管理的集中式场所,大量开源项目在此落户,其中就包括维基百科使用的 MediaWiki。
3、NLTK
当涉及到语言处理任务,没有什么可以打败 NLTK。NLTK 提供了一个语言处理工具,包括数据挖掘、机器学习、数据抓取、情感分析等各种语言处理任务。
而您需要做的只是安装 NLTK,然后将一个包拖拽到您最喜爱的任务中,您就可以去做其他事了。因为它是用 Python 语言编写的,你可以在上面建立应用,还可以自定义它的小任务。问题八:想学大数据分析,机器学习,数据挖掘,学什么软件(语言)好? 学术界里面用的最多的是matlab,其次是python,少量人用R问题九:学习数据挖掘一般要学哪些软件和工具 1、WEKA
WEKA 原生的非 Java 版本主要是为了分析农业领域数据而开发的。该工具基于 Java 版本,是非常复杂的,并且应用在许多不同的应用中,包括数据分析以及预测建模的可视化和算法。与 RapidMiner 相比优势在于,它在 GNU 通用公共许可证下是免费的,因为用户可以按照自己的喜好选择自定义。
WEKA 支持多种标准数据挖掘任务,包括数据预处理、收集、分类、回归分析、可视化和特征选取。添加序列建模后,WEKA 将会变得更强大,但目前不包括在内。
2、RapidMiner
该工具是用 Java 语言编写的,通过基于模板的框架提供先进的分析技术。该款工具最大的好处就是,用户无需写任何代码。它是作为一个服务提供,而不是一款本地软件。值得一提的是,该工具在数据挖掘工具榜上位列榜首。另外,除了数据挖掘,RapidMiner 还提供如数据预处理和可视化、预测分析和统计建模、评估和部署等功能。更厉害的是它还提供来自 WEKA(一种智能分析环境)和 R 脚本的学习方案、模型和算法。
RapidMiner 分布在 AGPL 开源许可下,可以从 SourceForge 上下载。SourceForge 是一个开发者进行开发管理的集中式场所,大量开源项目在此落户,其中就包括维基百科使用的 MediaWiki。
3、NLTK
当涉及到语言处理任务,没有什么可以打败 NLTK。NLTK 提供了一个语言处理工具,包括数据挖掘、机器学习、数据抓取、情感分析等各种语言处理任务。
而您需要做的只是安装 NLTK,然后将一个包拖拽到您最喜爱的任务中,您就可以去做其他事了。因为它是用 Python 语言编写的,你可以在上面建立应用,还可以自定义它的小任务。
4、Orange
Python 之所以受欢迎,是因为它简单易学并且功能强大。如果你是一个 Python 开发者,当涉及到需要找一个工作用的工具时,那么没有比 Orange 更合适的了。它是一个基于 Python 语言,功能强大的开源工具,并且对初学者和专家级的大神均适用。
此外,你肯定会爱上这个工具的可视化编程和 Python 脚本。它不仅有机器学习的组件,还附加有生物信息和文本挖掘,可以说是充满了数据分析的各种功能。
5、KNIME
数据处理主要有三个部分:提取、转换和加载。 而这三者 KNIME 都可以做到。 KNIME 为您提供了一个图形化的用户界面,以便对数据节点进行处理。它是一个开源的数据分析、报告和综合平台,同时还通过其模块化数据的流水型概念,集成了各种机 器学习的组件和数据挖掘,并引起了商业智能和财务数据分析的注意。
KNIME 是基于 Eclipse,用 Java 编写的,并且易于扩展和补充插件。其附加功能可随时添加,并且其大量的数据集成模块已包含在核心版本中。
6、R-Programming
如果我告诉你R项目,一个 GNU 项目,是由 R(R-programming简称,以下统称R)自身编写的,你会怎么想?它主要是由 C 语言和 FORTRAN 语言编写的,并且很多模块都是由 R 编写的,这是一款针对编程语言和软件环境进行统计计算和制图的免费软件。
R语言被广泛应用于数据挖掘,以及开发统计软件和数据分析中。近年来,易用性和可扩展性也大大提高了 R 的知名度。除了数据,它还提供统计和制图技术,包括线性和非线性建模,经典的统计测试,时间序列分析、分类、收......余下全文>>问题十:数据挖掘会用到什么编程语言,jawa 、c 或 c++?还是别的什么? 只要是编程语言(估计需要除了汇编和机器码),理论上都可以做。一个特定的功能不会要求固定的语言
全部回答
我好好复习下
我要举报
如以上问答信息为低俗、色情、不良、暴力、侵权、涉及违法等信息,可以点下面链接进行举报!
大家都在看
我想卖韩国化妆品whoo后但是不知道哪里去拿货
宁波买房子要什么手续?需要哪些证明?
2015年去日本旅游多少钱?
红钻花肥料有用在叶面上的肥料吗?
湛江到顺德经过几个站
人类的一切社会活动都有其自身的原理,下列活
家里做的盐蛋,要吃了,但是太咸了,怎么办?
老人心情烦燥是怎么、回事
沙特阿拉伯西南部降水量偏多的原因
陌头是什么意思
慢用它的意思到处都是
怀化到韶山怎么走
无理数的定义是什么
挖机多少钱一个小时
匡的偏旁叫什么名字
推荐资讯
国际商务专业毕业生,能考哪些证书
自己的承包地可以种植经济林?
学生应该抽什么烟最好?
耳机(非电脑用,不带麦)接线口处松动可以自
鹏程万里的含义
已知非零自然数m和n满足2m+3n=9,则m+n=A.2B.
南宁高新技术产业开发区地方税务局办税服务厅
汕尾市国家税务局马宫管理组在什么地方啊,我
天津大学《材料科学基础》用的那本书?
去括号:(a+b)-2(a-b)=________.
为什么达州到安岳那趟直达车原本是8:30 发车
我喜欢丹尼尔笛福的鲁滨逊漂流记作文
正方形一边上任一点到这个正方形两条对角线的
阴历怎么看 ?