大数据分析及挖掘技术
发布日期:2021-06-29 00:54:50 浏览次数:2 分类:技术文章

本文共 1023 字,大约阅读时间需要 3 分钟。

我们在使用大数据的时候会涉及到很多大数据技术,掌握这些技术是使用大数据的前提。在这篇文章中我们将给大家介绍一下大数据分析和挖掘技术,希望这篇文章能够更好地帮助大家提升大数据技能,学以致用,完全运用到工作当中。

首先我们给大家介绍一下大数据分析技术,其实大数据分析技术就是改进已有数据挖掘和机器学习技术。开发数据网络挖掘、特异群组挖掘、图挖掘等新型数据挖掘技术。突破基于对象的数据连接、相似性连接等大数据融合技术。突破用户兴趣分析、网络行为分析、情感语义分析等面向领域的大数据挖掘技术。

那么数据挖掘是什么呢?其实数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。而数据挖掘涉及的技术方法很多,有多种分类法。根据挖掘任务可分为分类或预测模型发现、数据总结、聚类、关联规则发现、序列模式发现、依赖关系或依赖模型发现、异常和趋势发现等等。数据挖掘的计算复杂度和灵活度远远超过前两类需求。一是由于数据挖掘问题开放性,导致数据挖掘会涉及大量衍生变量计算,衍生变量多变导致数据预处理计算复杂性。二是很多数据挖掘算法本身就比较复杂,计算量就很大,特别是大量机器学习算法,都是迭代计算,需要通过多次迭代来求最优解。根据挖掘对象可分为关系数据库、面向对象数据库、空间数据库、时态数据库、文本数据源、多媒体数据库、异质数据库、遗产数据库以及环球网Web。根据挖掘方法分,数据挖掘可以粗分为:机器学习方法、统计方法、神经网络方法和数据库方法。而数据挖掘主要过程是:根据分析挖掘目标,从数据库中把数据提取出来,然后经过ETL组织成适合分析挖掘算法使用宽表,然后利用数据挖掘软件进行挖掘。传统的数据挖掘软件,一般只能支持在单机上进行小规模数据处理,受此限制传统数据分析挖掘一般会采用抽样方式来减少数据分析规模。

那么机器学习中学习方法怎么区分呢?其实机器学习中,可细分为归纳学习方法、基于范例学习、遗传算法等。而在统计方法中,可细分为回归分析、判别分析、聚类分析、探索性分析等。而在神经网络方法中,可细分为前向神经网络、自组织神经网络等。数据库方法主要是多维数据分析或OLAP方法,另外还有面向属性的归纳方法。

在这篇文章中我们给大家介绍了关于大数据分析和数据挖掘的相关知识,相信大家看了这篇文章以后已经对数据挖掘和大数据的相关知识有了更深一步的理解,最后祝愿大家都能够学有所成。

转载地址:https://blog.csdn.net/yoggieCDA/article/details/94400895 如侵犯您的版权,请留言回复原文章的地址,我们会给您删除此文章,给您带来不便请您谅解!

上一篇:大数据告诉你——垃圾围城,现行的垃圾分类制度,作用到底能有多大?
下一篇:大数据采集技术和预处理技术

发表评论

最新留言

关注你微信了!
[***.104.42.241]2024年04月07日 02时40分42秒

关于作者

    喝酒易醉,品茶养心,人生如梦,品茶悟道,何以解忧?唯有杜康!
-- 愿君每日到此一游!

推荐文章