有人想上商业大数据分析与挖掘掘的么

数据挖掘(data mining),机器学习(machine learning),和人工智能(AI)的区别是什么? 数据科学(data science)和商业分析(business analytics)之间有什么关系? - Donx - 博客园
随笔 - 7, 文章 - 0, 评论 - 3, 引用 - 0
本来我以为不需要解释这个问题的,到底数据挖掘(data mining),机器学习(machine learning),和人工智能(AI)有什么区别,但是前几天因为有个学弟问我,我想了想发现我竟然也回答不出来,我在知乎和博客上查了查这个问题,发现还没有人写过比较详细和有说服力的对比和解释。那我根据以前读的书和论文,还有和与导师之间的交流,尝试着说一说这几者的区别吧,毕竟一个好的定义在未来的学习和交流中能够发挥很大的作用。同时补上数据科学和商业分析之间的关系。能力有限,如有疏漏,请包涵和指正。
本文主要分为两部分,第一部分阐述数据挖掘(data mining),机器学习(machine learning),和人工智能(AI)之间的区别。这三者的区别主要是目的不同,其手段(算法,模型)有很大的重叠,所以容易混淆。第二部分主要阐述以上的技能与数据科学(data science)的关系,以及数据科学(data science)和商业分析(business analytics)之间的关系。其实,数据科学家本身就是商业分析师在大数据时代的延伸。
数据挖掘VS. 机器学习VS. 人工智能
数据挖掘 (data mining): 有目的地从现有大数据中提取数据的模式(pattern)和模型(model)
关键字:模式提取,大数据
数据挖掘是从现有的信息(existing information)中提取数据的模式(pattern)和模型(model),即精选出最重要的信息,以用于未来机器学习和AI的数据使用。其核心目的是找到数据变量之间的关系。其发展出来的主要原因是大数据的发展,用传统的数据分析的方式已经无能处理那么多大量的看似不相关的数据的处理,因此需要数据挖掘技术去提取各种数据和变量之间的相互关系,从而精炼数据。数据挖掘本质上像是机器学习和人工智能的基础,他的主要目的是从各种各样的数据来源中,提取出超集(superset)的信息,然后将这些信息合并让你发现你从来没有想到过的模式和内在关系。这就意味着,数据挖掘不是一种用来证明假说的方法,而是用来构建各种各样的假说的方法。数据挖掘不能告诉你这些问题的答案,他只能告诉你,A和B可能存在相关关系,但是它无法告诉你A和B存在什么相关关系。当然,数据挖掘会使用大量机器学习的算法,但是其特定的环境和目的和机器学习不太一样。
机器学习(machine learning): 自动地从过往的经验中学习新的知识。
关键字: 自动化,自我优化,预测,需要training data,推荐系统
机器学习其实是人工智能很重要的一部分,因为目前,在实践过程中,大多数的人工智能处理的任务,其实是用机器学习的方式完成的。机器学习可以用程序和算法自动地学习,只要被设计好了,这个程序可以进行自我优化。同时,机器学习需要一定数量的训练数据集(training data set),用于构建来自过往经验的&知识& 。且机器学习目前在实践中最重要的功能便是预测结果。比如机器学习已经学习结束了,现在有一个新的数据集x,需要预测其分类,机器学习算法会根据这个新数据与学习后的&知识&相匹配(实际上,知识指的是学习后的数学模型),然后将这个数据集x分类某类C去。再比较常见的机器学习,比如amazon的推荐系统。
人工智能(AI): 一个广泛的概念,本质是用数据和模型去为现有的问题(existing problems)提供解决方法(solutions).
关键字:和人一样处理问题,技术的合集
人工智能是一个与机器学习和数据挖掘相对不同的概念,人工智能的目的是为了去创造有智力的电脑(不知道怎么翻译好,可以假设其为机器人)。在实践中,我们希望这个电脑可以像有智力的人一样处理一个任务。因此,理论上人工智能几乎包括了所有和机器能做的内容,当然也包括了数据挖掘和机器学习的内容,同时还会有监视(monitor)和控制进程(process control)的内容。
数据科学(data science)和商业分析(business analytics)的关系?
其实以前,我们是没有数据科学家(data scientist),和数据科学(data science)这个概念的。我们称呼做相关内容的方式更多叫商业分析(business analytics)。
在2011年的时候,麦肯锡发表了提出了现在很多的公司已经开始往分析才能(analytical talent)中获得竞争优势。虽然这不是第一篇提出这个概念的公司,但是是第一次提出,数据分析能力也有助于商业公司去发现潜在的机会,而不仅仅只对技术公司有效。接着麦肯锡认为到了2018年,美国大约会有190,000的项目缺少&深度分析能力(Deep Analytical Talent)&,而这些深度分析能力,是由大数据(big data)驱动的。至此,麦肯锡将&商业分析&进一步形容为&深度分析能力&。
接着DJ Patil和Jeff Hammerbacher在其写的,将麦肯锡的&深度分析能力&称为了&数据科学家(data scientists)&。他们在文中提到:
商业分析师(business analyst)看起来太局限了,数据分析师(data anlyst)是他们的竞争者,但是我们还是觉得这个称呼太局限了。....我们认为最好的称呼应该是&数据科学家(data scientist)&,因为这些人需要同时使用数据(data)和科学(science)去创造一些新的东西。
紧接着,DJ Patil加了一些关键特点用于去寻找一个数据科学家(data scientist):
专业技术(Technical expertise): 最好的数据科学家需要有关于某些科学学科的深度专业知识(deep expertise)。
好奇心(Curiosity): 一个优秀的数据科学家需要有挖掘潜在关系,解决问题和证明假说的强烈好奇心和渴望。
讲故事的能力(Storytelling): 能用数据讲一个生动的故事的能力,它能使交流更加有效。
聪明(Cleverness): 能够创造性地解决问题的能力。
随后,数据科学家这个概念才开始被广为流传。那么数据科学家需要具备哪些专业能力?不同的公司有不同的看法和意见(反正大家好像都喜欢把所有一切的期许都放在一个新兴的行业中),这里列举一个比较流行的看法:1.Drew Conway&s&
2.Drew Tierney&s&
最后附赠一张&作弊纸&,列出几乎所有的商业问题(Business Problems),想要入门成为一个优秀的商业分析师,或者是数据科学家,强烈推荐保存!!!!!!!!!!!!以后有时间,我会尝试着逐一翻译和解说一下。
拓展阅读(英文):
:不知道为什么现在什么&独角兽&型的这种理念会那么流行,企业也爱叫独角兽,行业内也爱叫独角兽。。但为什么一提到独角兽,我先想到的是巫师系列游戏。(捂脸~)
:用于商业分析的十大工具,强烈推荐阅读!!!
:第二部分内容主要来源的原文。
参考文献:
各种乱七八糟的书和课件的笔记。
Drew Conway&s&
Drew Tierney&s&>>>九大商业智能分析平台你选哪个?订阅:
九大商业智能分析平台你选哪个?
摘要:随着大数据时代的来临,商业智能这个词在国外企业界出现,其代表为提高企业运营性能而采用的一系列方法、技术和软件。它把先进的信息技术应用到整个企业,不仅为企业提供信息获取能力,而且通过对信息的开发,将其转变为企业的竞争优势,也有人称之为混沌世界中的智能。因此,越来越多的企业提出他们对BI的需求,把BI作为一种帮助企业达到经营目标的一种有效手段。
来源:互联网
  随着大数据时代的来临,商业智能这个词在国外企业界出现,其代表为提高企业运营性能而采用的一系列方法、技术和软件。它把先进的信息技术应用到整个企业,不仅为企业提供信息获取能力,而且通过对信息的开发,将其转变为企业的竞争优势,也有人称之为混沌世界中的智能。因此,越来越多的企业提出他们对BI的需求,把BI作为一种帮助企业达到经营目标的一种有效手段。
  目前,商业智能通常被理解为将企业中现有的数据转化为知识,帮助企业做出明智的业务经营决策的工具。为了将数据转化为知识,需要利用数据仓库、线上分析处理(OLAP)工具和数据挖掘等技术。因此,从技术层面上讲,商业智能不是什么新技术,它只是ETL、数据仓库、OLAP、数据挖掘、数据展现等技术的综合运用。
  商业智能(BI)厂商正在寻求从大量的资料来源,新的先进的数据可视化功能,以帮助企业应对日益庞大的数据集。商业智能(BI)厂商都在寻求新的先进的数据可视化功能,以帮助企业解决这个问题。下面我们来看一下目前在商业智能比较领先的系统平台:
  蓝色巨人IBM最全面的BI产品
  蓝色巨人IBM有一个最全面的商业智能(BI)产品,它结合了软件,硬件和服务。在今年早些时候,Cognos增加了基于桌面的高级数据可视化与的洞察力分析。
  (图片来自网络)
  Cognos是在BI核心平台之上,以服务为导向进行架构,是唯一可以通过单一产品和在单一可靠架构上提供完整业务智能功能的解决方案,它可以提供无缝密合的报表、分析、记分卡、仪表盘等解决方案,通过提供所有的系统和资料资源,以简化公司各员工处理资讯的方法。作为一个全面、灵活的产品,Cognos业务智能解决方案可以容易地整合到现有的多系统和数据源架构中。
  数据分析市场后期之秀微软
  Information Builders
  Information Builders是世界上最出名的大规模部署BI的公司。通过它的WebFOCUS平台为企业用户提供先进的数据分析。WebFOCUS是一功能强大、高度集成、具有高性能和高延展性的企业商务智能套件,是目前业界中可用性(Usable)、散播性(Deployable)和延展性(Scalable)最佳的实时信息传递解决方案。从标准报表、自助式报表到即席查询、OLAP分析、动态排程或预警分发,WebFOCUS提供了所有的特征和功能,可满足企业内外用户各种各样的信息需求。
  (图片来自网络)
  此外,WebFOCUS的强大功能可访问企业现有的所有数据源,从遗留数据到数据仓库,也是无以匹敌的。目前,每天都有数百万用户通过企业内、外部网络或互连网络使用WebFOCUS所开发的应用系统。
  微软可以说是数据分析可视化市场上的后期之秀。 Microsoft BI 通过三个层面或工作负载交付:数据仓库、报表与分析以及绩效管理。所有这一切都旨在提供整合的、全面的数据源和工具,以帮助改进决策制订。在我们看来,Microsoft BI 的承诺就是:帮助组织内所有层面的决策者对其决策所支持的企业目标与计划充满信心。
  (图片来自网络)
  MicroStrategy
  MicroStrategy公司是专门从事运行在大型企业级上的BI部署数据仓库,提供直观地浏览数据的能力,并使用可视化数据分析工具生成的见解。
  (图片来自网络)
  MicroStrategy能够协助各公司开发各种大型数据库以及个人用户的分析软件允许各公司通过电话、传真、电子邮件以及互联网向用户传送各种定制的、个性化的信息。用户也可以根据自己的情况决定何时或者以和种方式等来收看各公司的信息。
  甲骨文是商业智能中领军者
  Oracle
  很多企业都将甲骨文作为商业智能方面的竞争对手,甲骨文的解决方案得到了广泛应用。Oracle商务智能企业版(OBIEE)最早是由一组经验丰富的商务智能和数据仓库专家从1997年开始设计、开发的新一代商务智能平台。整个平台针对百分百Web架构来设计,从一开始就引入了很多全新的思想-希望能给尽可能多的企业员工提供全面的商务智能能力,尽可能的让商务智能直观易懂、便于使用和充满交互,从而让整个组织架构中的每个人都能从中得益。
  (图片来自网络)
  QlikTech
  QlikTech是全球增长最快的商业智能(BI)公司,其旗舰产品 QlikView 提供即时商业答案,使用户能够轻松自如、无限制地挖掘自己的数据。与传统商业智能不同的是,QlikView能够为用户迅速创造价值,其投资回报期仅为数天或数周,而不是数月、数年或永远收不回投资。它是唯一一款能够在经营场所、云计算平台、笔记本电脑或者移动装置上部署的产品,适用于任何企业,从单个用户到大型国际企业。
  (图片来自网络)
  SAP BusinessObjects是全球领先的商务智能(BI)软件公司的产品套件,Business Objects XI 为报表、查询和分析、绩效管理以及数据集成提供了最完善、最可靠的平台。
  (图片来自网络)
  以SAP BusinessObjects现有成功产品组合为坚实基础,这项全新解决方案使得企业可以集中精力改进其在经济、社会和环保方面的绩效,而无需将大量时间花费在收集相关数据和编写报告上。SAP BusinessObjects可持续发展绩效管理解决方案能够为企业提供可持续性指标的整体视图,通过简单易用的界面来简化内部和外部报告流程。
  SAS为很多企业解决业务问题
  SAS企业级商业智能已经为很多企业解决了复杂的业务问题,特别是对那些需要先进的分析方法,对大型非结构化数据源的企业的共同选择。
  (图片来自网络)
  SAS商业分析框架包括行业和业务线解决方案,以及分析、数据管理、查询和报表技术。公司可首先解决最重要的关键业务问题,然后随着时间的推移逐渐添加新功能,以支持持续的绩效改进。
  Tableau
  Tableau是桌面系统中最简单的商业智能工具软件,Tableau没有强迫用户编写自定义代码,新的控制台也可完全自定义配置。在控制台上,不仅能够监测信息,而且还提供完整的分析能力。Tableau控制台灵活,具有高度的动态性。
  (图片来自网络)
  Tableau公司将数据运算与美观的图表完美地嫁接在一起。它的程序很容易上手,各公司可以用它将大量数据拖放到数字&画布&上,转眼间就能创建好各种图表。这一软件的理念是,界面上的数据越容易操控,公司对自己在所在业务领域里的所作所为到底是正确还是错误,就能了解得越透彻。
  总结:商业智能作为企业业务驱动的决策支持系统,其发展是以较为完善企业的信息系统和稳定的业务系统为基础的。商业智能未来的应用与行业内信息化的基础状况密切相关,如何切实了解自身需求、选择具有优势的厂商产品,将是企业实施商业智能成功的关键。
商业智能相关文章BI相关文章
整体竞争力榜
云计算能力榜
最具人气榜
北京第二十六维信息技术有限公司(至顶网)版权所有. 京ICP备号-7 京ICP证161336号
京公网安备 00号苹果/安卓/wp
积分 60, 距离下一级还需 25 积分
道具: 彩虹炫, 涂鸦板, 雷达卡, 热点灯, 金钱卡, 显身卡下一级可获得
权限: 自定义头衔
购买后可立即获得
权限: 隐身
道具: 金钱卡, 彩虹炫, 雷达卡, 热点灯, 涂鸦板
苦逼签到天数: 13 天连续签到: 1 天[LV.3]偶尔看看II
本帖最后由 lk2556 于
17:35 编辑
①好的框架;②每个数据分析都有结论且要明确;
③数据分析结论要精且要基于紧密严禁的数据分析推导过程;
④可读性;
⑤图表化;
⑥逻辑性;
⑦基于可靠的数据源;
⑧一定要有解决方案和建议方案;
⑨不要害怕或回避“不良结论”,数据分析就是为了发现问题;
虽然写的简洁,但我觉得说的很有道理。就分享一下。
载入中......
总评分:&学术水平 + 1&
热心指数 + 1&
信用等级 + 1&
http://www. 数
宁愿相信,大器晚成
总结的好,如果有范例就更好了。。。
很好,有例子就完美了
一只小狗不孤单,想一只小狗才孤单
有点用,谢了
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
&nbsp&nbsp|
如有投资本站或合作意向,请联系(010-);
邮箱:service@pinggu.org
投诉或不良信息处理:(010-)
论坛法律顾问:王进律师有人了解美国的商业数据分析硕士专业吗? - 知乎302被浏览57768分享邀请回答7816 条评论分享收藏感谢收起有人想上商业数据分析与挖掘的么?【华东师范大学吧】_百度贴吧
&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&签到排名:今日本吧第个签到,本吧因你更精彩,明天继续来努力!
本吧签到人数:0成为超级会员,使用一键签到本月漏签0次!成为超级会员,赠送8张补签卡连续签到:天&&累计签到:天超级会员单次开通12个月以上,赠送连续签到卡3张
关注:173,569贴子:
有人想上商业数据分析与挖掘的么?收藏
选课选多了专业太忙担心照顾不过来……周三晚上的 3个学分的王仁武老师的商业数据分析与挖掘 创业创新课 大家有通识精品或者通识选修想跟我换的么?
放肆联想,真我主场,全场产品爆款直降,满千减百,新一代八代新机抢鲜购!
我想上,同学我们联系一下吧。
我有一门比较视野下的东西方文明
额啊……我怎么感觉你这个也挺繁重的……
什么地点呀?
在数据爆炸大数据云计算时代,如何进行数据挖掘获取用户的行为习惯是每家企业的必修课…我建议如果楼主想从事互联网行业的话最好学习下,加分项
登录百度帐号推荐应用

我要回帖

更多关于 商业数据挖掘 的文章

 

随机推荐