何惧熔断，看技术派如何利用机器学习预测2018中国股市怎么了

solidworks | PHP | c4d | 细胞生物学 | HTML | 冬奥会 | 基因 | 营销策划 | 扫地机器人 | 武侠 | 大学生就业 | 电学 | 国航 | 电子技术研发 | 几何学 | 外星人 | 语言学 | 秦时明月之天行九歌 | 金融数学 | 三国人物 | 休学 | 小店区 | 杨紫 | 植保无人机 | CSS | 陶渊明 | 少数民族 | AutoCAD | 3d打印机 | 香港购物 | 日语语法 | 对联 | matlab | 按键精灵 | 粉丝（Fans） | 语言学习 | 总决赛 | 驾驶经验 | Spss数据分析 | 日本漫画 | 数学建模 | 道德 | 项目管理 | 背景音乐（bgm） | 云主机 | 3D Max | onenote | 游戏原画 | 科学 | 网站建设 | 热血传奇（游戏） | 身高 | 网站运营 | 道教 | 社会学 | 迅雷（软件） | 爬虫（计算机网络） | O2O | 运载火箭 | 遗传学 | 率土之滨 | 百度输入法 | 极限挑战(综艺节目) | 电梯 | 女性主义 | Adobe After Effects | mysql | 办公软件 | 法国 | ps3 | 化学实验 | QQ群 | 中国中央电视台 | 前女友 | 性格 | 免费软件 | 分子生物学 | 金庸小说 | 留学生 | Microsoft SQL Server | 龙珠 | 设计院 | C#编程 | 虚拟机 | 字幕 | 微信群 | 创业项目 | 祛痘 | 图形处理器（gpu） | Microsoft Visual Studio | 动物保护 | C/C++ | facebook | 秦岭 | 燕窝 | 人性 | 下载 | 驾驶技术 | 大学数学 | 封神演义 | 整容 | 西装 | 马克思主义哲学 | 计算机专业 | pdf | thinkpad | 代理 | 参考文献 | 江苏大学 | 游戏手柄 | 城市规划 | 黑洞 | 旅行 | CAD制图 | 风水 | 直播 | 快捷键 | 编辑器 | 机器学习 | 暴走大事件 | 球球大作战 | unity（游戏引擎） | 永恒之塔 | DJI大疆创新 | 传统文化 | wordpress | 仙剑奇侠传（游戏） | 国际物流 | 安徽 | 配音 | 猎头公司 | 在线教育 | 欧洲冠军联赛 | ios游戏 | 洛奇英雄传 | 暗恋 | 网盘 | 星座爱情 | 剧场版 | 面相 | 讯飞输入法 | 记忆力 | 超级战队 | stm32 | 亚马逊中国 | Apple ID | 服装设计 | 网络主播 | 品牌营销 | 情侣 | 新加坡 | 调酒 | 雷欧奥特曼 | 花样姐姐 | 物联网 | 任天堂3ds | 易经 | 户型 | 流氓软件 | 圣经 | 进化 | 垃圾分类 | 函数 | 星际穿越（电影） | 山东工艺美术学院 | 优酷视频 | github | 舰队 Collection | 流行音乐 | 进击的巨人 | playstation vita | 科学研究 | 欢乐麻将 | 史莱姆 | 海关 | Internet Explorer | 刑事案件 | 取名 | 江苏银行 | eDonkey网络 | 表情包 | mfc | 大学军训 | 诸葛亮 | Apple WATCH | 嵌入式系统 | 私募证券投资基金 | iOS应用 | 对外经贸大学 | 最强大脑（电视节目） | 青蛙 | 日本代购 | 巧克力 | 天涯明月刀ol（游戏） | 食用油 | 曹操 | SEO | 生命 | 乌贼 | 我的英雄学院 |

你的位置：网站首页 >> 频道首页 >>学习 >>何惧熔断，看技术派如何利用机器学习预测2018中国股市怎么了

何惧熔断，看技术派如何利用机器学习预测2018中国股市怎么了

来源：蜘蛛抓取(WebSpider) 时间：2018-05-26 15:33 标签： 2018中国股市怎么了

有趣的机器学习：最简明入门指南 - 文章 - 伯乐在线
& 有趣的机器学习：最简明入门指南
在听到人们谈论机器学习的时候，你是不是对它的涵义只有几个模糊的认识呢？你是不是已经厌倦了在和同事交谈时只能一直点头？让我们改变一下吧！
本指南的读者对象是所有对机器学习有求知欲但却不知道如何开头的朋友。我猜很多人已经读过了“机器学习”的，倍感挫折，以为没人能给出一个高层次的解释。本文就是你们想要的东西。
本文目标在于平易近人，这意味着文中有大量的概括。但是谁在乎这些呢？只要能让读者对于ML更感兴趣，任务也就完成了。
何为机器学习？
机器学习这个概念认为，对于待解问题，你无需编写任何专门的程序代码，泛型算法（generic algorithms）能够在数据集上为你得出有趣的答案。对于泛型算法，不用编码，而是将数据输入，它将在数据之上建立起它自己的逻辑。
举个例子，有一类算法称为分类算法，它可以将数据划分为不同的组别。一个用来识别手写数字的分类算法，不用修改一行代码，就可以用来将电子邮件分为垃圾邮件和普通邮件。算法没变，但是输入的训练数据变了，因此它得出了不同的分类逻辑。
机器学习算法是个黑盒，可以重用来解决很多不同的分类问题。
“机器学习”是一个涵盖性术语，覆盖了大量类似的泛型算法。
两类机器学习算法
你可以认为机器学习算法分为两大类：监督式学习（Supervised Learning）和非监督式学习（Unsupervised Learning）。两者区别很简单，但却非常重要。
监督式学习
假设你是一名房产经纪，生意越做越大，因此你雇了一批实习生来帮你。但是问题来了——你可以看一眼房子就知道它到底值多少钱，实习生没有经验，不知道如何估价。
为了帮助你的实习生（也许是为了解放你自己去度个假），你决定写个小软件，可以根据房屋大小、地段以及类似房屋的成交价等因素来评估你所在地区房屋的价值。
你把3个月来城里每笔房屋交易都写了下来，每一单你都记录了一长串的细节——卧室数量、房屋大小、地段等等。但最重要的是，你写下了最终的成交价：
这是我们的“训练数据”。
我们要利用这些训练数据来编写一个程序来估算该地区其他房屋的价值：
这就称为监督式学习。你已经知道每一栋房屋的售价，换句话说，你知道问题的答案，并可以反向找出解题的逻辑。
为了编写软件，你将包含每一套房产的训练数据输入你的机器学习算法。算法尝试找出应该使用何种运算来得出价格数字。
这就像是算术练习题，算式中的运算符号都被擦去了：
天哪！一个阴险的学生将老师答案上的算术符号全擦去了。
看了这些题，你能明白这些测验里面是什么样的数学问题吗？你知道，你应该对算式左边的数字“做些什么”以得出算式右边的答案。
在监督式学习中，你是让计算机为你算出数字间的关系。而一旦你知道了解决这类特定问题所需要的数学方法后，你就可以解答同类的其它问题了。
非监督式学习
让我们回到开头那个房地产经纪的例子。要是你不知道每栋房子的售价怎么办？即使你所知道的只是房屋的大小、位置等信息，你也可以搞出很酷的花样。这就是所谓的非监督式学习。
即使你不是想去预测未知的数据（如价格），你也可以运用机器学习完成一些有意思的事。
这就有点像有人给你一张纸，上面列出了很多数字，然后对你说:“我不知道这些数字有什么意义，也许你能从中找出规律或是能将它们分类，或是其它什么-祝你好运！”
你该怎么处理这些数据呢？首先，你可以用个算法自动地从数据中划分出不同的细分市场。也许你会发现大学附近的买房者喜欢户型小但卧室多的房子，而郊区的买房者偏好三卧室的大户型。这些信息可以直接帮助你的营销。
你还可以作件很酷的事，自动找出房价的离群数据，即与其它数据迥异的值。这些鹤立鸡群的房产也许是高楼大厦，而你可以将最优秀的推销员集中在这些地区，因为他们的佣金更高。
本文余下部分我们主要讨论监督式学习，但这并不是因为非监督式学习用处不大或是索然无味。实际上，随着算法改良，不用将数据和正确答案联系在一起，因此非监督式学习正变得越来越重要。
老学究请看:还有很多其它种类的机器学习算法。但初学时这样理解不错了。
太酷了，但是评估房价真能被看作“学习”吗？
作为人类的一员，你的大脑可以应付绝大多数情况，并且没有任何明确指令也能够学习如何处理这些情况。如果你做房产经纪时间很长，你对于房产的合适定价、它的最佳营销方式以及哪些客户会感兴趣等等都会有一种本能般的“感觉”。强人工智能（Strong AI）研究的目标就是要能够用计算机复制这种能力。
但是目前的机器学习算法还没有那么好——它们只能专注于非常特定的、有限的问题。也许在这种情况下，“学习”更贴切的定义是“在少量范例数据的基础上找出一个等式来解决特定的问题”。
不幸的是，“机器在少量范例数据的基础上找出一个等式来解决特定的问题”这个名字太烂了。所以最后我们用“机器学习”取而代之。
当然，要是你是在50年之后来读这篇文章，那时我们已经得出了强人工智能算法，而本文看起来就像个老古董。未来的人类，你还是别读了，叫你的机器仆人给你做份三明治吧。
让我们写代码吧!
前面例子中评估房价的程序，你打算怎么写呢？往下看之前，先思考一下吧。
如果你对机器学习一无所知，很有可能你会尝试写出一些基本规则来评估房价，如下：
def estimate_house_sales_price(num_of_bedrooms, sqft, neighborhood):
# In my area, the average house costs $200 per sqft
price_per_sqft = 200
if neighborhood == "hipsterton":
# but some areas cost a bit more
price_per_sqft = 400
elif neighborhood == "skid row":
# and some areas cost less
price_per_sqft = 100
# start with a base price estimate based on how big the place is
price = price_per_sqft * sqft
# now adjust our estimate based on the number of bedrooms
if num_of_bedrooms == 0:
# Studio apartments are cheap
price = price — 20000
# places with more bedrooms are usually
# more valuable
price = price + (num_of_bedrooms * 1000)
return price
123456789101112131415161718192021222324252627
def estimate_house_sales_price(num_of_bedrooms, sqft, neighborhood):&&price = 0&&&# In my area, the average house costs $200 per sqft&&price_per_sqft = 200&&&if neighborhood == "hipsterton":&&&&# but some areas cost a bit more&&&&price_per_sqft = 400&&&elif neighborhood == "skid row":&&&&# and some areas cost less&&&&price_per_sqft = 100&&&# start with a base price estimate based on how big the place is&&price = price_per_sqft * sqft&&&# now adjust our estimate based on the number of bedrooms&&if num_of_bedrooms == 0:&&&&# Studio apartments are cheap&&&&price = price — 20000&&else:&&&&# places with more bedrooms are usually&&&&# more valuable&&&&price = price + (num_of_bedrooms * 1000)& return price
假如你像这样瞎忙几个小时，也许会取得一点成效，但是你的程序永不会完美，而且当价格变化时很难维护。
如果能让计算机找出实现上述函数功能的办法，这样岂不更好？只要返回的房价数字正确，谁会在乎函数具体干了些什么呢？
def estimate_house_sales_price(num_of_bedrooms, sqft, neighborhood):
price = &computer, plz do some math for me&
return price
def estimate_house_sales_price(num_of_bedrooms, sqft, neighborhood):&&price = &computer, plz do some math for me&&&&return price
考虑这个问题的一种角度是将房价看做一碗美味的汤，而汤中成分就是卧室数、面积和地段。如果你能算出每种成分对最终的价格有多大影响，也许就能得到各种成分混合起来形成最终价格的具体比例。
这样可以将你最初的程序（全是疯狂的if else语句）简化成类似如下的样子：
def estimate_house_sales_price(num_of_bedrooms, sqft, neighborhood):
# a little pinch of this
price += num_of_bedrooms * .213
# and a big pinch of that
price += sqft *
# maybe a handful of this
price += neighborhood * 2.
# and finally, just a little extra salt for good measure
price += 201.
return price
12345678910111213141516
def estimate_house_sales_price(num_of_bedrooms, sqft, neighborhood): price = 0& # a little pinch of this price += num_of_bedrooms * .213& # and a big pinch of that price += sqft * & # maybe a handful of this price += neighborhood * 2.& # and finally, just a little extra salt for good measure price += 201.& return price
请注意那些用粗体标注的神奇数字——.213, ,2., 和201.。它们称为权重。如果我们能找出对每栋房子都适用的完美权重，我们的函数就能预测所有的房价！
找出最佳权重的一种笨办法如下所示：
首先，将每个权重都设为1.0：
def estimate_house_sales_price(num_of_bedrooms, sqft, neighborhood):
# a little pinch of this
price += num_of_bedrooms * 1.0
# and a big pinch of that
price += sqft * 1.0
# maybe a handful of this
price += neighborhood * 1.0
# and finally, just a little extra salt for good measure
price += 1.0
return price
12345678910111213141516
def estimate_house_sales_price(num_of_bedrooms, sqft, neighborhood):&&price = 0&&&# a little pinch of this&&price += num_of_bedrooms * 1.0&&&# and a big pinch of that&&price += sqft * 1.0&&&# maybe a handful of this&&price += neighborhood * 1.0&&&# and finally, just a little extra salt for good measure&&price += 1.0&&&return price
将每栋房产带入你的函数运算，检验估算值与正确价格的偏离程度：
运用你的程序预测房屋价格。
例如：上表中第一套房产实际成交价为25万美元，你的函数估价为17.8万，这一套房产你就差了7.2万。
再将你的数据集中的每套房产估价偏离值平方后求和。假设数据集中有500套房产交易，估价偏离值平方求和总计为86,123,373美元。这就反映了你的函数现在的“正确”程度。
现在，将总计值除以500，得到每套房产的估价偏离平均值。将这个平均误差值称为你函数的代价。
如果你能调整权重使得这个代价变为0，你的函数就完美了。它意味着，根据输入的数据，你的程序对每一笔房产交易的估价都是分毫不差。而这就是我们的目标——尝试不同的权重值以使代价尽可能的低。
不断重复步骤2，尝试所有可能的权重值组合。哪一个组合使得代价最接近于0，它就是你要使用的，你只要找到了这样的组合，问题就得到了解决!
思想扰动时间
这太简单了，对吧？想一想刚才你做了些什么。你取得了一些数据，将它们输入至三个通用的简单步骤中，最后你得到了一个可以对你所在区域的房屋进行估价的函数。房价网，要当心咯！
但是下面的事实可能会扰乱你的思想：
1.过去40年来，很多领域（如语言学/翻译学）的研究表明，这种通用的“搅动数据汤”（我编造的词）式的学习算法已经胜过了需要利用真人明确规则的方法。机器学习的“笨”办法最终打败了人类专家。
2.你最后写出的函数真是笨，它甚至不知道什么是“面积”和“卧室数”。它知道的只是搅动，改变数字来得到正确的答案。
3.很可能你都不知道为何一组特殊的权重值能起效。所以你只是写出了一个你实际上并不理解却能证明的函数。
4.试想一下，你的程序里没有类似“面积”和“卧室数”这样的参数，而是接受了一组数字。假设每个数字代表了你车顶安装的摄像头捕捉的画面中的一个像素，再将预测的输出不称为“价格”而是叫做“方向盘转动度数”，这样你就得到了一个程序可以自动操纵你的汽车了！
太疯狂了，对吧？
步骤3中的“尝试每个数字”怎么回事？
好吧，当然你不可能尝试所有可能的权重值来找到效果最好的组合。那可真要花很长时间，因为要尝试的数字可能无穷无尽。
为避免这种情况，数学家们找到了很多来快速找到优秀的权重值，而不需要尝试过多。下面是其中一种：
首先，写出一个简单的等式表示前述步骤2：
这是你的代价函数。
接着，让我们将这同一个等式用机器学习的数学术语（现在你可以忽略它们）进行重写：
θ表示当前的权重值。 J(θ) 意为“当前权重值对应的代价”。
这个等式表示我们的估价程序在当前权重值下偏离程度的大小。
如果将所有赋给卧室数和面积的可能权重值以图形形式显示，我们会得到类似下图的图表：
代价函数的图形像一支碗。纵轴表示代价。
图中蓝色的最低点就是代价最低的地方——即我们的程序偏离最小。最高点意味着偏离最大。所以，如果我们能找到一组权重值带领我们到达图中的最低点，我们就找到了答案！
因此，我们只需要调整权重值使我们在图上能向着最低点“走下坡路”。如果对于权重的细小调节能一直使我们保持向最低点移动，那么最终我们不用尝试太多权重值就能到达那里。
如果你还记得一点微积分的话，你也许记得如果你对一个函数求导，结果会告诉你函数在任一点的斜率。换句话说，对于图上给定一点，它告诉我们那条路是下坡路。我们可以利用这一点朝底部进发。
所以，如果我们对代价函数关于每一个权重求偏导，那么我们就可以从每一个权重中减去该值。这样可以让我们更加接近山底。一直这样做，最终我们将到达底部，得到权重的最优值。（读不懂？不用担心，接着往下读）。
这种找出最佳权重的办法被称为批量梯度下降，上面是对它的高度概括。如果想搞懂细节，不要害怕，继续吧。
当你使用机器学习算法库来解决实际问题，所有这些都已经为你准备好了。但明白一些具体细节总是有用的。
还有什么你随便就略过了？
上面我描述的三步算法被称为多元线性回归。你估算等式是在求一条能够拟合所有房价数据点的直线。然后，你再根据房价在你的直线上可能出现的位置用这个等式来估算从未见过的房屋的价格。这个想法威力强大，可以用它来解决“实际”问题。
但是，我为你展示的这种方法可能在简单的情况下有效，它不会在所有情况下都有用。原因之一是因为房价不会一直那么简单地跟随一条连续直线。
但是，幸运的是，有很多办法来处理这种情况。对于非线性数据，很多其他类型的机器学习算法可以处理（如神经网络或有核向量机）。还有很多方法运用线性回归更灵活，想到了用更复杂的线条来拟合。在所有的情况中，寻找最优权重值这一基本思路依然适用。
还有，我忽略了过拟合的概念。很容易碰上这样一组权重值，它们对于你原始数据集中的房价都能完美预测，但对于原始数据集之外的任何新房屋都预测不准。这种情况的解决之道也有不少（如正则化以及使用交叉验证数据集）。学会如何处理这一问题对于顺利应用机器学习至关重要。
换言之，基本概念非常简单，要想运用机器学习得到有用的结果还需要一些技巧和经验。但是，这是每个开发者都能学会的技巧。
机器学习法力无边吗？
一旦你开始明白机器学习技术很容易应用于解决貌似很困难的问题（如手写识别），你心中会有一种感觉，只要有足够的数据，你就能够用机器学习解决任何问题。只需要将数据输入进去，就能看到计算机变戏法一样找出拟合数据的等式。
但是很重要的一点你要记住，机器学习只能对用你占有的数据实际可解的问题才适用。
例如，如果你建立了一个模型来根据每套房屋内盆栽数量来预测房价，它就永远不会成功。房屋内盆栽数量和房价之间没有任何的关系。所以，无论它怎么去尝试，计算机也推导不出两者之间的关系。
你只能对实际存在的关系建模。
怎样深入学习机器学习
我认为，当前机器学习的最大问题是它主要活跃于学术界和商业研究组织中。对于圈外想要有个大体了解而不是想成为专家的人们，简单易懂的学习资料不多。但是这一情况每一天都在改善。
吴恩达教授（Andrew Ng）在非常不错。我强烈建议由此入门。任何拥有计算机科学学位、还能记住一点点数学的人应该都能理解。
另外，你还可以下载安装，用它来试验成千上万的机器学习算法。它是一个python框架，对于所有的标准算法都有“黑盒”版本。
关于作者：让你加速学习的5个步骤
超简单的时间精力管理法，让你的2017不再颓废
我喜欢一座城
因为弱，就活该被骂？
30岁后，你会站在哪里？
实现梦想没那么伟大，80%的人只是输给了半途而废
思考生活的意义并不能帮我们改变世界，但是可以帮我们认识自己。
一些让人眼前一亮的句子技术派 | 如何向普通人解释机器学习、数据挖掘，这些例子通俗易懂_算话-慢钱头条
该文章内容可能包含未经证实信息，如您已证实，请点击举报，了解更多内容请查看
技术派 | 如何向普通人解释机器学习、数据挖掘，这些例子通俗易懂
来源：DataCastle数据城堡
随着数据科学在人工智能发展中大放异彩，、机器学习进入了越来越多人的视野。而对于很多人来说，诸如机器学习之类的名次听起来是神乎其技，但其真正的内涵却不为一般人所知。
特别是对于从事数据科学领域的人来说，如何向外行人解释自己所从事的工作几乎是一个超级难题。那么到底什么是机器学习，如何用通俗易懂的语言来解释？我们通过以下几重境界来解释。
一、专业理论型
百科定义+专业术语，让人听起来不明觉厉，实则一脸懵逼
机器学习(Machine Learning, ML)是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。
它是人工智能的核心，是使计算机具有智能的根本途径，其应用遍及人工智能的各个领域，它主要使用归纳、综合而不是演绎。
机器学习已经有了十分广泛的应用，例如：数据挖掘、计算机视觉、自然语言处理、生物特征识别、搜索引擎、诊断、检测、证券、DNA序列测序、语音和手写识别、战略游戏和机器人运用。
机器学习从本质上来说是一种学习结构，整个结构包括环境、知识库和执行三个部分。在整个过程中，环境向系统提供信息，系统利用这些信息修改知识库，以增进系统执行部分完成任务的效能，执行部分根据知识库完成任务，同时把获得的信息反馈给学习部分，从而继续改进知识库。
在具体的应用中，环境、知识和执行部分决定了具体的工作内容，学习部分所需要解决的问题完全由上述三部分确定。简单来说，机器学习就是计算机利用已有的数据，得出了某种模型，并利用此模型预测未来的一种方法，这与人脑的思考方式非常类似。
二、以小见大型
以某种机器学习具体的案例来说明，让人恍然大悟
一开始我们先来看一个人为设计的场景。假设一个房间里神奇地漂浮着无数个小球。我们想搞清楚这些小球停留的位置是否存在着一种特定的结构。比方说，小球是不是更易集中在某一特定区域？是不是故意避开某些点位？它们是均匀分布于整个空间吗？
但是房间一片漆黑，我们什么也看不见。于是我们找来了一部带闪光灯的照相机，想把漂浮在整个房间的小球都拍下来。照片犹如下图一样：
就算小球的位置之间确实存在某种联系，从这张照片上我们也看不出个所以然。看上去小球就像是均匀分布的一样。所以我们尝试着换了下位置，从新的角度拍下了第二张照片。
照片上的小球看起来还是随机分布的，没有任何规律。让我们换个高点的角度试试看。
呃，还是看不出有什么规律来。那我们最后再换个低点的角度试一次。
啊哈，这次有点意思了：看起来小球集中分布在靠近屋顶和地面的两个区域，中间这段没有一个小球。因此，为了发现这个规律，我们在拍照时就必须找到一个“好”的角度。如果角度不对，那我们永远都不可能找出任何规律。
在上面这个例子中，我们想说的其实是三维数据点。每个小球的位置都可以由3个数字来表示，每个数字分别代表它在XYZ三条轴上的位置。在实际的电脑运算中，数据点的位置会由更多的数字组合来表示。
比如医院病人的病历可能会包含500组数字，包括他的生日年月日、身高、体重、血压、最近一次的看病记录、胆固醇指标等等。我们会想要搞清楚不同病人的数据点之间是否存在某种规律，如心脏病人的数据点是否会集中分布？如果数据点确实会集中分布，当我们发现新入院病人的数据点也出现同样的趋势时，我们就可以推断这位病人很可能犯心脏病。当然，实际操作起来肯定不会如此简单。
一个人是不可能用肉眼看到这些数据点的。人怎么可能分得清500个维度呢？就像在上面那个例子中，没有人能看得清“黑屋”中小球，我们也同样看不见500个维度中的那些数据点。我们可以用二维图片来展示位于三维空间中的数据点，用同样的方法，我们也可以更低维度的“照片”来表现拥有500个维度的数据点。
只有从合适的“角度”拍下“照片”，我们才可以从中找出不同数据点之间的规律，不然将很难有所发现。这就是人们所说的如何从“据”中“发现见解”。
三、晓之以情，动之以理
这样来说，你家宠物应该都可以听明白了
买点芒果去
假设有一天你准备去买点芒果。有个小贩摆放了一车。你可以一个一个挑，然后小贩根据你挑的芒果的斤两来算钱（在印度的典型情况）。显然，你想挑最甜最熟的芒果对吧（因为小贩是按芒果的重量来算钱，而不是按芒果的品质来算钱的）。可是你准备怎么挑呢？
你记得奶奶和你说过，嫩黄的芒果比暗黄的甜。所以你有了一个简单的判断标准：只挑嫩黄的芒果。你检查各个芒果的颜色，挑了些嫩黄的，买单，走人，爽不？
可事实没那么简单。
生活是很复杂的
你回到家，开始慢慢品尝你的芒果。你发现有一些芒果没有想的那么甜。你焦虑了。显然，奶奶的智慧不够啊。挑芒果可不是看看颜色那么简答的。
经过深思熟虑（并且尝了各种不同类型的芒果），你发现那些大个儿的，嫩黄的芒果绝对是甜的，而小个儿，嫩黄的芒果，只有一半的时候是甜的（比如你买了100个嫩黄的芒果，50个比较大，50个比较小，那么你会发现50个大个儿的芒果是甜的，而50个小个儿的芒果，平均只有25个是甜的）。
你对自己的发现非常开心，下次去买芒果的时候你就将这些规则牢牢的记在心里。但是下次再来到市集的时候，你发现你最喜欢的那家芒果摊搬出了镇子。于是你决定从其它卖芒果的小贩那里购买芒果，但是这位小贩的芒果和之前那位产地不同。现在，你突然发现你之前学到的挑芒果办法（大个儿的嫩黄的芒果最甜）又行不通了。你得从头再学过。你在那位小贩那里，品尝了各类芒果，你发现在这里，小个儿、暗黄的芒果其实才是最甜的。
没多久，你在其它城市的远房表妹来看你。你准备好好请她吃顿芒果。但是她说芒果甜不甜无所谓，她要的芒果一定要是最多汁的。于是，你又用你的方法品尝了各种芒果，发现比较软的芒果比较多汁。
之后，你搬去了其它国家。在那里，芒果吃起来和你家乡的味道完全不一样。你发现绿芒果其实比黄芒果好吃。
再接着，你娶了一位讨厌芒果的太太。她喜欢吃苹果。你得天天去买苹果。于是，你之前积累的那些挑芒果的经验一下子变的一文不值。你得用同样的方法，去学习苹果的各项物理属性和它的味道间的关系。你确实这样做了，因为你爱她。
有请计算机程序出场
现在想象一下，最近你正在写一个计算机程序帮你挑选芒果（或者苹果）。你会写下如下的规则：
if(颜色是嫩黄 and 尺寸是大的 and 购自最喜欢的小贩): 芒果是甜的
if(软的): 芒果是多汁的
………………
你会用这些规则来挑选芒果。你甚至会让你的小弟去按照这个规则列表去买芒果，而且确定他一定会买到你满意的芒果。
但是一旦在你的芒果实验中有了新的发现，你就不得不手动修改这份规则列表。你得搞清楚影响芒果质量的所有因素的错综复杂的细节。
如果问题越来越复杂，则你要针对所有的芒果类型，手动地制定挑选规就变得非常困难。你的研究将让你拿到芒果科学的博士学位（如果有这样的学位的话）。
可谁有那么多时间去做这事儿呢。
有请机器学习算法
机器学习算法是由普通的算法演化而来。通过自动地从提供的数据中学习，它会让你的程序变得更“聪明”。
你从市场上的芒果里随机的抽取一定的样品（训练数据），制作一张表格，上面记着每个芒果的物理属性，比如颜色、大小、形状、产地、卖家，等等。（这些称之为特征）。
还记录下这个芒果甜不甜，是否多汁，是否成熟（输出变量）。你将这些数据提供给一个机器学习算法（分类算法/回归算法），然后它就会学习出一个关于芒果的物理属性和它的质量之间关系的模型。
下次你再去市集，只要测测那些芒果的特性（测试数据），然后将它输入一个机器学习算法。算法将根据之前计算出的模型来预测芒果是甜的，熟的，并且还是多汁的。
该算法内部使用的规则其实就是类似你之前手写在纸上的那些规则（例如，决策树），或者更多涉及到的东西，但是基本上你就不需要担心这个了。
瞧，你现在可以满怀自信的去买芒果了，根本不用考虑那些挑选芒果的细节。更重要的是，你可以让你的算法随着时间越变越好（增强学习），当它读进更多的训练数据，它就会更加准确，并且在做了错误的预测之后自我修正。但是最棒的地方在于，你可以用同样的算法去训练不同的模型，比如预测苹果质量的模型，桔子的，香蕉的，葡萄的，樱桃的，西瓜的，让所有你心爱的人开心：）
这，就是专属于你的机器学习，很炫酷吧。
版权声明：
1、本文仅代表作者观点，不代表算话立场。
2、本文部分图片来源于网络，版权归原作者所有。如有侵权，请联系我们删除。
&作为技术分析鼎足而立的派别之一，蜡烛图技术有着不可替代的地位。市面上关于蜡烛图的书籍也不胜枚举，不过翻开之后，却多将焦点放置在K线形态的描述中。不可言其不对，但却用错了力道，运用K线形态仅可谓之“术”，有术无道，未得K线精髓，实际操作中极易出现失误。K线形态的“道”在何方？K线是多空双方搏斗的过程和结果，多空搏斗的过程和结果体现出来的多空力量对比，对后市涨跌有昭示意义。大白话来解释一下，价格受供求...&【小编摘要】　　学习能力是智能行为的一个非常重要的特征，不具有学习能力的系统很难称之为一个真正的智能系统，机器学习不仅涉及对人的认知学习过程的探索，还涉及对数据的分析处理。实际上，机器学习已经成为计算机数据分析技术的创新源头之一。　　机器学习(MachineLearning，ML)是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。其专门研究计算机是怎样模拟或实现人...&亲，听到K线一词，你是否会摇头表示不懂了？不要酱紫啦，小K其实没你想象中这么复杂啦，现在小编将为大家普及一下通俗易懂的微交易K线基础知识，一起来学习吧！学手艺做交易，从此学会用交易赚钱！！微交易，中国2亿人都在做……微信上理财产品，只需100元就能操作最高收益达85%低门槛，易操作，高收益资金银行由第三方托管好东西记得去分享哦投资有风险，入市需谨慎。谨记三点：纪律纪律纪律中国最专业最权威的微交易平...&神经网络算法是数据挖掘中的重要模型，它的产生得益于生理学和医学对人脑的探索成果。科学证实：脑神经系统具有丰富的层次结构，“神经-中枢-大脑”的工作过程是一个不断迭代、不断抽象的过程。人工神经网络正是一种应用类似于大脑神经突触连接结构进行信息处理的数据挖掘模型。2015年全球对冲基金表现2015年，全球范围内对冲基金经历了2008年以来的第二次业绩寒冬。根据对冲基金研究机构HFR(HedgeFund...&关键词：技术、阻力、支撑各位股民朋友，大家好，老钱来了。这周交易时间比较短，又到了愉快的周末。休闲之余，每天再花几分钟时间来老钱这里学习一下知识想必是极好的。有些人只看技术分析，认为市场对该股票的看法尽数表现在股价及其交易量的变化之上。还有些人只看基本面，依靠分析上市公司的价值、事件、资金动向等来选择股票。无论哪一种，只要你能做得好，都可以获得好结果。但对一般的股民而言，要仅靠基础分析来炒股是很困...&
公众号推荐
清洁基金是国家批准设立的按照社会性基金模
发布行业要闻、社会热点、养猪技术、傲农动
四川川润股份有限公司创建于1992年，2
发布最新的民生工程政策措施，宣传马鞍山市
欢迎关注国信证券深圳深南分公司
这里有超过350万人都在看的炒股实战课程
这里是浦发银行官方订阅号，从这里了解浦发
由传统媒体专业财经采编团队精心打造的互联
关注与你相关的每一件财经大小事，以独特、
专业典当信息服务平台
违规或不良信息
广告、钓鱼诈骗
内容不完整
手机号(选填)
如有疑问请致电 8

何惧熔断，看技术派如何利用机器学习预测2018中国股市怎么了

我要回帖

更多关于 2018中国股市怎么了的文章

随机推荐

何惧熔断，看技术派如何利用机器学习预测2018中国股市怎么了

我要回帖

更多关于 2018中国股市怎么了 的文章

随机推荐

更多关于 2018中国股市怎么了的文章