量化选股公式项目哪一家公司安全靠镨些?

谢谢&a data-hash=&e31e13cfdbfd3& href=&///people/e31e13cfdbfd3& class=&member_mention& data-tip=&p$b$e31e13cfdbfd3& data-hovercard=&p$b$e31e13cfdbfd3&&@时机-稍纵即逝&/a&邀请。&br&&br&对我的投机生涯影响最大的一本书是迈克·柯弗尔的《趋势跟踪》,读完之后就毅然决定加入该流派。当然最直接的参考案例是《海龟法则》,一理通百理明,精心地研究这个东西以后,其实所有的趋势跟踪系统,也都那么回事。大道至简,顺势而为。&br&&br&我在系统测试中发现,不管是双均线较差,还是轨道线,还是高低点突破,只要时间参数相同,收益基本类似,我进而理解了,所有的趋势跟踪系统都是在制造一个隐形的双轨,即在更高买入,在更低卖出,这个隐形的东西是本质,至于如何实现这个本质,采取的具体技术,反而不是要紧的。&br&&br&在这个基础上,我想,越简化越稳定。所以基本上现在就是参考一根核心均线,上下加个过滤器。&br&即便是这样白痴的系统,也是有几个圈圈要绕的,比如均线的周期参数,10天30天50天,比如过滤器的大小:宽进宽出,宽进严出,严进宽出,严进严出,等等。&br&&br&我是07年入股市,08年亏,09年就形成上述大部分东西,也就是基本框架,直到2012年都在调节各种参数,寻找最适合自己的参数。&b&因为市场是没有参数的,所谓的优化,不是针对市场,而是针对自己&/b&,急性子和慢性子,当然是不同的。这个过程,是理解市场,更是理解自己。&br&&br&从12年以后基本上系统的这些硬件的东西就没再变过,功夫都下在心上。要建立起对系统的信赖,甚至信仰,其实单独靠历史数据测试,是不够的。反正这东西没有给我信心。我光知道系统有效,这还不够,我还要知道,他为什么有效。&br&&br&更多地是在深化自己的理解,从头脑过渡到内心,从知道过渡到信仰。&b&机械系统可能不是收最高的,甚至也不是最稳定的。但绝对是心理压力最小的,&/b&因为实际上交易者个人是退居到幕后了,主要的决策者是系统&b&。&/b&以对系统的信赖,卸掉了决策人的压力。&br&&br&&br&广泛的阅读和深入的思考,是不可替代的。这些就不展开说了,总之,是读很多书,想很多事,都纳入自己的体系里来。做交易的人,脑子里无时无刻不在想交易,但想的不是某一个具体的头寸,而是“交易这玩意儿”。&br&&br&&br&系统建立以后的行为,有点好像是“证道”。知道了,再做到,看到效果了,就产生了信心,因此更能坚定执行,遇到挫折了,迷惑,但是半信半疑继续坚定执行,终于又看到效果了,于是更有信心了。如此反复数次,慢慢地也就放下心里挂牵了。
谢谢邀请。 对我的投机生涯影响最大的一本书是迈克·柯弗尔的《趋势跟踪》,读完之后就毅然决定加入该流派。当然最直接的参考案例是《海龟法则》,一理通百理明,精心地研究这个东西以后,其实所有的趋势跟踪系统,也都那么回事。大道至简,…
( 更新)&br&&br&随着这回答的点赞数字增多,陆陆续续收到各位的私信。问题大概都是: “我有XXX经历,进入量化这一行行不行?”——老实说,这样的问题很难回答。&br&&br&各人的经历不一样,我的经历也只能作为参考。况且我也并不认为自己有何厉害之处,我区区一个土鳖金融工程硕士,何德何能?&br&&br&其次,仅仅是”量化“二字,包含的东西实在是太多了:期权定价波动率研究对冲交易择时研究选股策略市场中性风险管理资产组合头寸管理业绩归因统计套利……随便挑一个方向都足够玩一辈子了。&br&&br&所以,在问”我干量化行不行”之前,先搞清楚自己到底想做的是哪一个方面。&br&&br&我自己挑的是期权研究,原因有二:&br&第一:金融衍生品在中国一定是要大发展的,我只是顺流而上。&br&第二:这也是最重要的原因——我觉得期权好玩。&br&&br&以上。&br&&br&=============看这铜锣湾璀璨 / 每天依然如常出发===============&br&&br&( 更新)&br&&br&好久没有这么多赞了…… -_-0&br&&br&看了下评论,都在问 “我有XXX经历,进入量化这一行行不行?”&br&&br&老实说,各人有各人经历,我又不是人生导师,诸位行不行,我没试过,不知道……&br&&br&不过可以给各位一个参照系。&br&&br&我自己这三年的实习路径大概如下:&br&某中型期货公司研究部量化岗 → 某一线券商股票销售交易部量化岗 → 某中型券商风控部(偏IT) → 某一线公募基金指数量化部 → 某一线期货公司研究部期权组(目前)。&br&&br&然后,这是我之前回答的问题,各位可以去看看自己能答得上多少,回答完,估计心里也就有个谱了。&br&&a href=&/question//answer/& class=&internal&&国内券商私募量化研究笔试题目有哪些内容?会考哪些知识点? - 冼尼玛 San LeiMa 的回答&/a&&br&&br&以上。&br&&br&&br&=================天堂鸟兽飞 / 街头群魔舞===================&br&(写于)&br&&br&正好本屌之前在人大经济论坛写了一篇关于自己入门Quant的文章,放在这里供题主参考:&br&&br&&a href=&///?target=http%3A//bbs.pinggu.org/thread--1.html& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&http://&/span&&span class=&visible&&bbs.pinggu.org/thread-3&/span&&span class=&invisible&&-1.html&/span&&span class=&ellipsis&&&/span&&i class=&icon-external&&&/i&&/a&&br&&br&算了我还是贴出来吧:&br&&br&&blockquote&明天,就是我在某一线券商实习的Last Day了。最终是因为非名校的原因没法拿到offer,不过回想从前的自己,哪敢妄想到大券商总部实习呢?自考研前立志要走量化之路,就一直没有停歇过。曾经好几次想过,自己到底是否适合做Quant,也曾经多次想过放弃。现在回过头看,发现自己有做得出色的地方,同时也感叹时光飞逝,作为一只量化金融狗要学的东西实在太多。现在终于稍微静下来了,趁有时间,抽空把自己这几年来的学习与实习经历写在这里,算是回顾一下自己的经历、给后来人一点启发(如果有的话)、顺便告诉有志于Quant的各位:你不是一个人在战斗。&br&&br&在动笔之前,想过这篇东西到底是要发在求职区还是发在金融数学区。忽然回想起当初量化投资版刚成立的时候自己还是什么都不懂,很多珍贵的资料都是从这个板块里找到的,现在还留着,上面都是笔记。所以想着,还是这个板块最有亲切感。&br&&br&来正题。&br&&br&先自我介绍一下:本科数学专业,硕士211非985在读金融学,专业方向金融工程。本科毕业后在券商营业部待过,有一年证券从业经验。先后在某中型期货公司研究部、某一线券商机构销售部实习,做的都是量化相关。接下来有可能到某中型券商做风控。(正准备与分管领导的面试,因此帖出此文,攒攒人品。)&br&&br&================华丽的分割线=================&br&&br&(一)简介篇&br&数量金融,或者叫金融工程,目前在国内主要有三大发展方向:交易策略研究、衍生品定价、风险管理。&br&&strong&交易策略研究&/strong&包括选股,择时,套利。选股以α与β策略为主,择时方面,目前国内流行机器学习的手段进行择时建模,诸如SVM、神经网络等,目前该工作多见于券商与期货公司的研究部(金融工程组)、自营部(量化交易)、资产管理部等。有关交易策略研究,可以多看看券商的金工专题研报,某些大券商的金工专题研报还是很有含金量的,具体可以参考新财富金工组的排名。&br&&strong&衍生品定价&/strong&,指的是场外(内)期权的定价以及套利,多见于券商的柜台市场部(OTC产品)、资产管理部,某些一线券商的机构销售部也配有交易组,负责场外期权的定价。衍生品定价大多数被海归名校生占领。没办法,国外的期权理论较为成熟,这是不可避免的。而且个人认为,如果希望做衍生品定价的话,最好刷一个phd的学位……&br&&strong&风险管理&/strong&,多数是围绕对冲做文章,通常需要较好的资产组合管理知识以及衍生品对冲的知识,delta hedge, gamma hedge等自然必不可少。多见于券商的风控部门。&br&&br&(二)学习篇&br&鄙人认为,作为一名合格的Quant,数学、编程、金工三者缺一不可。数学是思想,金融是原理,编程是手段,三者合一,是谓金融工程。下面简单列举一下鄙人曾经读过、正在读和还没读完的书籍,供各位参考。&br&鄙人的书单如下:&br&&strong&&br&数学:&/strong&&br&很多初入Quant门的同学不太清楚数学在Quant中的用处,其实,Quant有分两大门派:P Quant与Q Quant,P Quant是基于风险中性世界下的Quant,这里用得比较多的是随机过程、随机微积分。随机过程和随机微积分需要比较好的高等概率论的知识,而高等概率论是基于测度论的,学习测度论,最好又要有实分析的基础。所以……数学很重要。关于P quant 与 Q quant的详细解释,知乎上面有详细的解答,各位可以自行查找。&br&&br&世界图书出版社出版社:四本分析教程:Stein的傅立叶分析、复分析、实分析、泛函分析,绝对是经典,鄙人正在看第一本。钟开莱的《初等概率论》是比较基础的概率论,里面不涉及测度论的东西,适合初学者。当然少不了大名鼎鼎的Steven Shreve的Stochastic Calculus for finance一二册,平心而论,第二册写得真心不错,前面几章有关高等概率论基础的介绍,连我这种统计学得不好的人都看得很畅快。强烈推荐,目前鄙人第二册看了一半。科尔多森的《随机微分方程》是别人推荐的,准备入手。然后还有大名鼎鼎的Duffie写的《Dynamic Asset Pricing Model》,老实说,我连第一章都看不懂……对Q Quant感兴趣的话,推荐一本《The Element of Statistical Learning》。&br&高教出版社:出版了一套“现代数学丛书”,里面的16、17册,夏道行的实变函数与泛函分析,个人认为是国内教材中写得比较好的,推荐。鄙人看完16。还有胡迪鹤的《高等概率论及其应用》,这本书被广大学子推崇,但是个人感觉难度较大。&br&清华大学出版社:《随机过程基础》,作者Zastawniak,写得比较简单。适合随机过程的入门级读者。鄙人目前正在刷这本。&br&&strong&&br&金融:&br&&/strong&John Hull的圣经,《期权、期货以及其他衍生品》,这个不用多介绍了,Quant人手一本。不过鄙人觉得,这本书适合作为工具书查看,当然初入门的各位还是需要仔细看一下。另一本《Exotic Option》比较全面的介绍了奇异期权的定价,这本书鄙人开了头,正在刷。《An Option Greeks Primer》介绍了希腊字母。投资组合方面首先一定是博迪的《投资学》(虽然厚了点),还有一本较老的书叫《Active Portfolio Management》的,翻译过来好像叫《积极性投资组合管理》,对于投资组合方面的论述较为详尽,适合实务。还有一本,Paul Glasserman的《Monte Carlo Methods in Financial Engineering》,这本书当时鄙人看到第三章就看不下去了,没办法,统计基础太差,正在恶补。&br&&br&&strong&编程:&br&&/strong&很多初学者都会困惑到底该学什么语言,要学到什么程度,要不要深究下去。鄙人觉得,如果你编程很牛,那很好,如果不牛,稍微加强一下就好。作为Quant,个人觉得最重要的还是要有金融学的直觉。当然,不能让编程成为你Quant路上的绊脚石。鄙人认为如果你可以自学C++,那很好。不过鄙人觉得,最后能打动领导的,不会是那些看着就晕的代码,而是你的展示手法,因此,具有强大画图功能的软件就很重要了。比如matlab, R, Python,都不错。鄙人之前一直在用matlab,不过现在开始自学python。原因是因为现在越来越重视产权的情况下,以后能不能搞到matlab的破解版是个未知数。&br&至于教材,本人不是计算机专业的,编程技术实在是渣渣的,不敢有什么推荐。(C++ primer还躺在我的书桌上……惭愧……)&br&&br&给各位一个小建议:各种教材,&strong&能看英文原版的,尽量都看英文原版。&/strong&原因,一是因为国内翻译的水平实在是太烂了,尤其是那个机械XX出版社翻译的金融书籍,个人奉劝最好不要买。二是因为作为一个合格的Quant,业界里最前沿的paper基本都是英文的,看原版教材可以顺便带锻炼一下自己的英语水平。&br&&br&&br&(三)实战篇&br&由于一开始就没打算考博,因此鄙人主要精力集中在找实习上。目前为止做过的工作大致如下:上年7月到某中型期货公司研究部,从事量化研究和股指期货研究相关工作。上年十一月到现在,在某一线券商机构销售交易部实习,也是量化相关研究。接下来将会详细讲讲。&br&&br&&strong&期货公司篇:&br&&/strong&在期货公司的实习主要是负责量化策略的程序编写,一开始的工作是关于国内白糖仿真期权的波动率套利策略。其实就是一个基于volatility mean reversion的策略,给出call 和 put波动率差值的范围,当差值的大小偏离正常区间的时候就构造套利组合,并统计出策略的盈亏情况。当时用的是excel完成这项工作。由于是仿真交易,交易数据噪声非常多,因此跑出来的结果非常差,而且盈亏波动率很大。&br&由于有证券从业经历而且本身有炒股,因此当时股指期货的日评和周评也是由我来负责。由于当时刚好处于牛市的初期,大家对股指的热情还是很高的,每天研究部的人都在讨论策略。我自己也开始试着写一些简单的策略,比如我曾经试过写过一个区间突破的交易策略,用ATR来止盈止损,效果还不错。在这里建议各位初学者可以下载一个名为 交易开拓者 的软件,相信很多人都听过这个软件,是专门用于期货的量化交易策略编写的。推荐的原因是因为该软件的语言(TB语言)比较容易理解,而且它做的策略回测报告非常的详细,可以让初学者对于策略回测有一个直观的理解。当然,金字塔也不错,不过我自己没用过。&br&研究部有很多大牛,国外名校毕业的居多,跟他们一起工作能学到很多东西,尤其是金融实务方面的知识,这是在图书馆里面没法学到的。&br&&strong&&br&券商机构销售篇:&br&&/strong&在期货公司实习了一段时间之后,来到了某一线券商的机构销售部实习。当初我并不认为自己能进来,由于券商总部对于名校学历要求卡得很严,自己又不是985高校。后来却意外地进来了,我想原因可能是因为当时部门招人没有通过HR,不然我可能连简历关都过不了……&br&券商在很多部门都设有量化小组:经纪业务部、自营部、研究部、财富管理、资管,都有,机构销售部的量化主要是针对大客户与券商开展的场外期权业务而设立的,主要目的是做OTC期权的对冲。&br&当时进来的第一个任务是根据研究部的一篇金工研报来编写一个择时策略,由于部门手里有很多期权,当时是每天对冲一次,后来组长希望做一下盘中对冲,因此看看有没有比较好的择时策略适用。后来用的希尔伯特变换,那篇研报现在应该可以百度出来,有兴趣的各位可以自行百度。回测如下图,当时出来后的效果还是不错的。&br&&br&&br&在完成了择时策略编写之后,接下来的工作是写一份关于结构化保本产品的报告。由于当时上证50ETF期权准备推出了,因此部门领导希望可以借资管的通道来发一个保本的产品。目前较为常用的保本策略主要有OBPI、VBPI、CPPI。当时我们挑的是OBPI。组长让我整理一下相关资料并且出一篇报告。&br&OBPI策略报告完成后,接下来的任务是研究欧式期权在提前执行的情况下对于期权卖方delta对冲的对冲成本的影响。由于我们部门手头上很多期权都设置了提前执行的条款,因此组长希望我模拟一下当客户提前执行的情况下对于我们是否有利。一开始我是参考了john hull圣经第十七章(第七版)里面的delta对冲的例子,那个delta对冲的例子写得挺详细的,有兴趣的朋友可以去看看。然后由于是模拟,因此当时用了蒙特卡罗模拟来模拟标的资产的路径。这里不得不提matlab的好处,由于matlab自带有随机数生成的函数,因此假如是做蒙特卡罗模拟的话,用matlab的效率会相对较快,当然这次我做的蒙特卡罗模拟是比较简单,不涉及太多细节性的问题(比如方差缩减技术)。&br&最后一个任务,是关于打新基金的,当时部门准备借资管通道发一个打新基金,组长希望我可以做一个策略,统计一下打新基金的收益率如何。这个难度不大,用excel就可以完成。&br&&br&&strong&券商风控篇:&br&&/strong&在上述券商实习了大半年的时间了,后来组长对我说,由于我的学校原因,留下来的机会不大。后来他把我介绍到某中型券商的风险管理部(在这里我真的很感激我的组长)。现在正准备与部门分管领导的面试,听说这边好像打算安排我做一下场外期权的对冲。希望一切顺顺利利。&br&&br&(四)感悟篇&br&上述所说的,大致就勾画了我读研期间作为一个金工学生所学所做的事。回想过去,所有的事情就像昨天发生的一样。如果真的有什么感想的话,大概应该有如下几条:&br&&br&1、学好数学!学好数学!学好数学!重要的事情说三遍,而且不是高数喔,同济版的那本高数和浙大版的那本概率论,在Quant这个领域就像小学教材般简单。实分析、测度论、随机过程、随机微积分,才是必备的数学基础。&br&2、关于编程,我不太赞成把太多时间浪费在编程上。现在很多公司喜欢招大量的计算机毕业生去做数据挖掘,这样做出来的策略,一来没有理论支撑,很难站得住脚,二来这样做出来的策略生命力通常不会很强。Quant这个东西,我感觉更多的还是讲求intuition,金融学的直觉。所以,数学编程要学好,金融学更要学好。&br&3、金融圈竞争很残酷,很激烈。对于名校学历要求很高,像上述那间一线券商去年已经开始在美国开展校园招聘了,因此,假如想考金融研究生的各位,请尽量都考名校。并不是我看不起非名校,而是现实就是如此。&br&4、已经考上了非211985学校的各位,请你们也不要气馁。金融圈的竞争虽然激烈,但是过硬的素质一定会让你脱颖而出,尤其是在量化这个方面。&br&5、曾经有人问过我为什么要选量化这条路。我想,像我这种没资源没背景的屌丝,赌上潜力走技术路线不就是唯一的选择?既然一无所有,何不放手一搏?&br&&br&假如我再想到什么的话,我会随时上来补充的。&br&&br&也欢迎各位跟帖交流。&br&&br&在Quant的路上,我们都是一路人。&br&&br&冼尼玛
&/blockquote&&br&以上。
( 更新) 随着这回答的点赞数字增多,陆陆续续收到各位的私信。问题大概都是: “我有XXX经历,进入量化这一行行不行?”——老实说,这样的问题很难回答。 各人的经历不一样,我的经历也只能作为参考。况且我也并不认为自己有何厉害之处,我区…
我来说几个吧。&br&&br&石油的现价低于期货价格,因为石油的存储需要成本。这个成本称为carry cost,它和期货到期后的递送成本(delivery cost)以及预期需求变化加在一起,组成了石油的期现价差。&br&&br&但是石油的保存和递送成本是可以想办法降低的。&br&&br&比如陆地上石油的储存和运输成本较高,所以在空船率高的时候,商品交易员会租下船只装满石油让他们在海上漂着,同时做空期货,到期后直接递送入港。这样大大节省了实际的储存和递送成本,形成和期限价差的套利。&br&&br&类似的策略天然气交易员也干过。&br&&br&某现货交易员朋友以前还跟我说过几个奇葩手段。比如通过和船长搞好关系,可以让他在卸货时把油轮的倾斜角度加大,可以导出更多的油。不同国家对于油品的要求不一样,但原油的现货价格是一样的,他们会利用这一点把好坏油掺杂,在不同国家之间做套利。&br&&br&还有两个关于电的奇葩策略:一个是在核电站周围布置红外监测设备,可以检测发电情况,从而对电价进行调整。另一个是人们发现在足球比赛中场时英国电力网的电力需求会突然加大,因为中场休息时英国人会集体烧水泡茶。。。&br&&br&最近又听到一个:某台湾期货交易员雇了直升机在巴西铁道上巡逻观测矿产出货情况,以求在其到达港口之前下注。&br&&br&--&br&最后安利一个我的live&br&&a href=&/lives/090304& class=&internal&&理工生如何进投行交易部门&/a&
我来说几个吧。 石油的现价低于期货价格,因为石油的存储需要成本。这个成本称为carry cost,它和期货到期后的递送成本(delivery cost)以及预期需求变化加在一起,组成了石油的期现价差。 但是石油的保存和递送成本是可以想办法降低的。 比如陆地上石油的…
HMM这样一个发明至今已有50年的经典模型,已经实现的应用之深广,无所谓前景不前景的了。但这不代表它没有生命力,所以你们不可以嘲笑它。因为HMM能够给你的不仅仅是几套算法,而更多地是一种研究问题的工具性视角,帮助你更加灵活自如地实现理论世界-现实世界的镜像转换。&br&&br&其实HMM的应用除了题主所提到的两个方面之外还有很多,尤其是当我们可以掌握的数据更加丰富多元的时候,更多的场景下我们可以拿来用HMM。我就简要说一些相关的hypothesis,不会涉及到具体模型和策略,但我会尽可能地把框架讲清楚。&br&&br&&br&&ul&&li&&b&统计套利&/b&&/li&&/ul&就先拿题主提到的统计套利来说吧。我们都知道理论上你所构建出的“协整组合[注1]”形成的价差应服从OU过程,但即便价差服从OU过程,一个实际价差也可能存在若干个不同的理论价差,也就是若干个参数不同的OU过程。如果这些参数还是动态的,那么用一个HMM很容易解决问题。&br&&br&&img src=&///equation?tex=%5Cbf%7Bx_t%7D+%3D+%5Cbf%7B%5CPi+x_%7Bt-1%7D%7D%2B%5Cbf%7B%5Cupsilon++_t%7D& alt=&\bf{x_t} = \bf{\Pi x_{t-1}}+\bf{\upsilon
_t}& eeimg=&1&&, (1) &br&&img src=&///equation?tex=y_t+%3D+%5Ceta+%5Cleft%28+%5Cbf%7Bx_t%7D+%5Cright%29+y_%7Bt-1%7D+%2B+%5Czeta+%5Cleft%28+%5Cbf%7Bx_t%7D+%5Cright%29%2B%5Cvartheta+%5Cleft%28+%5Cbf%7Bx_t%7D+%5Cright%29%5Cvarpi++_t& alt=&y_t = \eta \left( \bf{x_t} \right) y_{t-1} + \zeta \left( \bf{x_t} \right)+\vartheta \left( \bf{x_t} \right)\varpi
_t& eeimg=&1&&, (2)&br&&img src=&///equation?tex=z_t%3Dy_t%2B%5Cvarepsilon+_t& alt=&z_t=y_t+\varepsilon _t& eeimg=&1&&, (3) observation process&br&&br&(2)是OU过程的离散形式,三个系数的具体表示请自行推导。注意这里的&img src=&///equation?tex=y_t& alt=&y_t& eeimg=&1&&是服从OU过程的理论价差,可以拿来和你用你的仿射变换得到的实际价差&img src=&///equation?tex=z_t& alt=&z_t& eeimg=&1&&做比较,如果实际价差高于理论价差,就short你的协整组合;反之则long你的协整组合。当然为了减少交易成本,你也可以设置触发交易信号的阈值。&br&&br&当然还有一种思路,你也可以把假设放宽,不再假设理论价差服从OU过程,而是直接重新表示你的实际价差。比如在你看来,你的协整价差有两个states,一个state代表随机游走(random walk),一个state代表均值回归(mean reversion),也就是说你的价差并不是每时每刻都服从OU过程那么乖乖地往均值上靠,相反,它有时候会翻脸变成随机游走拦也拦不住。这两个过程的参数的状态转移过程就是hidden state process,实际价差就是observation process。这个时候你就要根据转移矩阵的概率判断当前的regime是否符合统计套利的环境。&br&&br&第一种思路就是题主所提到的经典思路,但可以有多种多样的扩展,比如将HMM和状态空间模型结合,或者重新定义价差的hidden states(如上面提到的第二种思路)。其实用HMM做统计套利的建模过程并不难,但参数估计是个大坑。这里常用的方法就是EM算法了。说句题外话,我个人十分喜欢EM算法,喜欢它在计算上的简洁和鲁棒。特别是牛顿方法废掉的时候更显EM的神采。但包括HMM的初始状态和转移矩阵等初始估计就是另外一个故事了,目前还真没什么好办法,一般就用样本内数据做MLE。加之模型里面涉及的参数个数也不少,过拟合也是个大问题。&br&&br&&br&&br&&ul&&li&&b&量化择时&/b&&/li&&/ul&简单说一下题主提到的量化择时。因为答主工作中研究趋势交易不多,所以仅围绕HMM的特点谈其应用。其实学过Probabilistic Graphical Model的都知道,HMM就是Bayesian Network的一个特例,具体说是Dynamic Bayesian Network(DBN,不要跟深度神经网络里面的DBN搞混)的一个特例,也有人称之为Hierarchical HMM。就用DBN来说一下题主提到的量化择时。我拍脑袋举个栗子,我们可以在头一层设置5个hidden states,大熊(strong bear)、弱熊(weak bear)、随机游走(random walk)、弱牛(weak bull, wu)、大牛(strong bull, su)。然后在每个市场趋势下还可能有若干种features,可以是基本面消息也可以是技术指标,这就考验市场直觉和特征工程的功夫了。最后observation可以简单地使用收益率来表示。根据预测出的收益率进行择时判断。&br&&br&因为择时交易归根结底就是预测,而市场在不同的regime下一定有不同的走势特点。HMM就正好可以用来描述和预测不同regime下的不同反应。这样设计下来模型就呈现出这样(其中白色单层圆圈就是hidden state,灰色圆圈就是observation):&br&&img src=&/aa5a5bf39f4bcb82a417_b.png& data-rawwidth=&925& data-rawheight=&598& class=&origin_image zh-lightbox-thumb& width=&925& data-original=&/aa5a5bf39f4bcb82a417_r.png&&&br&像这种“拜占庭风格”的模型似乎有点令人啼笑皆非,至于它们到底好不好用、该怎么用之类的问题纯属见仁见智,过拟合的可能性很大,但我还是建议有的人不要一上来就以一副“老子当年小米加步枪就能让他老蒋的精锐部队跪了你服不服”的样子对待那些看上去复杂的模型。因为这些模型的思路其实很可能会给你提供新的视角和见解,让你最终建立出简洁的模型。就像你盖房子的“脚手架”,脚手架搭建得繁复冗余也没有关系,随时可以修改,但最后要盖出线条优美又结构稳固的房子出来。&br&&br&&br&&ul&&li&市场微观结构&/li&&/ul&如果真要说前景的话,HMM在算法交易和高频交易上的应用可以算得上,虽然以间接的方式。HMM主要是可以基于tick数据研究股票价格的日内动态变化,特别是在市场日内的不同状态下的变化,比如接下来要说到的price revision、order arrival、duration等等,这属于市场微观结构的内容。计量经济学家常用ACD模型研究tick data,但使用HMM可以得到具有state-dependent特点的比如price revision和duration的分布,从而根据这些市场微观结构的观察结果又将便于算法交易和高频交易策略的构建。&br&&br&我们可以用一个有限状态{1, ..., K}的离散马尔科夫链&img src=&///equation?tex=S_t& alt=&S_t& eeimg=&1&&作为hidden state process,转移矩阵为&img src=&///equation?tex=%5CPi+& alt=&\Pi & eeimg=&1&&。时间t对应某一交易日内第t笔交易。至于observation process那边则有price revision和duration,就像这样:&br&&img src=&/a66cdc3debc38dce357c20_b.png& data-rawwidth=&528& data-rawheight=&238& class=&origin_image zh-lightbox-thumb& width=&528& data-original=&/a66cdc3debc38dce357c20_r.png&&其中&img src=&///equation?tex=X_t& alt=&X_t& eeimg=&1&&为第t笔交易发生的价格变动,&img src=&///equation?tex=%5Ctau_t& alt=&\tau_t& eeimg=&1&&为第t笔交易距离上一笔的duration。&img src=&///equation?tex=%5Ctau_t& alt=&\tau_t& eeimg=&1&&的计算可以根据由指数幂律分布拟合的order arrival rate来计算,&img src=&///equation?tex=X_t& alt=&X_t& eeimg=&1&&可以用一个结合了价格零变动的离散pdf和价格非零变动连续pdf的mixture model求积分来计算。&br&&br&如果你带入数据的话,通常可以得出一个stylized fact:在state 1,trade duration很短,价格变动也很小;在state 2,trade duration长,价格变动的方差也就很大。同时状态转回到state 1的速度比回到state 2要快得多。这与我们的直觉相符合。&br&&br&单就这一方面,HMM的应用就可以很丰富。算法交易的一个重要方面就是如何处理刚到来的信息,这写信息既包括价格、成交量、duration、买压卖压等交易信息,也包括公司公告、行业动态和宏观经济等消息信息,如果你以一个机器学习的视角看的话,&b&HMM可以作为一个在线学习(online learning)算法&/b&,因为它可以online地学习市场状态和得到与price revision、duration和状态转移概率等模型参数。所以HMM非常适合用来设计交易算法。&br&&br&&b&比如基于限价单的算法交易。&/b&&br&&br&这个思路是从Avellaneda[注2]那里得到的启发。我们假设mid-price就是一个有若干regime的布朗运动,即&img src=&///equation?tex=dP_t%3D%5Csigma+_tdW_t& alt=&dP_t=\sigma _tdW_t& eeimg=&1&&,其中&img src=&///equation?tex=%5Csigma+_t%3D%5Csigma%5E%7B%28S_t%29%7D+& alt=&\sigma _t=\sigma^{(S_t)} & eeimg=&1&&,&img src=&///equation?tex=S_t& alt=&S_t& eeimg=&1&&是个连续有限状态的马尔科夫链,决定着mid-price revision的波动率的regime switching。注意离散的HMM用在实证研究上没问题,但算法交易常常用到随机最优控制或者动态规划,所以要映射成连续的HMM。&br&&br&限价买单指令价格&img src=&///equation?tex=%28P_t-%5Cvarrho_t+%5E%7B-%7D%29& alt=&(P_t-\varrho_t ^{-})& eeimg=&1&&和限价卖单指令价格&img src=&///equation?tex=%28P_t%2B%5Cvarrho_t+%5E%7B%2B%7D%29& alt=&(P_t+\varrho_t ^{+})& eeimg=&1&&,其中 &img src=&///equation?tex=%5Cvarrho_%7Bt%7D%5E%7B%5Cmp+%7D++& alt=&\varrho_{t}^{\mp }
& eeimg=&1&& 就是到mid-price的距离,我们费半天劲也就是为了得到&img src=&///equation?tex=%5Cvarrho_%7Bt%7D%5E%7B%5Cmp+%7D++& alt=&\varrho_{t}^{\mp }
& eeimg=&1&&的最优解 。限价单的执行速率(rate of execution)就显得格外关键,&img src=&///equation?tex=%5Clambda_t+%3D+%5Clambda%5E%7B%28S_t%29%7D& alt=&\lambda_t = \lambda^{(S_t)}& eeimg=&1&&代表rate of order arrival,但交易执行的问题是:order离mid-price越远,指令的执行速率就越低,而且是以指数级下降。那么我们就在order arrival的基础上再乘以一个指数函数,&img src=&///equation?tex=%5CLambda_%7Bt%7D%5E%7B%5Cmp%7D%3D%5Clambda_t++e%5E%7B-%5Ckappa_%7B%5Cmp%7D%5E%7BS_t%7D%5Cvarrho_%7Bt%7D%5E%7B%5Cmp%7D++%7D& alt=&\Lambda_{t}^{\mp}=\lambda_t
e^{-\kappa_{\mp}^{S_t}\varrho_{t}^{\mp}
}& eeimg=&1&&,其中&img src=&///equation?tex=%5Ckappa+& alt=&\kappa & eeimg=&1&&是个常数,用来控制限价单到mid-price的距离的尺度,可以用个启发式算法计算。你也注意到了,这里price revision和duration不是相互独立的,因为&img src=&///equation?tex=S_t& alt=&S_t& eeimg=&1&&都对其有影响,至多算是条件独立。另外,算法交易里的限价单最怕的就是你的order迟迟得不到执行,得不到执行的原因不是regime发生的变化就是有更有利的order arrival。所以当你在regime发生转换的概率较低的情况下发出一个immediate-or-cancel的指令,如果这时候突然regime变了或者有简单粗暴的市价单闯进来,你这个指令就很难得以执行。换言之,rate of order arrival和price revision的波动率都是决定你的交易算法选择怎样的&img src=&///equation?tex=%5Cvarrho_%7Bt%7D%5E%7B%5Cmp+%7D++& alt=&\varrho_{t}^{\mp }
& eeimg=&1&& 的因素。那么剩下的工作就是在你的效用函数中求取关于&img src=&///equation?tex=%5Cvarrho_%7Bt%7D%5E%7B%5Cmp+%7D++& alt=&\varrho_{t}^{\mp }
& eeimg=&1&&的最优解了。由此你可以决定最优的下单时机,或者赚取bid-ask spread,等等。&br&&br&&b&比如高频交易中的返佣(rebate)。&/b&&br&&br&先举个例子说一下什么是返佣:如果一个限价单filled,提供流动性的一方可以得到0.25分/每股的返佣,而吸收流动性的对手方要支付更高的交易费用。高频交易者求返佣的其中一个方法就是观察被拆分成若干小单的机构大买单的出现。如果某股票当前价格为10.00元/每股,高频交易者利用速度优势放出一个10.01元/每股的买单——这就是在提供流动性了,所以这个买单很快会被那些试图以10.00元/每股卖给这家大机构的交易者hit。此时的股票价格就是10.01元/每股了,大机构的小买单也随之跟进到这个价位。然后高频交易者立马调头放出一个10.01元/每股的卖单——这同样是在提供流动性。这样一个来回,高频交易者虽然没有从股票价格中赚钱,但赚到了0.5分/每股的返佣,不亦快哉。&br&&br&返佣策略当然不是无风险的空手套白狼,高频交易者就怕价格朝着不利于自己的方向走。所以我们的HMM就派上用场了,它可以告诉我们一组返佣策略是不是能赚到钱。比如在state 1里,每笔交易之间的duration很短,价格变动的方差也很小,非常适合高频交易者拿返佣。高频交易者要考虑至少三个问题:1)这样的state的持续性怎么样?(从转移矩阵里可以看到);2)在这个state内,价格零变动的概率是多少?(从Xt的参数里可以看到);3)如果价格非零变动,那么价格变动的波动率是多少?(从Xt的参数里可以看到)。所以说HMM放在这儿就是一个online learning algorithm,可以动态学习我们想要知道的市场微观结构方面的当前状态。&br&&br&&br&&br&其实HMM可应用的范围依然很广,绝不仅限于我上面提到的这几方面。&b&只要你发现你的研究对象里清晰地呈现出不止一个regime的形态,并且能从逻辑上确定observation和hidden state的镜像关系,那么HMM就是一个比较好用的模型了。&/b&顺便再举个小栗子,就比如那些衡量市场信息不对称特征的指标,比如PIN(Probability of INformed trading)和PSOS(Probability of Symmetric Order-flow Shocks),也可以用上HMM。你可以拿HMM估计PIN和PSOS的值,以此观察一个重大消息发布前后的市场信息环境或者市场情绪的变化,因为private information或者informed trader对市场的影响和public information或者noise trader对市场的影响完全会是两种形态。经验表明HMM算法可以得到比经典的EHO法、EEOW法、DY法[注3] 更好的估计值。&br&&br&&b&但是,在没有对所要解决的问题有深刻认识之前,甚至在寻找到合适的问题之前,不要有任何幻觉,不要强套任何模型或算法,不要把自己像买彩票似的两块两块地消耗殆尽,那样你不会有任何收获。只有在对模型的深入探索和对市场的深刻洞察的时候,你才可以目不识丁而经纶满腹,足不出户而情满江湖。&/b&&br&&br&&br&&br&[注1] 这里的协整不单单指的是大家所熟悉的时间序列教材里的协整检验,统计套利中的协整有更严格的内含,同时可以有更宽广的外延。详见「&a href=&/question//answer/& class=&internal&&统计套利中的「协整」是什么意思? - 郭小贤的回答&/a&」&br&&br&[注2] M. Avellaneda and S. Stoikov, High-frequency trading in a limit order book. Quantitative Finance, Vol. 8, No. 3, April –224. &a href=&///?target=https%3A//www.math.nyu.edu/faculty/avellane/HighFrequencyTrading.pdf& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&https://www.&/span&&span class=&visible&&math.nyu.edu/faculty/av&/span&&span class=&invisible&&ellane/HighFrequencyTrading.pdf&/span&&span class=&ellipsis&&&/span&&i class=&icon-external&&&/i&&/a&&br&&br&[注3]
这三种方法分别以作者姓氏首字母组合命名的,EEOW为Easley, Engle, O'Hara and Wu,DY为Duarte and Young,EHO为Easley, Hvidkjaer, and O'Hara.
HMM这样一个发明至今已有50年的经典模型,已经实现的应用之深广,无所谓前景不前景的了。但这不代表它没有生命力,所以你们不可以嘲笑它。因为HMM能够给你的不仅仅是几套算法,而更多地是一种研究问题的工具性视角,帮助你更加灵活自如地实现理论世界-现实…
简单的回答:不是。&br&&br&但是这二者之间的确有千丝万缕的联系,所以在此尝试梳理一下。&br&&br&经典的经济学理论讲的是供需关系决定价格,一般会画两条曲线分别表示供需双方,曲线交点处就是市场价格。这种理论相对来说是很宏观的,因为它只能告诉你根据计算市场价格应该是什么,但不会告诉你这个价格在真实的市场上是怎么形成的。在真实世界,显然不会有人在做买卖之前会先拿出一张白纸往上画供需曲线然后求价格,实际上大家是通过一系列的协商和交互才能最终确定价格。市场微结构就是对交易市场的规则和交易过程的研究,目的是从微观层面上理解价格形成的过程,以及市场规则和结构对交易的影响。&br&&br&对市场微结构的研究本身由来已久,但第一次把这种工作冠上市场微结构这个名字的,应该是1976年 Mark Garman 的一篇论文 &a href=&///?target=http%3A///science/article/pii/00064& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Market microstructure&i class=&icon-external&&&/i&&/a&,论文名字就叫市场微结构,堪称本领域的开山之作。这片文章分析了两种交易模式(Dealer 和 Auction),给微结构研究提供了一个很好的示范。&br&&br&但真正将微结构研究系统地梳理总结,形成一门学科的集大成者,则是1995年出版的康奈尔大学教授 &a href=&///?target=https%3A//www.google.co.uk/url%3Fsa%3Dt%26rct%3Dj%26q%3D%26esrc%3Ds%26source%3Dweb%26cd%3D1%26cad%3Drja%26uact%3D8%26ved%3D0CCEQFjAA%26url%3Dhttps%253A%252F%252Fwww.johnson.cornell.edu%252FFaculty-And-Research%252FProfile%252Fid%252Fmo19%26ei%3DWjInVJ3hMIPLaOjUgfAN%26usg%3DAFQjCNFwl2Epr0YB9nus5qclLnLFsosOgA%26sig2%3DsnchYHwGfIeLK0Vhwh6Wbg%26bvm%3Dbv.Cd.d2s& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Maureen O'Hara&i class=&icon-external&&&/i&&/a& 的经典著作《&a href=&///?target=http%3A///books%3Fid%3DudXjR2Dg7bwC%26dq%3DMarket%2BMicrostructure%26hl%3Den%26sa%3DX%26ei%3D0CQnVK-cGcXuaJ_kgIgH%26ved%3D0CB8Q6AEwAA& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Market Microstructure Theory&i class=&icon-external&&&/i&&/a&》。在那个年代,交易电子化才刚刚起步,今天的高频交易还远未萌芽,那个时候对微结构的研究显然和高频交易扯不上什么关系。事实上这本书也是理论意义远大于实践。这本书提供了一套理论分析框架,用博弈论,贝叶斯学习等技术对微结构建模和分析。&br&&br&那个时代的学者们更多的是想要建立起交易市场的物理模型,希望像分析物理问题一样来分析交易市场。在这本书里提到的模型大都是理论上的创造,比如会把市场中的参与者分成几种类型,例如做市商,内幕交易者(informed trader),无内幕消息者(uninformed trader)等。有的模型很简单地假定市场价格是做市商通过对自己的库存管理来决定的,有的则是假定价格是通过内幕交易者和其他人之间的博弈来决定,其他人通过贝叶斯方法来不断推测市场上的内幕消息。这些假设的不同会导致模型中的均衡点随之变化,研究者一般是希望通过这些分析来揭示市场中的内在规律,比如 Spread 是如何形成的,成交量对价格有没有影响等。&br&&br&特别的,这本书以由浅入深的方式一步一步拓展研究的深度,通读本书可以很好地帮助你理解学者们是如何构建分析理论的。比如说最初的模型可能只是假设内幕交易者根据内幕消息来下单,整个市场按照每人轮番下单的顺序方式进行交易。在此基础上,可以增加一点变化,使做市商可以通过分析市场上的订单流来推测有多少内幕消息。更进一步,内幕交易者可以变得更聪明,通过模仿无消息者的交易模式来隐藏自己的交易。再然后,可以让无消息者也采取策略,让他们对做市商和内幕交易者的行为做出推断和应变。如此,每一步的改进都会让模型更加复杂,也更加逼近真实世界,通过对不断完善的模型的分析,很多市场的内在特质就会不断被揭示出来。&br&&br&但可以看出这门学科的重点是帮助理解市场结构和运作原理,并非探索赚钱秘笈。所以如果你想通过学习研究这些内容来寻找或者制定交易策略,很可能要失望。甚至在早期,这些理论模型也不需要考虑实际数据,其中很多更是直接假定价格过程是一个&a href=&///?target=http%3A//zh.wikipedia.org/wiki/%25E9%259E%2585& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&鞅&i class=&icon-external&&&/i&&/a&,走的是Q宗的路子(&a href=&/question//answer/& class=&internal&&P Quant 和 Q Quant 到底哪个是未来?&/a&)。&br&&br&沿着这条道路,2006年出版了一本纽约大学教授 &a href=&///?target=http%3A//www.google.co.uk/url%3Fsa%3Dt%26rct%3Dj%26q%3D%26esrc%3Ds%26source%3Dweb%26cd%3D1%26cad%3Drja%26uact%3D8%26ved%3D0CCMQFjAA%26url%3Dhttp%253A%252F%252Fwww.stern.nyu.edu%252F%7Ejhasbrou%26ei%3DLDInVNy-IYPPaPPcgfAG%26usg%3DAFQjCNHpg8dOg9U_84y5hf_kmX1CFRvuCA%26sig2%3DAG8lG8-3t-Iz1VSClgtaHA%26bvm%3Dbv.Cd.d2s& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Joel Hasbrouck&i class=&icon-external&&&/i&&/a& 的著作《&a href=&///?target=http%3A///books%3Fid%3D8IUAQXqMDE0C%26printsec%3Dfrontcover%26dq%3DMarket%2BMicrostructure%26hl%3Den%26sa%3DX%26ei%3D0CQnVK-cGcXuaJ_kgIgH%26ved%3D0CDAQ6AEwAw& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Empirical Market Microstructure : The Institutions, Economics, And Econometrics of Securities Trading&i class=&icon-external&&&/i&&/a&》,提供了该领域内一些较新的进展。这本书出版于《&a href=&///?target=http%3A///books%3Fid%3DudXjR2Dg7bwC%26dq%3DMarket%2BMicrostructure%26hl%3Den%26sa%3DX%26ei%3D0CQnVK-cGcXuaJ_kgIgH%26ved%3D0CB8Q6AEwAA& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Market Microstructure Theory&i class=&icon-external&&&/i&&/a&》的十年之后,思路上一脉相承,两本对照着看可以看到很多熟悉的概念,比如序贯交易模型(Sequential Trade),库存模型等等。思想上仍然是用理论模型教你去理解市场结构。&br&&br&也许一些实战大牛会对这些研究表示不屑,认为这种纸上谈兵的理论模型根本不能刻画真实的市场和人性。但我认为要想真正对市场结构有深入理解,这是唯一可行的科学道路。真实世界中的变化有千千万,如果不能有效地化繁为简,提炼出抽象的数理模型,我们根本无从探寻市场本质。的确有些传说中的交易员通过经验或是直觉把握到了一些致胜秘笈,但很难让人相信这些技能在脱离了当时的市场环境或是操作人本身的特点之后还能够轻易地复刻。微结构的很多研究或许看起来简陋,但是这些简陋的模型却给更深层次的研究提供了坚实的基础,是无法忽略的。&br&&br&到此为止,微结构的研究都和今天我们所说的高频交易没有太直接的联系。你在这些书里不会看到所谓的低延迟,Co-location等新名词。但学者们显然更清楚这些问题,高频交易作为一个新兴的热门话题也得到学界的关注。2014年 &a href=&///?target=https%3A//www.google.co.uk/url%3Fsa%3Dt%26rct%3Dj%26q%3D%26esrc%3Ds%26source%3Dweb%26cd%3D1%26cad%3Drja%26uact%3D8%26ved%3D0CCEQFjAA%26url%3Dhttps%253A%252F%252Fwww.johnson.cornell.edu%252FFaculty-And-Research%252FProfile%252Fid%252Fmo19%26ei%3DWjInVJ3hMIPLaOjUgfAN%26usg%3DAFQjCNFwl2Epr0YB9nus5qclLnLFsosOgA%26sig2%3DsnchYHwGfIeLK0Vhwh6Wbg%26bvm%3Dbv.Cd.d2s& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Maureen O'Hara&i class=&icon-external&&&/i&&/a& 就给出一篇论文 &a href=&///?target=http%3A//www2.warwick.ac.uk/fac/soc/wbs/subjects/finance/fof2014/programme/maureen_ohara.pdf& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&High Frequency Market Microstructure&i class=&icon-external&&&/i&&/a&,介绍在高频交易时代微结构的研究方向,比如高频时代交易规则应该怎么设计,如何监管等。&br&&br&这里值得一提的是一篇同胞的论文,&a href=&///?target=http%3A//www.yueshen.me/pages/about/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Zhou Yueshen&i class=&icon-external&&&/i&&/a& 的 &a href=&///?target=http%3A//goo.gl/MhwNz& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Queuing Uncertainty&i class=&icon-external&&&/i&&/a& 就把延迟这个概念引入了微结构的理论模型中,对有延迟情况下的做市商策略做了理论分析。这篇论文赢得了 11th International Paris Finance Meeting 的 &a href=&///?target=http%3A//www.tinbergen.nl/news/bart-zhou-yueshen-wins-best-paper-award/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Best Paper Award&i class=&icon-external&&&/i&&/a&,&a href=&///?target=http%3A//www.yueshen.me/pages/about/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Zhou Yueshen&i class=&icon-external&&&/i&&/a& 本人也凭这篇论文拿到 INSEAD 的教职(顺带一提,此人师从 &a href=&///?target=http%3A//www.tinbergen.nl/fellow/dr-albert-a-j-menkveld/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Albert Menkveld&i class=&icon-external&&&/i&&/a&,近两年在高频交易方向也有好几篇很好的论文)。&br&&br&最后要提的是一本最为切合本题的著作,2013年出版的《&a href=&///?target=http%3A///books%3Fid%3Di2j3nQEACAAJ%26dq%3Disbn%3A%26hl%3Den%26sa%3DX%26ei%3DviUnVJ3VOsGVaqqsgKAG%26ved%3D0CB8Q6AEwAA& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Market Microstructure in Practice&i class=&icon-external&&&/i&&/a&》。这本书不同于之前几本的地方在于,通过大量的数据分析从实践角度解释了微结构在交易方面的价值。比如介绍了因为欧美市场碎片化(fragmentation)而导致的一系列包括高频交易在内的新兴技术(Smart Order Routing,HFT,Dark Pool),各家交易所是如何通过改进交易机制(缩减 tick size,引进做市商等)来竞争客户,交易市场上的一些特征数据(order size,spread)的变化趋势等。&br&&br&这本书的价值和深度如何,我觉得可以由这句我最喜欢的金句来说明:&br&&blockquote&HFT (High Frequency Trading) is the price to p it is not possible to put trading venues in competition without agents building high-frequency liquidity bridges across them.&/blockquote&这可算是对 HFT 的存在和发展最透彻的解读了。&br&&br&另外,虽然本书主题是微结构,但实际上会让你对交易技术的发展历史和趋势有一个宏观的了解。看完这本书,你会对高频交易者到底在做什么有更深入的了解。(特别一提,这本书实际上对 HFT 持批判态度,并且给出了很多非常有含金量的分析,这也是本书非常值得一读的一个原因。)
简单的回答:不是。 但是这二者之间的确有千丝万缕的联系,所以在此尝试梳理一下。 经典的经济学理论讲的是供需关系决定价格,一般会画两条曲线分别表示供需双方,曲线交点处就是市场价格。这种理论相对来说是很宏观的,因为它只能告诉你根据计算市场价格应…
谢题主的问题,有幸一直在国内做这方面的投资研究,希望借此与大家进一步交流。&br&&br&首先我想说一说在Alpha策略的研究中,一些通常的设置:&br&&u&&b&基差的不可预测性:&/b&&/u&&br&如果大家有耐心做过关于基差预测的研究,就会发现在实际研究和投资过程中,预测基差是非常困难的一件事情,其难度甚至不亚于直接预测大小盘的走势。当然,市场机构各有神通,不排除有少数市场有实力的机构能够在特定的时间段内、特定的预测区间下对基差做出&大概率&准确的、量化的预测。然而正如同Alpha策略选择用对冲期货来规避市场风险的初衷的一样,市场上大部分的机构在测试其策略时,往往直接用”指数“来替代股指期货对策略进行回测,从而希望能够”真实“地呈现策略的本来面目。然而这一设置,后面会说到,在投资过程中,会带来很大的问题。&br&&br&&u&&b&行业中性:&/b&&/u&&br&同”市场中性“策略这个名字一样,Alpha策略追寻地是剔除了市场、行业判断的纯粹的套利收益。直白地说,这是因为量化投资在直接预测大盘走势、预测行业强弱上并不具有特别的优势,原因在后面会说明。所以,国内的Alpha策略在早期(注意:我说的是早期)一般都会将策略在某个行业上的权重配得跟指数一致。这样、由于行业相对强弱所带来的风险也会被规避掉。然而这一设置,仍然会带来很多问题。&br&&br&&b&&u&回测的时间:&/u&&/b&&br&由于数据获取等种种原因,2007年之前的数据是有非常多缺失且不完整的。如涉及到指数权重、财务数据、会计准则更改等等问题。所以一般而言,国内的Alpha策略最早也是从2007年中开始回测,更有甚者可能从2008年之后开始回测。But, time does matter. &br&&br&如果说Alpha策略在中国所遇到的研究困难,就不得不从股指期货这个对于Alpha策略来说唯一的对冲工具说起了。IF合约是从日在中金所开始交易的,国内Alpha策略的兴起也基本上与IF的上市密不可分,所以我把Alpha研究在实际操作过程中遇到的困难分为以下几个时期:&br&&br&&b&A. 2010年4月-2014年10月(迷人的潘多拉魔盒)&/b&&br&如果大家在这个时期做Alpha策略,你会发现赚钱太容易了!记得曾经跟某BGI回来的量化私募大佬电话会议的时候,该大佬说,现在Alpha随便什么策略都能赚钱。言语中,是戏谑,是无奈,却也隐含着担忧。&br&&br&在这个时期,你会发现用一些非常简单的信号,用经典的Alpha框架,回测起来,年化15%以上的收益、夏普3以上的策略一堆一堆的。你可能会突然觉得你是这个世界上最聪明的人,你发现了新大陆!&br&&br&如果说,在当时的环境下,Alpha研究有什么隐忧的话,那就是:IF本身的问题太大了。这句话什么意思呢?IF的标的指数是沪深300指数,而沪深300指数最大的特点就是金融业的权重太大了!而且银行股的只数太少了,只有16只!&br&&br&如果大家读过Grinold的Quantitative Equity Portfolio Management(此君来自Barra,做Alpha的同志必然读过他的书;Barra Risk Model也算是发源于他的研究),就会记得,一个策略的Information Ratio跟涵盖股票的只数的开方、截面离散率是正相关的。但是金融股、尤其是银行股有什么特点呢?低波动、同涨同跌严重(相对其他版块),低价股多且日内波动率极低。前两个特点导致银行股本身很难有高Alpha,最后一个特点则导致交易起来十分困难,这样的话, 策略如果跟指数一样,配很高的权重在银行上,就要忍受始终在银行业上赚不到钱甚至亏钱。多说一句,为什么低价股交易起来会很困难呢?比如你要买农业银行(日收盘3.17元),假设下一交易日开盘3.16(买一)/3.17(卖一),实际交易你会发现,低价股的盘口很少动的,因为动一下就是0.01/3.16 = 32bps就出去了,这个在交易过程中太难忍受了,要知道有时候Alpha策略一天还不一定能赚32bps呢。所以如果你一直挂在买一,就面临交易量大无法成交的风险,如果跨过盘口去对手盘成交,Oh god,真是能疼出血来。&br&&br&BUT!在当时,这些都是小问题,因为当时Alpha太高了,或者说,小盘因子的Alpha太高了。所以,接下来,回测时间的问题就来了。&br&&br&&b&B. 2014年10月-2014年12月(Alpha策略痛苦的回忆)&/b&&br&其实这波小盘的强势从2013年或者说2012年就开始了,Alpha策略在这几年的回测动辄40~50%的收益率,其实大部分Alpha策略在年是不好的,但是由于08、12、13的高收益的提升,它们往往被忽略了。这个时候,现在已经众所周知了,市场开始转向了。&br&&br&其实回过头来看,除了量化投研人员之外,主动投资研究的人士早就看到了这次大牛市的到来,而量化投资的童鞋成天与数据、模型、代码和论文打交道,本身的市场敏感性相较而言则要差很多,而且大部分做Alpha的朋友是不喜欢或者是厌恶Beta的,这种厌恶来源于保守,也来源于Beta很难用量化看懂。&br&&br&于是,大家看到,金融股开始狂飙,大小盘转换开始加速,基差开始急剧拉升。犹记得当时我看见Alpha策略那触目惊心的亏损的时候,真心佩服那些能够坚持账户市值中性的大佬们。虽然策略本身的缺陷是显著的,但是在那样环境下的坚持,我认为是这对自己投资理念的坚持。&br&&br&这个阶段其实就是市场给Alpha策略研发人员上的一课:应该说,量化策略本身(如包含统计学习特性)和量化策略开发人员是具有很强的学习市场能力,但当你从未见过、考虑过、测试过这样的市场状况时,你无法保证量化策略的成功。这是量化天生的缺陷,它是数学、是统计、是基于过去对未来的预测,当你需要它预知它从未见过的事物时,这几乎是不可能的。&br&&br&总结下来,这段时间,Alpha的失败有几大原因:&br&一、由于市场特性的变化、大小盘风格发生大逆转、流动性偏好发生大逆转。&br&二、由于IF本身的结构特征,在金融股狂涨时,如果调仓频率低,由于市场涨跌,会自动产生市值敞口、行业敞口。&br&三、基差的急剧拉伸带来的巨大浮亏。&br&&u&这几个原因并不是独立的、而是相辅相成的。&/u&&br&&br&所以,这一段痛苦的经历,对Alpha策略来说,也是涅槃重生后的宝贵财富,当然,你得能活下来,不少Alpha策略当时已经被清盘了。&br&&br&&b&&u&C. 2015年股灾之后(狂欢之后的负重者)&/u&&/b&&br&股灾之前的2015年对Alpha策略是美好的,简直太美好了,半年,很多的基金或产品轻轻松松录得50%以上的收益。然后就是雪崩了,然后就是监管介入,提高保证金,限制交易手数,期指流动性大跌。目前期指的流动性差不多是股灾之前流动性的百分之一。&br&&br&但是好在中证500期货(IC)的推出很好的解决了沪深300期货本身的结构性问题,使得Alpha策略面临更少的市场风险和风格风险,从而能够更好的挖掘“真正”的alpha。&br&&br&但是深度贴水的问题就来了。个人观点,这种深度贴水,是对做多期指时流动性缺陷、政策限制缺陷等问题的补偿,在监管不发生改变的前提下,可能是一种“Normal Backwardation”。这种深度贴水带来两个困难:一、如果在深度贴水下建仓,一旦基差收窄,账户经常要面对2-3%的回撤;二、移仓成本太高。因为市场多头套保需求多,而投机多头又受到限制,所以一旦需要换仓时,移仓成本会非常高,IC近月合约通常都在3%左右甚至往上,这意味着,如果一年换仓12次,Alpha一年得挣36%以上才能勉强避免由换仓导致的亏损。&br&&br&&u&&b&最后,策略的转向:&/b&&/u&&br&现在,很多的Alpha策略开始探求其他的突破,这些方向是Alpha进步的动力,比如:&br&一、放开行业中性、市值中性的约束,用量化方法学习提取市场特征,动态调整。&br&二、结合CTA策略、结合场外期权产品、结合期货纯多策略等等;&br&三、新的数据源,也意味全新的Alpha来源。
谢题主的问题,有幸一直在国内做这方面的投资研究,希望借此与大家进一步交流。 首先我想说一说在Alpha策略的研究中,一些通常的设置: 基差的不可预测性: 如果大家有耐心做过关于基差预测的研究,就会发现在实际研究和投资过程中,预测基差是非常困难的一…
谢邀。&br&&br&我有一壶酒,足以慰风尘;&br&此中有真意,请君倾耳听。&br&期货穷三代,炒股毁一生;&br&市场多变幻,切记谨慎行。&br&都言量化好,恰似聚宝盆;&br&谁试谁知道,原来全是坑。&br&不懂基本面,也不看行情;&br&一张K 线图,回测吓死亲。&br&圣杯在我手,中国好模型;&br&只等钱生钱,荣耀我楣门。&br&凑齐十万块,先交易螺纹;&br&孰料实盘后,天天都揪心。&br&开仓就震荡,趋势总不临;&br&一旦止损后,行情每蹭蹭。&br&如此三番后,开始疑人生;&br&莫非有大户,专盯我模型?&br&劳资就不信,逆市不止损;&br&恰遇黑天鹅,账户一把清。&br&吃饭饭不香,睡觉觉不宁;&br&父母不敢诉,每每梦中惊。&br&别问哥是谁,哥乃过来人;&br&言罢遁地走,深藏功与名。
谢邀。 我有一壶酒,足以慰风尘; 此中有真意,请君倾耳听。 期货穷三代,炒股毁一生; 市场多变幻,切记谨慎行。 都言量化好,恰似聚宝盆; 谁试谁知道,原来全是坑。 不懂基本面,也不看行情; 一张K 线图,回测吓死亲。 圣杯在我手,中国好模型; 只等钱…
EDIT:今儿市场比较平静,来更新一下。&br&EDIT2:继续更新。今天看到新闻说2sigma的Kang Gao认罪了,唉。&br&EDIT3:连Brexit都顶得住,大家的情绪还是很乐观的么!更新一下……&br&EDIT4:无论谁上台,全球化的趋势都快是要停了的样子,趁着日子还好,更新一下……&br&EDIT5:每天更新一点的Piece meal确实不太好,我已经尽力抽空写了……很后悔一开始的时候没有用匿名的模式来写,否则我就可以写更多东西出来了。&br&&br&&b&1. 断线重发指令&/b&&br&FIX连上了,发送第一个交易指令,开始等待--&这时网络断了,没收到确认回执--&等待超时,心跳还没超时--&重发交易指令,却错误地用了新的订单号,网络是好的。&br&&br&这种概率bug真的很给力。很多新手喜欢用类似quickfix之类的包,一个不小心就出问题了。一般来说这些FIX连接走的都是site-to-site vpn 或者 co-location的光缆,断网的概率不是很高,但遇到潮涌的时候还是会丢包(例如你同时对几千个tickers做市),恰好碰上了就好玩了。&br&&br&&b&2. FIX夏令时&/b&&br&FIX常用格林威治时间报时。夏令时冬令时切换的那些天总有人迟到早退。下次夏令时切换是日,设定一个备忘吧。&br&&br&&b&3. Book pressure 0&/b&&br&有些品种在奇怪的时候,例如圣诞节的最后半天,bid 1 - bid 5 都只有价格,量为0(也能是iceberg,规则天天变,举个例子而已)。熊孩子实习生恰好写了个作死的algo看ask size / bid size。回测的时候用的数据都清理过的,没这么奇怪的玩意儿,于是这段代码没有try catch numerical error就上线了。&br&&br&暂时先加俩,有空再回来写……回来了。&br&&br&&b&4 迭代次数过多&/b&&br&&br&有些algo需要解几个凸优化或者线性规划问题来决策,这类策略往往是看分钟bar data的。所以每次画一个新的分钟k线,某些函数就会被唤醒起来重新解一下。有时候某些数字比较奇怪,例如penny stocks 太多的时候,求解器就容易陷入迭代的漩涡中不能自拔,连续报错说自己遇到的矩阵非正定什么的。当它想独自安静一下时,下一个bar恰好到了……&br&两个bar之前往往不会相差太多,毕竟我们也不是每分钟都看得到惊心动魄的走势的。于是这个求解器又陷入一次超过1分钟的沉思。&br&&br&想象一下,这个过程发生在下午3:57,求解器连续三次迭代次数过多,系统里还有几百个股票需要平仓,最后一分钟风控切进来直接开始mkt order fire sell。&br&&br&&b&5 数据源断了一半&/b&&br&&br&比速度比到后面,一堆码农就喜欢用奇技淫巧。例如先来十几个线程接受各大交易所数据,弄好了放在一个共享内存里;十几个线程从这个共享内存里面读市场数据,算好决策,单子打过去。&br&就是有这么一两个交易所总是喜欢出小毛病,恰好它们交易的品种是独占的。&br&例如direct edge的数据断了,bats的还在,bats的标普500etf在变动,de的es期货没有更新了。如果代码里面没有自动清除过去数据的函数,或者有,但十几个线程又是共享同一个last updated timestamp,bats没断导致这个值一直不触发系统警报……&br&&br&假如只是简单的股票做市还好,顶多付了spread。如果某个策略做的是vol arb,买卖期权那可就亏大了。&br&&br&&b&6 Excel的错误代号&/b&&br&&br&我发现还是有蛮多人喜欢用Excel来做前端管理的,给头寸设置各种字体、颜色看着自己爽一些。“现代化”的Excel工具都会直接把绝大多数的工作负荷交给DLL,表格里面的vba只是简单地传递参数和结果而已。VBA里面有个奇怪的函数叫做CVErr,负责把一个错误代号转换成Excel里面的错误,例如CVErr(2015) = #VALUE!,而2015本身又有一个别名,叫做xlErrValue。&br&&br&在VBA里面,这个xlErrValue是可以参与计算的,你要是把这个玩意儿传到dll里面就有意思了。&br&&div class=&highlight&&&pre&&code class=&language-text&&print CVErr(2015)
Error 2015
print CVErr(xlErrValue)
Error 2015
print xlErrValue + 1
print sqr(xlErrValue)
&/code&&/pre&&/div&&br&明白了吧。&br&&br&这个页面里面有更多信息:&a href=&///?target=https%3A///en-us/library/office/bb687915.aspx%23sectionSection0& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&How to: Access DLLs in Excel&i class=&icon-external&&&/i&&/a&&br&&br&&b&7 重码&/b&&br&&br&这个问题完全和代码的逻辑错误关系不大,只和维护人员有关。&br&&br&我见过某个强大的api,一开始开发的时候考虑的全是美国境内的股票,股票代码只保留了最短的长度,没想到某天扩张开了业务,在其他市场上遇到重码了,CWB既是iShares的可转债etf,也可以是一只加拿大的股票。&br&&br&老板说:你们把find_instrument的函数重新整理一下,让客户可以手动限制查找的市场和资产类别。&br&&br&这个活自然就给了实习生咯。实习生看了一眼CWB是可转债啊,重码的又是加拿大西部银行Canadian Western Bank::TSE,行,&i&那CWB的资产类别就是债券&/i&,加拿大西部银行的资产类别就是股票。&br&&br&为了find_instrument函数的向后兼容性,开发人员把这个函数拓展了:&br&&br&&div class=&highlight&&&pre&&code class=&language-text&&# 之前
def find_instrument(ticker)
# 业务需求,拓展了交易所和类别的代码
def find_instrument(ticker, exchanges = &&, asset_class = &&)
&/code&&/pre&&/div&&br&具体里面的逻辑是怎么样的我就不知道了。当时新系统上线第一天,整个村子的人,尤其做etf套利的,活生生把多伦多的这个银行推上了天。&br&&br&&b&8 爬虫&/b&&br&&br&有些团队喜欢省钱,就不买市场日历的api了,自己动手写一个爬虫,从yahoo finance上抓股票的财务数据发布、股东会日期等数据。&br&&br&今天Yahoo Finance改版,估计也是害惨了一堆爬虫……富国WFC今天公布盈利数据吧好像是(日),反正我已经听说了好几个抱怨了。&br&&br&写过爬虫的都知道……有时候页面就是找不到这些元素,返回空集就好了。&br&&br&返回空集,嗯。&br&&br&&br&&b&9 微波塔弱弱的payload&/b&&br&&br&&br&&i&这里的细节都不是真的。我只能最大限度地还原一些背景知识。&/i&&br&考虑一个微波塔通信协议,微波塔的消息都比较短,所以每个消息的payload(有效负载)是有限的,现在我们想在一个packet里面塞进整个市场的盘口信息(卖一,量,买一,量,卖二,量,买二,量……),显然不做一点压缩是不可能的。&br&&br&假设这个是利率市场。&br&要开始压缩了,盘口的量,超过一千以上的值,例如1342,后面的342没什么意义,显示成1000+也可以。压缩一点。&br&&br&再看如何把利率的小数点给弄掉?反正交易所要求有一个最小变动单位(Tick Size),例如1/32。把报价除以tick size,得到的肯定是一个长整。&br&&br&然后考虑利率市场的特性,利率这东西本来交易范围就有限,我们完全不用考虑利率是年化90%的情况,所以完全的一个长整又是用不上的,可以改成8 bit integer。&br&&br&每天早上微波塔初始化的时候,发送一个包,定义当天的128是什么利率,然后1就是这个利率 - 127 * tick size,255就是这个利率 + 127 * tick size,0留作他用。255个tick size,过去十年,应对任何一天的也是够的。&br&&br&人呐就是不知道,自己不可以预料。瑞士国家银行宣布取消保底汇率。微波塔卒。&br&&br&&b&10 硬代码 Hard coded&/b&&br&&br&今天(日)是VXX,跟踪短期波动率指数的ETF,四股合一股的生效日(reverse split),随着这个合股,VXX的cusip码也变了。&br&&br&你猜我看到了多少尝试用旧cusip码来发送交易指令,被对手方拒绝的单子?&br&&br&所谓的不好的开发习惯在这种关键的时候就显得特别重要,据我所知是有一些小策略的脚本或者源代码,并不需要同时获知几千个股票的cusip的,那么硬代码写几个能用上的cusip到一个dictionary里面也无可厚非。但假如这时候系统在线上,真是改都没有机会改。&br&&br&好歹也写在一个文本文件或者json里面吧。&br&&br&&b&11 轮询&/b&&br&&br&老员工A发掘了一个看上去有潜力的策略,在数据库里面回测发现挺能赚钱的。成功了之后把逻辑和数据库使用的代码交给了实习生,让其整理上线。&br&&br&实习生写出来的代码小规模上线,实盘表现是亏钱的。老员工觉得不对,自己整理上线了一个版本,实盘表现终于正常,赚钱的效率在预想的范围内。老员工有点郁闷,怎么会这样呢,对着实习生的代码一行行找差异,数学上显然是完全没出入的。老员工下载了实际交割的数据来看,发现实习生的版本,在AA,AAPL,BA这些股票上还是赚钱的,到了JPM附近的ticker就开始不对了,再下去基本就是亏的。&br&&br&原来问题居然出自这一行:&br&&div class=&highlight&&&pre&&code class=&language-python3&&&span class=&k&&for&/span& &span class=&n&&i&/span& &span class=&ow&&in&/span& &span class=&n&&stocks&/span&&span class=&p&&:&/span&
&span class=&n&&process&/span&&span class=&p&&(&/span&&span class=&n&&i&/span&&span class=&p&&)&/span&
&/code&&/pre&&/div&stocks变量恰好是一个按字母排序的列表。每个处理过程都需要一些时间不可忽略,轮询到后面的时候,快照下来的数据就已经失效了。市场的竞争已经很有效率,一个股票的波动会很快传染到同行业、上下游股票上去。而实习生从A开始一直试到Z,代码效率还不是最高的话,很难赚到钱。&br&&br&代码改成了一个多线程分发的版本之后就开始对起来了。过了一段时间老员工回来看结果,发现每个ticker上的pnl还是和lexical order有关,老员工觉得这里肯定还是有人为的因素在里面,考虑到还有这么多用excel做前端的手动交易员。&br&&br&老员工把代码改成了这样:&br&&div class=&highlight&&&pre&&code class=&language-text&&r_stocks = stocks[::-1]
for i in r_stocks:
process(i)
&/code&&/pre&&/div&&br&开了一个小账户试试手气,他惊奇地发现这么个实现,Sharpe居然比多线程分发的要高0.1。&br&&br&市场还是很有意思的。&br&&br&&b&12 规则生成、节假日、新合约,看上去就是个概率bug&/b&&br&&br&背景知识:8月31日起,SPY,也就是著名的标普500指数ETF,开始有周三到期的期权了。以前只有每个周五到期的期权,现在每个周三到期的期权也有了,所以既有9月14日到期的期权,也有9月16日到期的期权。&br&&br&因为行权价和到期日的繁多,期权合约是不会分配CUSIP之类的序列号的,所以在各种电子化交易的协议里面,对交易合约的定义一般而言有两种方式:&br&&br&第一种就是明确分离的字典:&br&&div class=&highlight&&&pre&&code class=&language-text&&{
&action&: &BUY&,
&quantity&: 10,
&price&: &MKT!&,
&ticker&: &SPY&,
&expiration_month&: 9,
&expiration_day&: 14,
&strike&: 211.00,
&direction&: &CALL&
&/code&&/pre&&/div&第二种呢原理也一样,就是把多个字典项目合并成一个超长的字符串:&br&&div class=&highlight&&&pre&&code class=&language-text&&{
&action&: &BUY&,
&quantity&: &10&,
&price&: &MKT!&,
&contract&: &SPY 11000&
&/code&&/pre&&/div&&br&一般而言,这里说的到期日&i&&b&周五&/b&&/i&是不严格的时间概念,周五到期的期权,大多数指的是周五收盘4pm结算。如果周五恰好是节假日,那就是周四4pm结算,如果周五是半天交易日,那就是周五1pm结算。如果周四周五都是节假日,&b&周三4pm结算。&/b&&br&&br&&br&&b&在周三期权推出之前,一个声明自己周五到期的期权,事实上真的可以在周三下午到期。&/b&&br&&br&9月1日,周三期权开始交易。&br&&br&&br&就目前来看,因为彭博和路透等数据终端的影响,大家都喜欢用一个长字符来解决问题。于是某个非常有名气的券商就在9月1日遇到了如下的bug,客户在平台上交易周三的期权(9/14)时,有一部分单子会顺利成交,另一部分单子会一直显示live (挂在盘面的队列上),这时候客户就算把价格抬高或降低到best bid or offer,已经cross the market了,还是不会成交。撤销后重发,有可能成交。&br&&br&这个bug大概影响了生产环境三个小时,对系统声誉略有影响。因为是概率bug,除bug的过程极其复杂。最后发现是这个原因:&br&&ol&&li&SPY期权在十几个交易所都能有交易。&/li&&li&部分交易所的对接协议要求券商使用第一种方式定义交易指令,部分交易所要求第二种方式&/li&&li&券商在自己的服务器上写了一个翻译器&/li&&li&这个翻译器的生成规则&b&没有被更新&/b&&/li&&/ol&假设现在你是券商,你拿到了SPY 11000这么个长字符,你的翻译器会怎么办?&br&&ul&&li&当然先把spy提取出来,赋值给ticker。&br&&/li&&li&把日期按照yyyymmdd分开,发现是个周三,直接假设周四周五是假日,按照传统填写周五的日期: expiration_month=9, expiration_day=16&br&&/li&&li&处理剩下的C=CALL和 = 211.00&br&&/li&&/ul&恰好你的智能交易引擎没停工,为了获得最好的价格,你帮客户把一个单子拆分成好多个,发到了不同的交易所去。使用方式2的交易所没有受到影响,使用方式1的交易所接收到你的交易指令,把你的指令放入了周五到期的期权队列里,周五的期权价格和周三不一样(得差不少钱)。所以你就算调整价格高低一两分钱,也是无法成交的。&br&撤销单子之后重发,交易指令有一定的概率不需要转译就到达方式2交易所,形成了概率bug的错觉。&br&&br&回头想想:这个bug到底牵涉了多少不同的部门?当初写出这个规则翻译器的IT员工万万没想到几年之后会出现这么一个神奇的周三期权,当年的节假日豁免匹配规则太懒惰,把客户的输入直接标准化成周五,这么多年相安无事。交易部门的员工知道有周三期权推出,却不懂码农的心,不大可能知道周五日期标准化意味着什么,不会想到原来这地方也能有坑,自然不会督促IT哥们修改翻译器。处理网络connectivity的员工啥都不知道,只能埋头看log,看到一个SPY 11000这个字符串,根本不会想到待会儿这字符串会有一个4变成一个6。&br&&br&Teamwork是一个艺术活。
EDIT:今儿市场比较平静,来更新一下。 EDIT2:继续更新。今天看到新闻说2sigma的Kang Gao认罪了,唉。 EDIT3:连Brexit都顶得住,大家的情绪还是很乐观的么!更新一下…… EDIT4:无论谁上台,全球化的趋势都快是要停了的样子,趁着日子还好,更新一下………
第一要对技术类的工作有兴趣,对数学和编程相关的工作不排斥。做到这一点已经很不容易,在我认识的人里,大部份人都对这种工作没什么兴趣。特别是江湖上还流传着做技术只能到三十岁,以后一定要转管理之类的传言。但是要把 Quant 需要的手艺活学全了,多半你要读个 PhD,毕业可能已经快30了,还得进入业界锻炼几年,30以后可能才是真正能创造价值的时候。那时如果你突然表示自己其实对搞这些技术没有兴趣,很难说不是一件尴尬的事情。&br&&br&能够做一些技术工作的人里,又包括了只喜欢纯数学做理论,和只喜欢写程序这样的人。或许前者更适合留在大学教书,后者不如去互联网公司。但要做 Quant,你应该对两者都有一定的热情。&br&&br&第二要对金融市场有兴趣。技术做的好的人一般选择也比较多,能建模能编程的人去别的科技行业也能找到不错的工作,单纯从收入上来说我不觉得 Quant 这一行就一定比其他行业有优势。但市场本身是一个绝对独特的存在,做 Quant 的人肯定是对市场的兴趣远超过去研究高能物理或是人脸识别。&br&&br&也许有些人喜欢把研究市场误读成赚大钱。我觉得世界上有很多事情,比如说数学定理或是物理定律,或者是一段程序,是千真万确亘古不变的东西,但是唯独赚大钱这件事,根本没有任何定理保证你如何之后就能成功。而且你知道过去一个月最受世人关注的那位姓马的老板既不搞数学也不写程序。所以我建议不要舍本逐末,赚钱这件事由上帝决定,选择做自己感兴趣的事却可以自己决定。&br&&br&至于一天的生活,我想世界变化这么快,这种事情实在是微不足道。要不要从事这个职业,最重要的是上面说的那两个条件,其他的事情相比之下都是细枝末节了。
第一要对技术类的工作有兴趣,对数学和编程相关的工作不排斥。做到这一点已经很不容易,在我认识的人里,大部份人都对这种工作没什么兴趣。特别是江湖上还流传着做技术只能到三十岁,以后一定要转管理之类的传言。但是要把 Quant 需要的手艺活学全了,多半…
既然有100多人关注想知道答案,我就抛块砖好了...&br&&br&&a href=&/people/song-si-yuan& class=&internal&&宋思源&/a&老师说他知道的动量策略基本都被淘汰了,我挺好奇国内会不会不一样,下午端午放假没事我翻了翻上次做的作业,又码了几行代码,用A股市场的数据跑了跑,感觉结果(写在后面)还可以啊,然后就有了这篇答案...&br&&br&&img src=&/cdab84f0d4dcc7f572fae8_b.jpg& data-rawwidth=&1440& data-rawheight=&861& class=&origin_image zh-lightbox-thumb& width=&1440& data-original=&/cdab84f0d4dcc7f572fae8_r.jpg&&&br&不过做出来的毕竟是paper profit...后面会多写写我能想到的paper profit可能有的缺点。&br&&br&For those who want to save time...&br&&br&&img src=&/1caeebd76a0c4f70b1cb5_b.jpg& data-rawwidth=&927& data-rawheight=&478& class=&origin_image zh-lightbox-thumb& width=&927& data-original=&/1caeebd76a0c4f70b1cb5_r.jpg&&&br&&br&&b&&u&1.数据说明&/u&&/b&&br&&br&&br&我选用了日-日(数据库不给力真的桑不起...延迟都能有1个月),A股市场上&b&&u&所有有交易记录&/u&&/b&的3112只股票的&b&&u&周收益&/u&&/b&数据。&br&&br&(为什么选A股?因为我assume 题主说的&在中国&就是指买A 股...)&br&&br&&img src=&/64a45ec30c426df0601461eaed9f03eb_b.jpg& data-rawwidth=&272& data-rawheight=&235& class=&content_image& width=&272&&&br&&br&大概有8W多条,只选用了公司代码,日期,和周收益三个数据&br&&br&&img src=&/273197edefe6a55a2d98da8df60858d6_b.jpg& data-rawwidth=&266& data-rawheight=&283& class=&content_image& width=&266&&&br&为什么只做了六七个月?因为我不太想虐待开着虚拟机跑SAS的小MBA...&br&&br&因为是周数据,其实也差不多了嗯。&br&&br&为什么选周数据?明明大家做动量不都是用月数据嘛....因为我有点想模拟散户的心理..后面会说。&br&&br&&u&&b&2.策略简述&/b&&/u&&br&&br&搜了几篇论文搞清楚了动量策略指什么,其中主要参考了论文[1]里面的方法,选用mid-return当基准计算超额回报的想法来自于论文[2]。&br&&br&Long story short &b&大致的思路&/b&是这样的...&br&&br&动量策略的拥簇者认为,市场有可能不是完全有效的&br&&br&(尤其是在天朝,有时候用a股数据做CAPM检验,最后得出的无风险收益率齐刷刷是负的,真是无语凝噎..)&br&&br&因为市场的不有效,股价对信息的反应可能是迟钝的,即今天涨的股票明天可能会继续涨,就像一列行驶的火车一样,停下来或者加速都需要时间。(如果假设反应过度,那就叫反转策略)&br&&br&下面是详细点的思路:&br&&br&&img src=&/f6e05cd26c67d299f7a42_b.jpg& data-rawwidth=&765& data-rawheight=&400& class=&origin_image zh-lightbox-thumb& width=&765& data-original=&/f6e05cd26c67d299f7a42_r.jpg&&(上图是我随手用ppt画的,中文字体找不到太好看的,索性用英文了,有人认识这字体么...挺有名的)&br&&br&就是:&br&&br&1)分析n-k 到 n 个周 (Period A-B) 的股票回报,选出回报最好的一组(winner),回报一般的一组(mid),回报最差的一组(loser)&br&&br&2)
分析 n 到 m+n周 (Period B-C) 的 winner , loser ,mid 的回报&br&&br&3)分析 n-k+1 到 n+1 个周 (Period A-B) 的股票回报,选出回报最好的一组(winner),回报一般的一组(mid),回报最差的一组(loser)&br&&br&4)
分析 n+1 到 m+n+1周 (Period B-C) 的 winner , loser ,mid 的回报&br&&br&5)
循环往复直到世界(数据)的尽头...&br&&br&6)
换个 k , m 接着跑循环... 我一共做了36组&br&&br&&img src=&/3d17ca76d49a8203220e_b.jpg& data-rawwidth=&470& data-rawheight=&279& class=&origin_image zh-lightbox-thumb& width=&470& data-original=&/3d17ca76d49a8203220e_r.jpg&&(这表下面会用到,暂称为table1好了)&br&&br&(有兴趣的同学可以到下面附注里面找代码来看,花了俩三小时用sas写了200多行,没有进行任何优化)&br&&br&&b&&u&3.结果分析&/u&&/b&&br&&br&说到分析量化策略的结果,我们首先要考虑的肯定是..&br&&br&Trading cost (交易成本)!&br&&br&因为没有做过实盘,不知道A股有没有bid-ask spread,不过我想bid-ask spread 代表的liquidity cost 总是有的(因为你不总能以想要的价格买进卖出..)&br&&br&bid-ask spread 的估计基于论文[4],是纽交所研究部出的:&br&&br&&img src=&/e4eeb25c143d4_b.jpg& data-rawwidth=&643& data-rawheight=&108& class=&origin_image zh-lightbox-thumb& width=&643& data-original=&/e4eeb25c143d4_r.jpg&&&br&最后我先选择了0.21%做spread算了一下(其实券商里面做量化的大概不需要手续费吧...):&br&&br&&img src=&/e2eb5ab76_b.jpg& data-rawwidth=&295& data-rawheight=&48& class=&content_image& width=&295&&&br&&img src=&/3478935caf527a5b64873fcbdb7bbb03_b.jpg& data-rawwidth=&687& data-rawheight=&549& class=&origin_image zh-lightbox-thumb& width=&687& data-original=&/3478935caf527a5b64873fcbdb7bbb03_r.jpg&&&br&横坐标代表table1里面的serial(序号),分别是用不同的selecting-period和holding-period跑出来的数据。&br&&br&纵坐标代表超额收益率(把高于mid-return portfolio收益的部分减去交易成本年化)&br&&br&感觉结果还是挺符合逻辑的:&br&&br&1.随着持有期的增长,winner组合的超额收益率变得越来越低,最后接近于0。&br&&br&2.1-1的组合(选出上周收益最好的,持有一周,下周再换)动量效应最明显,超额收益最大。&br&&br&3.loser组合基本没有太大变化。&br&&br&&b&注:此处年化收益率并不代表这笔策略执行一年就能拿到这么高的收益了,这里只是方便比较,用mean直接算的年化(不过感觉各种宝都是这么算的年化...),因为votility的存在,其实一年之后1-1组合winner收益的真实分布应该是这样的(假设正态分布,标准差15%):&br&&/b&&br&&br&&img src=&/4cd8d8ded633b3b0a0fd1f02b363550d_b.jpg& data-rawwidth=&993& data-rawheight=&429& class=&origin_image zh-lightbox-thumb& width=&993& data-original=&/4cd8d8ded633b3b0a0fd1f02b363550d_r.jpg&&&br&mean 大概15.49%,也就是有50%概率年化能超过这数...&br&&br&不过有两个问题我没有考虑:&br&&br&1.流动性,有时候股票涨的时候,由于涨停板什么的存在,根本就就买不到,跌的时候也卖不掉。&br&&br&2.不同的股票的trading cost是不一样的,美帝市场相当有效,论文[2]测度出在美帝市场上,trading cost和动量利润是有很强的线性的关系的,存在动量利润的股票往往是trade比较少的小股票,bid-ask spread非常高,足以吃掉动量利润。&br&&br&如果考虑这些因素,稍微把交易成本提高一点的话(把spread提高到1.5%)....&br&&br&&img src=&/6ba30dc98cb8ccf4561a7_b.jpg& data-rawwidth=&673& data-rawheight=&551& class=&origin_image zh-lightbox-thumb& width=&673& data-original=&/6ba30dc98cb8ccf4561a7_r.jpg&&&br&妈蛋越写越觉得不靠谱,大家将就看吧,就谢绝转载了。抛块砖等做过的来讲讲吧...&br&&br&&b&&u&4.附注&/u&&/b&&br&&br&&br&1.完整代码&br&&br&知乎不支持贴SAS代码...其实应该用matlab写的..&br&&br&对代码感兴趣的可以看下面链接,大概写了200多行...没有进行任何效率优化,因为懒...&br&&br&&a href=&///?target=https%3A///s/s68x0kgm3ofesc2/test.pdf& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&Dropbox - test.pdf&i class=&icon-external&&&/i&&/a&&br&&br&2.参考文献:&br&[1]Returns to Buying Winners and Selling Losers: Implications for Stock Market Efficiency Narasimhan J Sheridan Titman The Journal of Finance, Vol. 48, No. 1. (Mar., 1993), pp. 65-91&br&&a href=&///?target=http%3A//www.business.unr.edu/faculty/liuc/files/BADM742/Jegadeesh_Titman_1993.pdf& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&http://www.&/span&&span class=&visible&&business.unr.edu/facult&/span&&span class=&invisible&&y/liuc/files/BADM742/Jegadeesh_Titman_1993.pdf&/span&&span class=&ellipsis&&&/span&&i class=&icon-external&&&/i&&/a&&br&&br&[2]Lesmond, David A., Michael J. Schill, and Chunsheng Zhou. &The illusory nature of momentum profits.& &i&Journal of Financial Economics&/i& 71.2 (2004): 349-380.&br&&br&[3]Korajczyk, Robert A., and Ronnie Sadka. &Are momentum profits robust to trading costs?.& &i&The Journal of Finance&/i& 59.3 (2004): .&br&&br&[4]&a href=&///?target=http%3A///pdfs/research_bid_ask.pdf& class=& external& target=&_blank& rel=&nofollow noreferrer&&&span class=&invisible&&http://www.&/span&&span class=&visible&&/pdfs/research_&/span&&span class=&invisible&&bid_ask.pdf&/span&&span class=&ellipsis&&&/span&&i class=&icon-external&&&/i&&/a&
既然有100多人关注想知道答案,我就抛块砖好了... 老师说他知道的动量策略基本都被淘汰了,我挺好奇国内会不会不一样,下午端午放假没事我翻了翻上次做的作业,又码了几行代码,用A股市场的数据跑了跑,感觉结果(写在后面)还可以啊,然后就有了这篇…
这个问题其实很值

我要回帖

更多关于 量化选股 的文章

 

随机推荐