比特币是货币还是商品?这份数据分析给你答案

DT财经 2018-02-05 14:22 阅读:1038
摘要:文/MarkSchott作为数字加密的比特币究竟是什么?它究竟是更接近商品属性,还是更接近传统意义上的货币?数据侠MarkSchott通过大数据对比特币价格的波动进行了分析。他发现比特币的价格波动极大


文/Mark Schott

作为数字加密的比特币究竟是什么?它究竟是更接近商品属性,还是更接近传统意义上的货币?数据侠 Mark Schott 通过大数据对比特币价格的波动进行了分析。他发现比特币的价格波动极大,在宏观货币经济中扮演了角色独特,其日回报率则表现得更像大宗商品的标的物。


“大宗商品”比特币


这个大数据应用项目是关于比特币价格波动的数据分析。比特币的价格波动极大,在宏观货币经济中扮演了独特角色,该加密数字货币充满争议。


我使用线性回归以及分布拟合来描述比特币的趋势, 并介绍了在未来使用信号处理(signal processing)技术对比特币进一步分析的可能性。


本文将证实比特币的高波动性特征,而且也有证据显示,比特币的确表现得更像大宗商品而非货币。


在研究中,我使用Scrapy爬取了比特币数据网站99bitcoins.com上的数据用于该项目的分析。具体来说,我爬取了61篇与比特币相关的新闻文章和每一个文章报道的事件前后10天的价格变化,以及比特币完整的每日交易价格历史数据。这些事件包括比特币交易平台Mt.Gox被黑、中国央行限制比特币等等。


(图片说明:左上是五月一日的比特币历史价格,红点对应从网站爬取的61篇新闻报道文章。其他三张图都是这张图的细节放大版,是交易过程中波动率高的短时段数据。)


我决定使用R语言的Ryuzhet包先对这些新闻报道进行一个快速的情感分析(sentiment analysis)。


我先从文字中提取出对应的情感因素,发现积极的情感和更加信任的态度在明显增多。在这个小样本的分析中,情感分析+NLP(自然语义处理)分析的方式看起来比较有效。


(图片说明:61篇新闻报道中各不同感情因素的变化情况)


上图是我爬取的61篇新闻报道中,各个不同情感因素的变化情况。横轴的event_no数值随时间而增加。稳定的增长趋势说明,这里面积极和信任的情绪在增加。


(图片说明:对“trust信任”情感的线性回归分析)


上图则是对第二组图中“trust”对应的图表进行的一个线性回归分析。得到的拟合曲线相关系数分别为p值0.018,R^2值为0.091,斜率为0.0122。


为了进一步研究比特币的走势情况,我决定将其每日回报率制作成一个直方图。图中可以看出很明显的分布规律,但我不确定是哪一种。之后我发现它相对更符合一个柯西分布的特征。这或许是因为柯西分布能更好地描述比特币相关的极端事件发生时的尾部表现。柯西分布没有明确的均值或方差,这也和比特币的高波动性相符。


我使用统计函数库scipy.stats来对分布进行拟合,所以没有检测具体的拟合参数的质量,但我计划在未来使用scipy.odr模型来完成这项工作。



以上是柯西分布的方程式,看起来与比特币的每日回报率比较匹配。这个分布没有明确的均值或方差,也证明了比特币每日回报率的高波动性。



上图为比特币每日回报率的正规化直方图(normalized histogram)。绿色曲线是柯西分布,与直方图拟合度高,红色是正态分布,拟合度就不那么高了。



以上就是大宗商品铜和棉花的分布图。尽管远远不够完美,但两者的每日回报率看起来更多遵循了柯西分布而非正态分布。也许这也说明比特币的表现更像大宗商品而非货币。


这一结论也并不令人惊讶。我们可以看看比特币的这几个特征:


1. 比特币的总量固定在2100万


2. 它迎合了国际间和匿名化的交易需求,而这总让各国政府感到头疼


3. 在一些法定货币不稳定的国家,它扮演了紧急货币的角色。比如塞浦路斯和委内瑞拉


以上这些以及其他一些因素一起,让比特币的角色非常独特(也包括其他数量相对较少的加密货币),而且使比特币在根本上有了价值。


作为最出名和最早出现的加密货币,比特币在使用上占了先机,拥有优势。这也让我们很好奇跟期待,在未来,像是莱特币、以太坊等加密货币是否仍有生存的空间。


波动起伏从不停


我的分析接下来进入金融信号处理(Financial Signal Processing)的范畴,我从btc-e比特币交易所获取历史交易数据,并将多种每日回报率随时间变化的情况以图表形式展现出来。



上图展示了1、10、30和90天为周期的回报率,其中1天的回报率图看起来像信号(signal-like),也因此促使我选择使用金融信号处理(Financial Signal Processing)进行分析。从左上角的这张图中可以大致看到,正回报率很高的时点与负回报率很高的节点在时间上很靠近,这种现象被称为波动聚类(volatility clustering)。


总的来说,我们从这个项目中了解到关于比特币的信息指出,比特币是一个价值波动非常大的、日回报率表现更像大宗商品的标的物。从相关新闻报道来看,它看起来正越来越受到信任并引发积极情感。我期待在未来继续进一步探索比特币以及其他金融时间序列数据,并学习更多的分析技巧。


注:本文翻译自《Bitcoin News Sentiments and Return Rates。内容仅为作者观点,不代表DT财经立场。


题图 | 视觉中国



关于DT×NYCDSA


DT×NYCDSA 是DT财经与纽约数据科学学院合作专栏。纽约数据科学学院(NYC Data Science Academy)是由一批活跃在全球的数据科学、大数据专家和SupStat Inc. 的成员共同组建的教育集团。



数据侠门派


Mark Schott毕业于韦恩州立大学物理学系,后进入莱斯大学攻读应用物理硕士。但在研究生期间,他意识到学术并非自己兴趣所在,于是决定离开学校寻找其他机会。之后他开始对开源软件以及Linux系统上的科学计算感兴趣,曾从事软件开发岗位。他是纽约数据科学学院12周训练营的毕业学员。现在在美国最大的人力资源数据公司ADP担任数据工程师。



加入数据侠


“数据侠计划”是由第一财经旗下DT财经发起的数据社群,包含数据侠专栏、数据侠实验室系列活动和数据侠联盟,旨在聚集大数据领域精英,共同挖掘数据价值。了解数据侠计划详情请回复“数据侠计划”。



版权声明
本文仅代表作者观点,不代表百度立场。
本文系作者授权百度百家发表,未经许可,不得转载。
阅读量: 1038
0