Имеет ли объем публикаций в Twitter и поисков в Google эффект на цену Биткоина?
Тимоти Виктор Никитин Шин
Шимон Олегович Полищук
Сара Йенерт
Введение
Внедрение Интернета облегчило социальные взаимодействия и обсуждения по бесконечному списку
тем, особенно с появлением социальных сетей и форумов (Kristoufek, 2013). В 2017 году в Twitter насчитывалось
около 330 миллионов пользователей по всему миру (Twitter, 2018), и более 50% граждан США искали Google
несколько раз в день (Morning consult, n.d.). Переход социальной коммуникации к Интернету создал новые
переменные, которые связывают общество с реальной экономикой (Kristoufek, 2013). В частности, онлайнплатформы стали популярным сайтом для обсуждения инвестиционных возможностей (Xie and Wang, 2016).
Еще одним появлением Интернета являются цифровые валюты или криптовалюты. Самая большая и
популярная валюта — это Биткойн. На 1 января 2017 года на долю Биткоина приходилось 87,61% общей рыночной
капитализации криптовалюты, составляющей приблизительно 17 миллиардов долларов США
(Coinmarketcap.com, 2018.). Биткойн основан на технологии блокчейна (Li and Wang, 2017) и обеспечивает
несколько преимуществ в его использовании. Например, Chan et al. (2017) объясняют, что сеть пользователей
биткойнов децентрализована и «свободна от государственного контроля и регулирования». Кроме того, он
обеспечивает быструю торговлю и бесплатную немедленную транзакцию. Следовательно, интерес к Биткойну
значительно вырос за последний год.
Даже правительственные чиновники из таких стран, как Великобритания, Китай и США, публично
поощряли исследования криптовалют, чтобы объяснить и использовать их будущий потенциал (Chan et al, 2017).
Некоторые утверждают, что Биткойн демонстрирует внутреннюю ценность с точки зрения полезности (Kelleher,
n.d.), политической ценности (Bitcoin Magazine, 2014) или «усилий, необходимых для его добычи» (Bloomberg,
2017). Некоторые даже предлагали использовать биткойн для целей хеджирования (Dyhrberg, 2016) и для
регулярных транзакций (Kotkowski and Lightfoot, 2015).
Однако в то же время исследования показали, что Биткойн не имеет внутренней стоимости и что рынок
криптовалют является чисто спекулятивным (например, Fry and Cheah, 2016; Feng et al., 2017; Lam, 2017).
Следовательно, различные исследователи пытаются определить факторы, которые определяют цену (например,
Li and Wang, 2017), чтобы затем предсказать изменения цены для торговых целей (Peng et al., 2018).
Согласно Кристуфеку (2013), цена на биткойн определяется двумя основными факторами: поведением
майнеров и пользователей биткойнов и торговлей биткойнами с другими валютами. Он объясняет, что
криптовалюты «изолированы от реальной экономики». В частности, их обменные курсы не ведут себя как активы
в странах с общей экономикой, которые обусловлены макроэкономическими факторами, такими как процентные
ставки и рост ВВП. Скорее, спрос и предложение ведут себя уникальным образом. Биткойны добываются
пользователями по всему миру, которые обеспечивают децентрализованное обслуживание валюты.
Следовательно, предложение биткойнов относительно постоянно и ограничено 21 миллионами и зависит от
майнеров, разблокирующих блокчейн. Спрос, с другой стороны, зависит от краткосрочных торговых выгод и
спекуляций.
Кристуфек (2013) обосновывает свое утверждение о спекуляции на рынке. Он объясняет, что из-за
отсутствия макроэкономических факторов (например, процентных ставок) простое удержание валюты не будет
выгодно для инвесторов. Кроме того, нет никаких препятствий для инвестирования в криптовалюты; для ведения
торговли не требуется брокер или банк. Эти факторы предположительно привели к появлению группы
непрофессиональных инвесторов, которые, по нашему мнению, более склонны следовать общественному
мнению.
Исследования
Со времени появления интернета общественное мнение все чаще выражается в Интернете (Banchs et al.,
2010). Это было интересным событием для финансовых рынков, и многие исследователи изучили влияние
онлайн-социальных индикаторов на изменение цен на активы (например, Dimpfl and Jank, 2016; Xie and Wang,
2016). Например, Xie и Wang (2016) изучили взаимосвязь между настроениями инвесторов и социальными
сигналами о движении фондового рынка в Китае. Кроме того, Dimpfl и Jank (2016) показали, что волатильность
индекса Доу-Джонса тесно связана с поисковыми запросами индекса Доу-Джонса.
Следовательно, гипотетически, значение биткойна должно быть аналогичным образом реагирующим на
онлайн активность и взаимодействие. Кристуфек (2013) предполагает, что поисковые запросы в Интернете по
ключевому слову «Биткойн», измеряемые по Google Trends и Википедии, должны влиять на движение цен
Биткойн. Фактически, его результаты показывают сильную связь между ними. Увеличение объема поиска в
биткойнах приводит к росту цен, когда оценивается выше его тренда, и наоборот. Точно так же Garcia et al. (2014)
исследуют влияние социальных сигналов (твиты, связанные с биткойнами, поисковые запросы Google, новые
пользователи биткойнов) на цену биткойнов. Они находят два цикла обратной связи: 1) онлайн-поиск и
социальные сети взаимодействуют, влияя на цену Биткойн, и 2) поисковые запросы и количество новых
пользователей Биткойн взаимодействуют и сильно влияют на цену.
Интересно, что Garcia et al. (2014) находят отрицательную корреляцию поисковых запросов с ценой
биткойна. Они предполагают, что негативные новости о Биткойне побуждают людей сначала искать больше
информации в Интернете и только потом продавать свой Биткойн.
Эта работа дополнит предыдущие исследования, измерив влияние онлайн-сигналов, связанных с
биткойнами, на цену биткойнов. В частности, мы изучаем объем постов в Твиттере, включая термин «Биткойн»
и поисковые запросы в Google к термину «Биткойн». Мы сужаем наш анализ до ежедневных данных, полученных
в период с 1 марта 2017 года по 1 марта 2018 года. Это позволяет нам исследовать исторический пик цен на
биткойны и ажиотаж на рынке криптовалют в конце 2017 года (Хиггинс, 2017). Чтобы оценить влияние во
времени, мы используем регрессионный анализ метод наименьших квадратов (МНК). Кроме того, мы
оптимизируем наши регрессионные модели для контрольных переменных, найденных в прошлых исследованиях
(Ciaian et al., 2016; Li and Wang, 2017). Например, мы контролируем факторы, лежащие в основе Биткойна, такие
как сложность майнинга, стоимость транзакции Биткойна, количество пользователей кошелька, рыночная
капитализация, количество транзакций и объем биткойнов в обращении. Кроме того, мы добавляем переменные
с задержкой по времени, которые учитывают лаг цен на биткойны за 1 день и 14 дней до измерения. Кроме того,
мы изучаем запаздывающее влияние твитов и трендов Google за 1 и 14 дней до измерения.
Однако выводы, полученные в этой работе, ограничены с точки зрения точности. Данные, собранные из
твитов Биткойн, не легко доступны, и на источник, Bitinfocharts.com, нельзя полностью полагаться. Более того,
термин «Биткойн» для твитов и поисковых запросов в Google не учитывает весь спектр возможных ключевых
слов, которые аналогичным образом обсуждают темы, связанные с Биткойном. Например, хештег #BTC или blockchain регулярно используется в Твиттере (Hashtagifiy, 2018) для обсуждений, связанных с биткойнами.
Кроме того, мы не проверяем и не корректируем потенциальные смещения временных рядов в нашей регрессии
МНК. Это может дать как минимум противоречивые результаты. Более того, на протяжении всего нашего
регрессионного анализа мы находим высокую мультиколлинеарность по крайней мере для четырех переменных.
Мы опускаем эти переменные и в итоге получаем сокращенную модель, которая содержит только четыре
независимых переменных. Сокращенная модель должна быть оптимизирована с использованием
дополнительных переменных управления. Однако мы не добавляем новые переменные и, следовательно,
результаты всех моделей необходимо интерпретировать с осторожностью. Наконец, в этом документе не
учитываются фьючерсы на биткойны, представленные Чикагской товарной биржей (CME) 17 декабря 2017 года.
Введение фьючерсов на биткойны привело к снижению цены биткойнов, что «согласуется с торговым
поведением, которое обычно сопровождает введение фьючерсных рынков за актив » (Hale G, et al. 2018).
Статья построена следующим образом. Базируясь на предшествующей литературе, которая
фокусируется на похожих вопросах исследования, мы изложим нашу методологию, которая включает описание
нашей регрессионной модели, а также подробные объяснения зависимых, независимых и контрольных
переменных. После этого мы объясняем и изучаем наши данные, используя качественный анализ и описательную
статистику, и, наконец, мы представляем наши выводы и делаем выводы из полученных результатов.
В этой работе мы подробнее изучим вопросы прошлых исследований, посвященных влиянию запросов
на Биткойн в поиске Google и твитов Биткойн на цену Биткойна. Мы заменяем поиск в Википедии постами в
Твиттере так как, по нашему мнению, Твиттер является более актуальным показателем публичного обсуждения
Биткойна сегодня. Кроме того, мы переоцениваем «социальный цикл» Гарсии и др. (2014) в значительно более
высокой рыночной капитализации в 2017 году. Мы ожидаем, что результаты будут аналогичными, а корреляции более сильной.
Обзор Литературы
Чтобы лучше понять движение цен в биткойнах, были проведены различные исследования для
определения и анализа движущих факторов цены биткойнов (Ciaian, 2016; Li and Wang, 2017). Например, Ли и
Ван (2017) анализируют влияние технологических и экономических факторов на цену Биткойн с использованием
моделей ADLR. Их результаты показывают, что в краткосрочной перспективе экономические факторы и торговая
активность влияют на цену Биткойн, а общественное признание — нет. Ли и Ван (2017) пришли к выводу, что с
2013 года пользователи не так сильно подвержены влиянию ажиотажа в социальных сетях. Их регрессионные
переменные очень важны для этой статьи и включают в себя: «Стоимость транзакции в биткойнах», «поиск в
Google», «ежедневные твиты» и «трудности майнинга».
В отличие от Li и Wang (2017), Garcia et al. (2014) предполагают, что данные интернет-поиска
сопутствовали динамике экономики биткойнов в прошлом. Поэтому они выдвигают гипотезу о том, что онлайнактивность и социальное взаимодействие могут использоваться для измерения связи между ценой биткойнов и интересами общества. В период с 2010 по 2013 годы измеряются четыре социально-экономические переменные:
«пользовательская база», «поиск информации», «обмен информацией» и «цена». Их результаты показывают, что
«поиск Google», «публикации в Твиттере» и «цена» положительно дополняют друг друга («социальный цикл»);
так же, как и «поиск», «новые пользователи» и «цена». Гарсия и др. (2014) пришли к выводу, что интерес к
Биткойну стимулирует онлайн-поиски, которые затем ведут дискуссии в социальных сетях. Биткойн становится
все более популярным, что увеличивает спрос и, следовательно, его цену. Увеличение цены еще больше
увеличивает интерес и так далее. (Garcia et al., 2014)
Точно так же Kristoufek (2013) выдвигает гипотезу, что на цену Биткойна влияют предсказания
инвесторов и интерес к будущему движению цены Биткойна. В своем анализе он определяет интерес инвесторов
как еженедельные Google Trends и ежедневные поисковые данные Биткойна в Википедии. Он регрессирует в
тенденции Google и поиски в Википедии цен на биткойны и считает, что онлайн-поиск биткойнов положительно
влияет на его цену. Он приходит к выводу, что увеличение интереса инвесторов повышает спрос на Биткойн и,
следовательно, его цену (Kristoufek, 2013). Ciaian et al. (2016) показали, что на цену Биткойна положительно влияет поступление новой информации (например, поисковых запросов) в период создания Биткойна. Тем не менее, они утверждают, что появление новой информации не оказывает существенного влияния сегодня. Мы пересмотрим эти результаты, используя Google Trends и Tweets, а не Wikipedia, использованную Ciaian et al. (2016) в своих исследованиях.
Наша Гипотеза
Мы предполагаем, что социальные сети оказывают как минимум краткосрочное влияние на цену
Биткойна. Поэтому мы расширяем наш регрессионный анализ, чтобы изучить запаздывающее влияние биткойнтвитов и поисковых запросов в Google за две недели до измерения цены. Кроме того, мы предполагаем, что две
переменные отличаются с точки зрения того, насколько быстро они влияют на цену биткойна. Поэтому мы
измеряем их влияние с двух точек времени: 1) за день до и 2) за две недели.
Регрессия
Регрессионный анализ будет контролироваться для как для индикаторов предложения Биткойн, так и
спроса на Биткойн, включая экономические и технологические факторы Биткойна. Наша первоначальная
регрессия обозначена следующим образом (Модель 1):
Далее мы находим доказательства того, что данные распределены логнормально. Поэтому мы проводим
лог-преобразование для большинства наших переменных. Мы находим следующую Модель 2, чтобы показать
более значимые результаты:
Далее мы видим свидетельства высокой мультиколлинеарности. Мы исключаем одну за другой
переменные с самым высоким значением vif и снова запускаем регрессию. Это оставляет нам
следующие переменные: ∆Tweets, Google Trends, Cost per transaction, ∆Number of
Transactions. Следовательно, наша последняя Модель 3:
Результаты
На протяжении нашего регрессионного анализа мы анализируем 3 модели, изложенные выше. Для
моделей 2 и 3 мы запустили 5 регрессий, в том числе 1) отсутствие временной задержки, 2) переменные
временной задержки твитов и поисков Google для 1 против 3) 14 дней и 4) трендовые переменные цены биткойна
1 день против 5) 14 дней. Хотя точные оценки могут не соответствовать из-за незавершенности моделей, наши
результаты все же проливают некоторый свет на связь между контрольными переменными и ценой биткойнов.
Результаты суммированы в таблицах 6, 7 и 8 (Приложение A). Обратим внимание на выводы по Модели 3.
В модели 3 устранена мультиколлинеарность и модель показывает статистически значимые оценки для
всех переменных. Мы считаем, что стоимость транзакции Биткойн оказывает положительное влияние на цену
Биткойн. В частности, регрессия МНК предсказывает, что когда стоимость транзакции увеличивается (cost) на
один доллар США, цена биткойна (price) увеличивается на 85,5 доллара США. Это интересная находка, связанная
со спросом на биткойны. Мы считаем, что эти отношения можно объяснить сложностью формирования комиссии
за транзакции. Плата за перевод рассчитывается в сатоши за байт, конвертируется в биткойны, а затем в
денежную единицу в долларах США. В частности, когда цены на биткойны выросли, спрос на крупные
транзакции значительно вырос — люди покупали больше биткойнов. Следовательно, комиссионные за транзакции
будут увеличиваться из-за характера ставок комиссий. Это также сопровождалось ростом денежной стоимости Биткойн.
Еще один интересный вывод заключается в том, что, согласно модели 3, увеличение количества
ежедневных твитов о биткойнах (log(tweets)) на один процент увеличивает цену биткойна примерно на 803
доллара США. Это отличается от результатов Модели 2, где твиты оказали негативное влияние на цену Биткойн.
Ли и Ван (2017) находят аналогичные противоречивые результаты, когда в долгосрочной перспективе твиты
увеличивают цену биткойнов, а в краткосрочных твитах снижают цену биткойнов. Мы не контролируем
краткосрочные или долгосрочные модели 2 и 3. Вместо этого мы включаем переменные с задержкой во времени
для биткойн-твитов и трендов Google в моделях 2 L1 и 2 L14, а также в моделях 3 L1 и 3 L14 для анализа эффекта
c другой временной перспективы.
Результаты с задержкой
Мы проводим те же регрессионные анализы для моделей 2 и 3 с переменной временной задержки цены
биткойна 1 день по сравнению с 14 днями до дня измерения. Мы находим, что индикатор цены биткойна (price)
с 14-дневной задержкой статистически незначителен. Однако цена за один день до измерения показывает
значительный положительный эффект. Фактически, увеличение цены Биткойна на 1 доллар с задержкой в 1 день
увеличивает цену Биткойна сегодня примерно на 0,85 доллара США как в Модели 2, так и в 3. Это означает, что
цена изменяется в обоих направлениях почти на 100%.
Кроме того, мы проверяем влияние твитов и поисковых запросов в Google за 1 день и 14 дней до
измерения как в модели 2, так и в модели 3. В модели 2 обе переменные лага важны для объяснения цены
биткойна. Увеличение на одну единицу поисковых запросов в Google (trends) увеличивает цену Биткойн на 31,87
долларов США через день и 17,48 долларов США через 14 дней. В контракте увеличение твитов про Биткойн
(tweets) на один процент снижает цену Биткойн на 745,86 долларов США через день и на 424,76 долларов США
через 14 дней. Однако поисковые запросы в Google и твиты за 14 дней до измерения близки к критическому
значению (P> | t | = 0,06 и P> | t | = 0,04 соответственно). Это показывает, что оба фактора оказывают менее
существенное влияние на цену биткойна с течением времени.
В модели 3 мы находим, что все переменные запаздывания значимы, за исключением поисковых
запросов в Google за 14 дней до измерения (P> | t | = 0,09). При увеличении на одну единицу поисковых запросов
Google цена вырастает на 54,9 доллара США через 1 день и на 24,1 доллара США через 14 дней. Однако, в отличие
от Модели 2, твиты теперь положительно влияют на цену Биткойна, используя переменные лага.
Однопроцентное увеличение количества твитов о Биткойне увеличивает цену Биткойна на 810,2 долларов США
через день и на 1342,3 долларов США через 14 дней после. Интересно, что это означает, что твиты о Биткойне
будут влиять на цену Биткойна больше с течением времени (через 14 дней), чем в краткосрочной перспективе
(после 1 дня).
Заключение
Наши результаты показывают, что как твиты, так и поисковые запросы в Google оказывают
статистически значимое положительное влияние на цену при уменьшении из мультиколлинеарности (Модель 3).
Кроме того, мы считаем, что стоимость транзакции положительно влияет на цену Биткойна. Однако мы полагаем,
что это скорее показатель высокого спроса на транзакции в биткойнах, в отличие от типичных интерпретаций,
основанных на модели затрат и спроса.
Кроме того, мы изучаем переменные с лагом в 1 день (Модель 3 L1) и 14-дневным лагом (Модель 3 L14)
и обнаруживаем, что поисковые запросы Google наиболее существенно влияет на цену Биткойн в тот же день,
тогда как твиты имеют наибольшее эффект с лагом в 14 дней. Наконец, мы находим, что есть ценовой тренд,
регрессируя Модели 2 и 3 и контролируя ценовое отставание Биткойна в 1 день и 14 дней. В частности, наша регрессия показывает, что цена биткойна предыдущего дня положительно и существенно влияет на цену
биткойна сегодня. Однако цена биткойна за 14 дней до измерения не оказала существенного влияния.
Тем не менее, наш анализ основан на относительно ограниченном круге инструментов для
корректировки регрессии МНК к временным рядам; скорректировать возможные отклонения и несоответствия,
характерные для временных рядов. Кроме того, высокая мультиколлинеарность заставляет нас опускать
большинство управляющих переменных. Это могло повлиять на оценки как для Модели 2, так и для Модели 3.
Кроме того, источник данных для твитов Биткойн сомнителен и может привести к неточным результатам. Это
происходит из-за неточности, которую мы не учитываем в терминах Google и Twitter, связанных с биткойнами.
Таким образом, точная денежная интерпретация наших оценок может быть неточной. Тем не менее, связь
(положительная или отрицательная) между контрольными переменными и ценой Биткойна все еще сохраняется
и может быть в целом понята из нашего анализа.
Подводя итог, мы предлагаем провести более обширное исследование по вопросу цен на биткойны в
отношении социальных сетей и новостей. Это исследование должно включать другие платформы, такие как
Facebook и LinkedIn, а также основные финансовые новостные интернет-газеты и биткойн-блоги. Результаты
такого исследования дадут более точное понимание взаимосвязи между ценой биткойна и онлайн-дискуссией
вокруг биткойна. Кроме того, анализ должен включать более широкий диапазон ключевых слов, окружающих
биткойн. Кроме того, регрессия должна контролироваться на наличие новых факторов, которые могут повлиять
на цену биткойнов, таких как правительственные постановления. Наконец, мы предлагаем проанализировать эту
проблему не только на примере биткойнов, но и на других криптовалютах, включая Etherium и другие.