یک رویکرد مبتنی بر نمودار به همجوشی اطلاعات ناهمگن چند منبع در بازار سهام

  • 2022-11-17

بازار سهام بخش مهمی از بازار سرمایه است و تحقیقات در مورد نوسانات قیمت بازار سهام همیشه موضوع داغ برای محققان بوده است. به عنوان یک سیستم پویا و پیچیده ، بازار سهام تحت تأثیر عوامل مختلف قرار می گیرد. با این حال ، با توسعه فناوری اطلاعات ، اطلاعات ویژگی های چند منبع و ناهمگن را ارائه می دهد ، و سرعت انتقال و نحوه اطلاعات بسیار تغییر کرده است. توضیح و تأثیر اطلاعات چند منبع و ناهمگن در نوسانات قیمت سهام سهام نیاز به مطالعه بیشتر دارد. در این مقاله ، یک روش همجوشی و تعبیه نمودار برای اطلاعات ناهمگن چند منبع از بازار سهام چین ایجاد شده است. اطلاعات بعد رابطه ای برای تحقق همجوشی مؤثر اطلاعات داده های ناهمگن چند منبع معرفی شده است. یک شبکه عصبی نمودار چند منظوره مبتنی بر گره ها و معناشناسی ساخته شده است تا معناشناسی ضمنی داده های نمودار فیوژن ساخته شده و تأثیر اطلاعات ناهمگن چند منبع را در نوسانات قیمت سهام بورس ضبط کند. آزمایشات نشان می دهد که روشهای همجوشی اطلاعات ناهمگن چند منبع پیشنهادی نسبت به روش فیوژن تانسور یا وکتور برتر است و شبکه عصبی نمودار چند منظوره ساخته شده توانایی بهتری در توضیح نوسانات قیمت بورس دارد.

استناد: Wang J ، Li X ، Jia H ، Peng T (2022) یک رویکرد مبتنی بر نمودار به همجوشی اطلاعات ناهمگن چند منبع در بازار سهام. PLOS ONE 17 (8): E0272083. https://doi. org/10. 1371/journal. pone. 0272083

ویراستار: نینگ دو ، دانشگاه دپول ، ایالات متحده

دریافت: 14 آوریل 2022 ؛پذیرفته شده: 12 ژوئیه 2022 ؛منتشر شده: 11 اوت 2022

کپی رایت: © 2022 Wang et al. این یک مقاله دسترسی آزاد است که تحت شرایط مجوز انتساب Creative Commons توزیع شده است ، که امکان استفاده ، توزیع و تولید مثل بدون محدودیت در هر رسانه را فراهم می کند ، مشروط بر اینکه نویسنده و منبع اصلی اعتبار داشته باشند.

در دسترس بودن داده ها: لینک دستیابی به داده های تجربی به شرح زیر است: https://figshare. com/s/7f924a6df9b4a345a3f0 پیوند کد نمونه: https://figshare. com/s/2A001CA601B444AE0A4D0.

بودجه: نویسندگان بودجه خاصی برای این کار دریافت نکردند.

منافع رقابتی: نویسندگان اعلام کرده اند که هیچ منافع رقابتی وجود ندارد.

1. مقدمه

به عنوان بخش مهمی از بازار مالی کلی ، بورس سهام به طور گسترده توسط محققان و سرمایه گذاران مورد مطالعه قرار گرفته است. روند قیمت سهام سری زمانی غیرخطی و ناپایدار است و محققان نوسانات قیمت سهام را به طور گسترده مورد مطالعه قرار داده اند. در 30 سال گذشته ، بازار سهام چین ، به عنوان سریعترین بازار در حال توسعه سرمایه در حال ظهور ، به محور تحقیقات محققان برای جلوگیری از ریسک های مالی و به دست آوردن سود سرمایه گذاری شده است. در تحقیقات بازار سهام ، محققان نظریه های مختلفی را برای توضیح مکانیسم نوسانات بازار سهام ارائه داده اند که از این میان مشهورترین آنها فرضیه بازار کارآمد و نظریه امور مالی رفتاری هستند. فرضیه بازار کارآمد [1] اظهار داشت که سرمایه گذاران کاملاً منطقی می توانند با توجه به اطلاعات کامل کافی ، در رفتار سرمایه گذاری سریع و معقول شرکت کنند. براساس این نظریه ، دستیابی به بازده سرمایه گذاری بیش از حد با فرض یک بازار کارآمد برای سرمایه گذاران دشوار است. با این حال ، با افزایش مطالعات رفتار مالی ، محققان دریافتند که سرمایه گذاران تحت تأثیر عوامل فرهنگی و روانی قرار دارند و رفتار مالی در بازار با غیر منطقی بودن مشخص می شود [2 ، 3]. در تحقیقات مربوط به نوسانات بورس سهام ، عوامل بسیاری بر نوسانات بورس سهام تأثیر می گذارد و اطلاعات مختلف می تواند تأثیر عوامل مختلف بر نوسانات بورس را منعکس کند. تعامل عوامل مختلف در بورس به یک جهت تحقیق محبوب تبدیل شده است [4 ، 5]. در حال حاضر ، به دلیل توسعه سریع فناوری اطلاعات ، میزان اطلاعات با سرعت حیرت انگیز افزایش می یابد. سرمایه گذاران در بورس سهام در معرض مقدار قابل توجهی از اطلاعات قرار دارند ، که مبنای داده خوبی برای تحقیق و تجزیه و تحلیل نوسانات بازار سهام فراهم می کند. داده های معاملاتی [6] ، مانند قیمت باز ، قیمت بسته شدن و حجم معاملات ، می تواند برای به دست آوردن حرکت [7] ، وزن [8] و سایر شاخص های مشتق برای پیش بینی و تجزیه و تحلیل نوسانات قیمت سهام استفاده شود. با توسعه فناوری اینترنت و اینترنت موبایل ، تأثیر اخبار بورس سهام بر سرمایه گذاران بورس سهام به طور فزاینده ای قابل توجه است. اخبار بورس اوراق بهادار همه جانبه است ، از اخبار عینی و خنثی که منعکس کننده شرایط بازار سهام و رویدادهای تجاری شرکت گرفته تا گزارش های خبری است که بر روند کوتاه مدت بازار سهام تأثیر می گذارد [9 ، 10].

محققان تعداد زیادی روش برای پیش‌بینی بازار سهام بر اساس تحلیل احساسات اخبار بازار سهام پیشنهاد کرده‌اند [11، 12]. سیمون و همکارانکمیت اخبار را مطالعه کرد و به این نتیجه رسید که حجم زیادی از اطلاعات منجر به توجه ضعیف می شود [13]. چان با در نظر گرفتن عناوین اخبار به عنوان نقطه شروع، حساسیت سرمایه گذاران به اخبار را مورد مطالعه قرار داد [14]. وانگ و همکارانتأثیر گزارش‌های خبری بر بازار سهام را از دو جنبه توجه رسانه‌های خبری و شاخص‌های احساسی مورد بررسی قرار داد [15]. جو یک سیستم تعبیه شده در نمودار دانش سازمانی را برای گسترش اطلاعات خبری مرتبط با سازمان پیشنهاد کرد. بر این اساس، از مدل واحد رگرسیون بسته (GRU) برای پیش‌بینی نوسانات قیمت سهام با ترکیب احساسات خبری سهام و ویژگی‌های کمی سهام در نظر گرفته شده استفاده شد [16]. علاوه بر این، ناردو و همکاران. تأیید کرد که اطلاعات بازار سهام را می توان برای پیش بینی بازار سهام با مطالعه مقدار زیادی از اطلاعات اینترنتی مورد استفاده قرار داد، اما رویکرد آنها در دستیابی به بازده مورد انتظار بهبودیافته ناموفق بود و برای ساخت مدل های پیش بینی بیش از حد خواستار بود [17]. تحقیقات تحلیلی در مورد نوسانات قیمت بازار سهام به تدریج از شاخص های منفرد مانند داده های معاملاتی و داده های اخبار بازار سهام به داده های چند شاخصه ادغام شده توسعه یافته است. داده های چند شاخصی ویژگی های چند منبعی و ناهمگن را ارائه می دهند. تاکار و همکاران[18] تکنیک های ادغام بازار سهام را به عنوان ترکیب اطلاعات [19]، ترکیب ویژگی [20] و ترکیب مدل [21] طبقه بندی کرد. ادغام اطلاعات عمدتاً با استخراج اطلاعات خبری و ادغام داده ها با داده های معاملات بازار سهام برای به دست آوردن داده های جامع برای پیش بینی بازار سهام به دست می آید. از سوی دیگر، فیچر فیوژن از مدل‌های الگوریتمی برای بیان داده‌های همگن به اشکال مختلف و در عین حال دستیابی به استخراج ویژگی‌های چند بعدی استفاده می‌کند. در مقابل، تلفیقی مدل، مدل‌های آماری، مدل‌های الگوریتمی هوش مصنوعی، مدل‌های یادگیری عمیق و غیره را ترکیب می‌کند تا یک مدل ترکیبی برای تجزیه و تحلیل و پیش‌بینی نوسانات بازار سهام تشکیل دهد. با این حال، پژوهش حاضر از محدودیت های متعددی رنج می برد که به طور خلاصه به شرح زیر است.

اول، استخراج ویژگی متن خبر به اندازه کافی جامع نیست. اطلاعات مربوط به عوامل عاطفی [11، 12]، اطلاعات عینی [14] که به شرایط عملیاتی و ابزار و میزان پوشش خبری [13-15] موجود در متون خبری پاسخ می دهد، می تواند بر بازار سهام تأثیر بگذارد. اطلاعات متن خبری در مطالعات ترکیبی داده‌های چندمنبعی سنتی شامل ویژگی‌هایی است که تنها از یک دیدگاه استخراج شده‌اند [18، 19]. دوم، ادغام داده‌های ناهمگن چندمنبعی سنتی در بازار سهام به طور کلی به روش تانسور یا برداری انجام می‌شود [22-25]، و افزونگی داده‌ها با توجه به حجم بسیار زیاد داده فعلی و انتشار بسیار سریع اطلاعات، که کارایی اطلاعات بعدی را محدود می‌کند، قابل توجه است. پردازش و تجزیه و تحلیل داده هاهنگام پردازش و تجزیه و تحلیل اطلاعات ناهمگن چندمنبعی، مدل‌های اقتصادسنجی سنتی نمی‌توانند به طور موثر اثرات پیچیده عوامل غیرخطی را بر نوسانات دارایی‌ها اندازه‌گیری و تعیین کنند. علاوه بر این، ماهیت جعبه سیاه الگوریتم‌های یادگیری ماشین محدودیت‌هایی در استخراج اطلاعات معنایی ضمنی داده‌های مالی پیچیده دارد.

برای پرداختن به این چالش‌ها، ما یک رویکرد ترکیب گراف برای داده‌های ناهمگن چندمنبعی پیشنهاد می‌کنیم و یک شبکه عصبی گراف را بر اساس گره‌ها و مکانیسم‌های توجه معنایی برای پیش‌بینی روند نوسان قیمت بازار سهام می‌سازیم. به طور خاص، ما یک شبکه پیچیده از منابع متعدد اطلاعات ناهمگن در بازار سهام ایجاد می کنیم تا به ادغام داده های ناهمگن داده های شاخص معاملات و متن اخبار بازار سهام دست یابیم. یک مدل شبکه عصبی گرافیکی بر اساس مکانیسم‌های توجه چندگانه برای استخراج تعامل بین منابع متعدد اطلاعات ناهمگن و اثر ترکیبی سرریز اطلاعات در بازار سهام برای پیش‌بینی نوسانات قیمت بازار سهام ساخته شده است. نتایج تجربی پیش‌بینی نوسانات بازار سهام و بک‌آزمایی استراتژی نشان می‌دهد که روش پیشنهادی به نتایج خوبی در پیش‌بینی بازار سهام دست می‌یابد.

  1. به طور خلاصه، مشارکت های نوآورانه اصلی این مطالعه به شرح زیر است:
  2. ما به طور کارآمد اطلاعات ناهمگن چندمنبعی را در بازار اوراق بهادار تعیین می کنیم و ویژگی های مالی شاخص ها را برجسته می کنیم. اطلاعات ناهمگن چند منبعی به گره‌های ناهمگن تقسیم می‌شود و دانه‌بندی اطلاعات پالایش می‌شود. ویژگی‌های احساسی متون خبری را کمی کنید و ویژگی‌های گره را برای ادغام عوامل عقلانی و غیرمنطقی تنظیم کنید.
  3. به طور خلاقانه بعد رابطه ای را برای ساختن یک شبکه پیچیده از سری های زمانی معرفی کنید. بر اساس تحقق موثر ادغام اطلاعات ناهمگن چند منبعی، کارایی اخبار کاوی را در بازار اوراق بهادار بهبود می‌بخشد، مشکل چند مقیاسی سری‌های زمانی مالی را حل می‌کند و همبستگی سری‌های زمانی را تفسیر می‌کند.

ما یک شبکه عصبی نموداری با گره‌ها و توجه معنایی به‌عنوان هسته طراحی می‌کنیم تا تأثیر سرریزهای اطلاعاتی را که توسط اطلاعات ناهمگن چندمنبعی مرتبط به هم در نوسانات قیمت بازار اوراق بهادار شکل می‌گیرد، ثبت کنیم. با غلبه بر محدودیت‌های مدل‌های اقتصادسنجی سنتی برای تجزیه و تحلیل داده‌های مالی غیرخطی و پیچیده، مدل یادگیری عمیق ساخته‌شده در این مقاله یک کاوش بسیار معنادار از تحقیقات مالی معاصر است.

2. کارهای مرتبط

2. 1 فناوری فیوژن

در تحقیقات بازار سهام ثابت شده است که پیش‌بینی روند قیمت سهام ارتباط نزدیکی با ویژگی‌های سری زمانی مالی دارد [26]. در واقع، داده‌های مالی دارای ویژگی‌های زمانی مالی نویز، غیرخطی و تصادفی هستند و عوامل تأثیرگذار پیچیده زیادی وجود دارد [27]. با این حال، ادواردز R D و همکاران.[28] ثابت کرد که روند سری‌های زمانی مالی تکرار می‌شود و روند سری‌های زمانی ویژه فردی در روند سری‌های زمانی آینده بسیار شبیه به نظر می‌رسد. داده‌های معاملات تاریخی مانند قیمت افتتاحیه، قیمت بسته شدن، بالاترین قیمت، پایین‌ترین قیمت و حجم معاملات می‌توانند مستقیماً تغییرات در بازار مالی را منعکس کنند و سایر شاخص‌های فنی را می‌توان برای کمک به قضاوت در مورد روند سهام استخراج کرد. مدل‌های AR، ARMA، ARIMA و بهینه‌سازی از داده‌های سری زمانی معاملات برای تحلیل خطی استفاده می‌کنند [29-31]، در حالی که برخی از مدل‌ها مانند RNN، CNN و LSTM، داده‌های معاملات تاریخی و شاخص‌های مشتق را به تانسورهایی برای تحلیل غیرخطی برای پیش‌بینی سهام پردازش می‌کنند. نوسانات بازار [32]. Roondiwala [33] یک شبکه عصبی بازگشتی (RNN) و حافظه کوتاه مدت بلند مدت (LSTM) را برای پیش بینی NIFTY50 اتخاذ کرد. با تعمیق پژوهش، اطلاعات متنی به عنوان شاخص ارزیابی وارد کمیت بازار سهام می‌شود و اطلاعات متنی از منظر تحلیل رویداد محور و احساسات پردازش می‌شود. اتکینز و همکاران[11] یک مدل توزیع نهفته دیریکله ساخت و از بیز ساده لوح برای پیش بینی جهت نوسانات بازار سهام از طریق اخبار مالی استفاده کرد. وی و همکاران[12] یک شاخص کل احساسات خبری برای شرکت‌های مرتبط ایجاد کرد، که ثابت کرد سطوح احساسات در گزارش‌های خبری می‌تواند به‌عنوان یک نماینده برای ارائه پشتیبانی ارزشمند برای تصمیم‌گیری پورتفولیو عمل کند.

در سالهای اخیر ، محققان تلفیق داده های ناهمگن چند منبع در بازار سهام را مطالعه و بررسی کرده اند. ژانگ [34] مدل جدید مخفی Markov را ارائه داد ، که می تواند به طور مؤثر متن خبری و داده های معاملات تاریخی را برای پیش بینی سهام ادغام کند. در مقاله بعدی [19] ، رویدادها و احساسات کاربر از اخبار آنلاین و رسانه های اجتماعی استخراج شد و همجوشی داده ها با اتصال ماتریس و ماتریس های درجه پایین که توسط چارچوب Tensor تجزیه شده بودند ، حاصل شد. کیم [35] و همکاران. یک روش شبکه توجه نمودار سلسله مراتبی را ارائه داد ، که به طور انتخابی اطلاعات را از روابط مختلف جمع می کند ، و ویژگی های روابط استخراج شده ویژگی های گره را برای تحقق همجوشی اطلاعات برای پیش بینی بازار سهام آغاز می کند. لی [36] احساسات اجتماعی و نظرات حرفه ای را به دست آورد ، از روش Tensor برای تشکیل کل فضای اطلاعات بازار متشکل از خصوصیات سازمانی استفاده کرد و از یک فضای اطلاعات الگوریتم یادگیری تانسور برای تعامل با روند سهام استفاده کرد. در حال حاضر ، روشهای همجوشی داده های ناهمگن چند منبع مبتنی بر زمینه مالی داده ها را به بردارها یا تانسور تبدیل می کنند ، اما رابطه بین اطلاعات چند منبع را به طور عمیق کشف نمی کنند و از همبستگی بعدی سری های زمانی غافل می شوند.

2. 2 شبکه های عصبی نمودار

شبکه های عصبی نمودار برای حل مشکل یادگیری عمیق داده های نمودار توسعه داده شدند. تنها در چند سال ، فن آوری شبکه عصبی نمودار به طور قابل توجهی پیشرفت کرده و کاربردهای گسترده ای را تجربه کرده است [37-39]. برونا و همکاران.[40] شبکه های عصبی Convolutional Graph را در سال 2013 با استفاده از یک رویکرد فضایی طیفی برای تعریف نتیجه نمودار ارائه داد. Chebnet [41] و GCN [42] ماتریس وزن گره ها را از یک دیدگاه مکانی تعریف می کنند تا پیچیدگی مکانی مکانی را کاهش داده و بهینه سازی پارامتر عملکرد هسته را انجام دهند. کیم [35] و همکاران. یک شبکه توجه سلسله مراتبی را برای پیش بینی بازار سهام با استفاده از داده های رابطه ارائه داد. از این روش برای پیش بینی حرکات قیمت سهام و شاخص های بازار فردی با جمع آوری اطلاعات در مورد انواع مختلف روابط و افزودن این اطلاعات به نمایندگی هر شرکت استفاده می شود. لیو [43] و همکاران. روشی را برای پیش بینی نوسانات قیمت سهام با استفاده از نمودار دانش روابط بین شرکتهای ذکر شده با استفاده از یک مدل سلول رگرسیون با فرم بسته همراه با احساسات مربوط به سهام سهام ، احساسات اخبار سهام کانونی و تعداد اخبار سهام کانونی ارائه داد. Matsunaga [44] با معرفی نمودارهای دانش شرکت در مدل پیش بینی برای تقلید از تصمیم گیری سرمایه گذاران ، اثربخشی کار متقابل بین پیش بینی بازار و شبکه های عصبی گرافیکی را بررسی کرد. اعتبار در بازارهای مختلف و دهانه های طولانی تر با استفاده از پشتی پنجره نورد ارزیابی شد. محققان به طور گسترده استفاده از شبکه های عصبی نمودار در پیش بینی بازار سهام را بررسی کرده اند. نقش اصلی داده های نمودار گسترش شاخص های ویژگی بر اساس داده های رابطه ای برای پیش بینی حرکت بازار سهام است. برای تجزیه و تحلیل و پیش بینی نوسانات بازار سهام ، مطالعات انجام شده تاکنون در مورد ساخت و تجزیه و تحلیل شبکه های پیچیده اطلاعات بازار سهام در مرحله اولیه است. تأثیر سرریز اطلاعات بر نوسانات قیمت بورس که با اتصال چندین منبع اطلاعات ناهمگن در بورس ایجاد شده است ، نیاز به اکتشافات بیشتر دارد.

در سال‌های اخیر، تلاش‌هایی برای طراحی یادگیری شبکه‌های عصبی گراف برای گراف‌های ناهمگن انجام شده است. وانگ [45] و همکاران. پیشنهاد کرد که شبکه توجه گراف ناهمگن عمدتاً شامل دو نوع مکانیسم توجه است: همسایگی گره و متا مسیر. فو [46] و همکاران. گره های متاپات را به عنوان دامنه تجمع در نظر گرفت و MAGNN (شبکه عصبی گراف انبوه متاپات) را برای تجمیع اطلاعات درون متاپات و اطلاعات بین متاپات پیشنهاد کرد. HetGNN [47] (شبکه عصبی گراف ناهمگن) ابتدا یک استراتژی پیاده روی تصادفی را برای نمونه برداری همسایگی اتخاذ می کند و از Bi-LSTM های تخصصی برای ترکیب ویژگی های گره ناهمگن و گره های همسایگی استفاده می کند. هونگ [48] و همکاران. HetSANN را برای یادگیری انواع مختلف گره‌های مجاور و لبه‌های مرتبط از طریق یک لایه توجه آگاه از نوع و رمزگذاری مستقیم اطلاعات در نمودارهای ناهمگن از طریق مکانیزم توجه متمرکز طراحی کرد. بر اساس معماری ترانسفورماتور [49]، یک HGT (ترانسفورماتور گراف ناهمگن) ساخته و اعمال می شود تا ویژگی های گره های مختلف و انواع خاص روابط را یاد بگیرد. با این حال، اکثر روش‌های فوق از مکانیسم انتشار نمایش گره‌ها و یال‌ها در نمودارهای ناهمگن فضایی پیروی می‌کنند و نمایش تجمع گره‌ها و یال‌ها در سری‌های زمانی بیشتر مورد مطالعه قرار نگرفته است. برای تجزیه و تحلیل و پیش بینی نوسانات بازار سهام، ساخت و تجزیه و تحلیل شبکه پیچیده ای از اطلاعات بازار سهام که در حال حاضر انجام می شود، همه در مراحل اولیه خود هستند. تأثیر سرریزهای اطلاعاتی ایجاد شده توسط اطلاعات ناهمگن چندمنبعی مرتبط در بازار سهام بر نوسانات قیمت بازار سهام هنوز نیاز به بررسی بیشتر دارد.

بر اساس تحقیقات قبلی، این مقاله یک شبکه پیچیده مبتنی بر منابع متعدد اطلاعات ناهمگن در بازار سهام چین ایجاد می‌کند، ادغام داده‌های موثر را تحقق می‌بخشد و گره‌ها و یک مکانیسم توجه معنایی گراف شبکه عصبی را برای به تصویر کشیدن تعامل بین منابع متعدد اطلاعات ناهمگن معرفی می‌کند. و تاثیر جامع سرریز اطلاعات بر بازار سهام. روش پیشنهادی به تفصیل در بخش بعدی توضیح داده شده است.

3. ساخت مدل

3. 1 معرفی مدل

برچسب ها

ثبت دیدگاه

مجموع دیدگاهها : 0در انتظار بررسی : 0انتشار یافته : ۰
قوانین ارسال دیدگاه
  • دیدگاه های ارسال شده توسط شما، پس از تایید توسط تیم مدیریت در وب منتشر خواهد شد.
  • پیام هایی که حاوی تهمت یا افترا باشد منتشر نخواهد شد.
  • پیام هایی که به غیر از زبان فارسی یا غیر مرتبط باشد منتشر نخواهد شد.