本科生毕业论文(设计)开题报告
学院: 计算机科学与通信工程学院 专业: 计算机科学与技术
学号: 年级: 2020级
学 生 姓 名
|
李祥
|
指 导 教 师
|
詹永照
|
论文(设计)题目
|
基于LSTM的股票价格预测系统的设计与实现
|
与本课题有关的国内外研究情况:
随着大数据时代的到来,金融市场的数据量呈现出爆炸性增长。股票价格预测作为金融领域的重要研究方向,对于投资者而言具有重要的指导意义。传统的股票价格预测方法往往基于统计模型或简单的机器学习算法,难以捕捉股票价格的非线性特征和时序依赖性。因此,本研究旨在利用深度学习技术,特别是长短时记忆网络(LSTM),对股票价格的涨跌幅度进行预测,以提高预测精度和稳定性。
PyTorch作为一个基于Torch的Python开源机器学习库,为深度学习模型的搭建和训练提供了强大的支持。本研究将利用PyTorch搭建LSTM预测模型,通过对股票信息作多值量化分类,将股票预测转化成一个多维函数拟合问题。这不仅可以推动金融时间序列预测技术的发展,还可以为投资者提供更加准确、可靠的预测结果,有助于降低投资风险,提高投资效益。
近年来,随着深度学习技术的快速发展,长短时记忆网络(LSTM)在股票价格预测领域的应用引起了广泛关注。在国内外,许多学者针对这一问题开展了深入研究,取得了一系列的研究成果。
在国内方面,李新尧在2023年《基于SSA-LSTM神经网络的股票价格预测研究》中提出了基于LSTM的股票价格预测模型,通过对历史股价数据进行训练,成功捕捉了股票价格的时间序列特性。该研究认为,LSTM能够有效处理时间序列数据中的长期依赖问题,从而提高预测精度。张怡在2023年《基于ARIMA和AT-LSTM组合模型的股票价格预测》中则进一步研究了LSTM模型在股票价格预测中的优化策略,通过改进模型结构和参数设置,提高了预测的稳定性和准确性。
在国际上,Hong S 在《A study on stock price prediction system based on text mining method using LSTM and stock market news》研究了LSTM在股票价格预测中的性能,并将其与其他机器学习算法进行了比较。他们发现,LSTM在处理非线性、非平稳的股票价格数据时表现出色,优于传统的统计方法和一些其他的机器学习模型。另外,Zeyan Li在《LSTM Deep Learning Stock Prediction System Based on PyTorch Framework》中则关注了LSTM在实时股票价格预测中的应用,通过结合实时市场数据和新闻信息,实现了对股票价格的动态预测。
综上所述,LSTM在股票价格预测领域已经得到了广泛的应用和研究。然而,目前的研究仍存在一些挑战和不足,如如何进一步提高预测精度、如何处理市场不确定性等因素对股票价格的影响等。因此,本课题旨在基于LSTM设计并实现一个股票价格预测系统,通过深入研究和分析现有文献,结合实际的市场数据,探索更加有效的股票价格预测方法,为投资者提供有价值的参考信息。
|
本课题研究的主要内容及方法:
主要内容:
本文旨在利用PyTorch这一基于Torch的Python开源机器学习库,构建基于长短期记忆网络(LSTM)的股票价格涨跌幅度预测模型。通过对股票信息进行多值量化分类,将股票预测问题转化为多维函数拟合问题。实验采用代号510050的上证股票历史交易数据作为数据集,将股票的历史基本交易信息作为特征输入,利用神经网络进行训练,并对股票的涨跌幅度进行分类预测。实验结果表明,该模型在单纯预测涨跌的情况下展现出较好的预测效果,为投资者提供有价值的参考信息,有助于降低投资风险并优化投资策略。
主要方法如下:
本研究的主要内容是利用PyTorch搭建基于LSTM的股票价格预测模型,并对上证股票(代号510050)的涨跌幅度进行分类预测。具体研究方法如下:
数据收集与预处理:收集代号510050的上证股票的历史交易数据,包括开盘价、收盘价、最高价、最低价、成交量等特征。对数据进行清洗和预处理,包括缺失值填充、异常值处理、数据标准化等。
特征选择与量化:根据股票涨跌幅问题,选择合适的特征作为模型的输入。对特征进行多值量化分类,将连续型变量转化为离散型变量,以便于模型的训练和预测。
LSTM模型搭建:利用PyTorch搭建基于LSTM的股票价格预测模型。模型将包括输入层、LSTM层、全连接层和输出层。通过调整模型的参数和结构,优化模型的性能。
模型训练与评估:使用历史交易数据对LSTM模型进行训练,通过反向传播算法和梯度下降方法优化模型的权重和偏置。使用测试集对模型的性能进行评估,包括准确率、召回率、F1值等指标。
结果分析与讨论:对模型的预测结果进行分析和讨论,比较不同模型参数和结构对预测性能的影响。同时,将本研究的预测结果与其他方法进行比较,评估本研究的优势和不足。
其中开发硬件:Inter Core i5-8300H NVIDIA GTX1050Ti ;
操作系统:Windows10 ;
开发语言:python 。
|
本课题所需要解决的问题:
1)股票价格预测的非线性与时序性问题
股票价格受到多种因素的影响,包括宏观经济状况、公司基本面、市场情绪等,这些因素之间相互作用,使得股票价格呈现出高度的复杂性和非线性特征。传统的线性预测模型难以捕捉这种非线性关系,导致预测精度有限。同时,股票价格还具有时间序列的特性,即当前价格受到过去价格的影响。因此,如何构建一个能够处理非线性关系和时序依赖性的预测模型,是本课题需要解决的关键问题之一。
2)LSTM模型在股票价格预测中的优化与改进
虽然LSTM模型在处理时间序列数据方面具有显著优势,但在具体应用于股票价格预测时,还需要根据问题的特性进行模型优化和改进。例如,如何选择合适的特征作为输入、如何设置模型的参数和结构、如何避免过拟合和欠拟合等问题,都是本课题需要深入探讨和解决的问题。
3)数据预处理与特征工程
股票价格数据往往存在噪声、异常值和缺失值等问题,这些问题会直接影响预测模型的性能。因此,如何对数据进行有效的预处理和特征工程,提取出对预测有用的信息,也是本课题需要解决的重要问题。
4)模型评估与性能提升
在构建完预测模型后,如何对模型的性能进行有效评估,以及如何根据评估结果对模型进行改进和优化,也是本课题需要关注的问题。例如,可以使用交叉验证、准确率、召回率、F1值等指标对模型进行评估,并通过调整模型参数、改进模型结构等方式提升模型的预测性能。
综上所述,本课题需要解决的问题涵盖了股票价格预测的非线性与时序性问题、LSTM模型的优化与改进、数据预处理与特征工程以及模型评估与性能提升等多个方面。通过解决这些问题,旨在构建一个准确、高效的基于LSTM的股票价格预测系统,为投资者提供有价值的参考信息。
|
预期结果及其意义:
预期结果:
1)设计实现股票预测系统
本研究预期能够搭建一个基于LSTM的股票价格预测模型,实现对上证股票(代号510050)的涨跌幅度进行分类预测。通过与其他方法的比较,预期本研究的模型在预测精度和稳定性方面将有所提升。
本研究的创新点在于利用PyTorch搭建LSTM模型进行股票价格预测,并结合多值量化分类方法将股票预测转化为多维函数拟合问题。这有助于捕捉股票价格的非线性特征和时序依赖性,提高预测的准确性。此外,本研究还将对模型的参数和结构进行优化,探索提高预测性能的有效方法。
2)撰写一篇符合规范的毕业设计论文
在设计上述多标签分类系统的同时,完成符合规范的毕业论文。该论文将此系统设计用到的主要技术加以阐述,写明主要设计过程,演示系统的主要功能,并突出此系统的创新之处以及主要意义
意义:
该选题展示深度学习技术在金融领域的广阔应用前景。随着大数据和人工智能技术的不断发展,深度学习在金融风控、信用评级、量化交易等多个领域都展现出了巨大的潜力。本研究通过搭建基于LSTM的股票价格预测系统,不仅验证可以深度学习技术在金融预测领域的有效性,还为其他金融应用提供有益的参考和借鉴。
|
完成课题的各阶段工作具体安排
|
起止日期
|
本阶段的工作安排
|
2024.02.21-2024.03.10
|
查阅相关资料,并翻译英文资料,熟悉开发环境
|
2024.03.11-2024.04.03
|
通过资料选择合适的LSTM进行特征提取
|
2024.04.04-2024.05.02
|
通过资料学习注模型建立
|
2024.05.03-2024.05.15
|
设计实现一个股票预测系统
|
2024.05.16-2024.06.05
|
撰写毕业设计论文
|
2024.06.06-2024.06.12
|
毕业设计论文答辩和完善
|
指导教师意见:
研究内容合适,技术方案可行,工作进度安排合理。同意开题。
签名: 2024年 3月 12日
系审批意见:
签名: 年 月 日
|