打开文本图片集
摘 要:以Visual Studio环境下回归分析Web应用程序成功开发实践为基础,精要列举单因变量一元线性、非线性回归和多元回归数学模型,归纳各类回归分析的基本流程,叙述Web应用程序的总体设计、Web窗体设计、类代码设计。并通过实例建模进行分析讨论。为回归分析案例应用和教学过程中回归分析提供支持。
关键词:回归分析;数学模型;Web应用程序;程序设计
回归分析是统计学中的一种确定两种或两种以上变量间相互依赖的定量关系的统计分析方法。回归分析在教学、科学研究和科学实验中应用非常广泛,在当今的大数据分析和人工智能应用中,回归分析更是一种应用广泛的预测性的建模技术,通常用来预测分析时间序列模型以及发现变量之间的因果关系。本文根据单因变量回归模型阐述一种实现回归分析Web应用程序开发的方法。该Web应用程序可作为回归分析案例应用和教学过程中回归分析的演示工具。
1.回归分析的分类
单因变量回归分析按照解释变量(自变量)的多少可分为一元回归分析和多元回归分析。一元回归分析又可以分为一元线性回归分析和一元非线性回归分析。一元非线性回归分析可采用非线性模型线性化和高次曲线回归方法来分析。多元回归分析又可以分为二元线性回归分析、二元非线性回归分析、三元线性回归分析、三元非线性回归分析和高元回归分析。
2.单因变量回归分析的数学模型
2.1一元回归分析
图1是一元回归分析的基本流程。设有n对样本观测值(X1,Y1),(X2,Y2),…,(Xn,Yn),选取回归模型,估计回归系数,进行相关检验、Y值预测和X值估控是一元回归应解决的问题。
基本分析流程是首先获取样本观察值,再选择数据模型,然后求出回归系数,再根据检验水平进行相关性检验、Y测试和作出图示,打印分析报告。如果是线性模型,还较容易对X进行估控。
2.1.1一元线性回归分析
(1)一元线性回归数据模型:
令:
则:
(2)相关系数检验: 检验临界值
(3) 的预测:Y的置信度为的预测区间为
而:
其中
(4) X的控制:要使Y落在区间(Y1,Y2)内,则X应控制在(X1,X2)之间
其中:
2.1.2一元非线性回归分析
(1)将非线性数据模型可通过变量代换或稍加变形转换为一元线性回归问题来研究
(2)用一元高次多项式(高次曲线回归)来描述一元非线性回归问题
图1 一元回归分析的基本流程
2.2多元回归分析
多元回归分析的基本流程与一元回归分析类似,只是参数的计算与检验更为复杂。
当有多个影响因变量Y的自变量时,就要进行多元回归分析。对于多元回归可以使用矩阵运算求出回归系数并进行相关性检验和预测。
下面是多元回归模型及相关分析与检验的数学处理方法。
2.2.1 元线性回归
(1)元线性回归模型
设有n组数据
令:
则可求出:
(2)多元回归线性模型的显著性检验
设:
则:检验统计量,检验临界值
(3)多元回归系数的显著性检验:
检验统计量, 检验临界值
其中
(4)多元回归线性模型的复相关系数检验:
复相关系数
检验临界值
的预测:
设我们获得了的一组新的观测值,我们可以通过元线性回归模型预测Y的估计值,这是对Y的点估计。
对于给定的,则Y的置信度为的预测区间为
其中:,
2.2.2 元非线性回归模型
3.回归分析Web应用程序
回归分析应用非常广泛,可通过计算机编程来实现。系统定位为Web应用程序,通过B/S界面实现分析过程的各项功能。采用Microsoft Visual Studio集成开发环境(IDE)和.NET Framework,代码语言采用Visual Basic 2005,在Web服务器上开发。统计分析中的检验参数通过调用Excel内置函数获取数据,系统发布及检验参数调用方法详见参考文献[6]。
3.1建立回归分析模块文件与Web窗体界面设计
回归分析模块需建名为HgfxMain.aspx、MultipleRegression.aspx、ImgConHgfx.aspx和HgfxPrt.aspx四个窗体文件。前两个窗体文件分别搭建一元回归分析和多元回归分析界面,后两个窗体文件分别实现回归作图和打印分析报告。
图2 一元回归分析的操作界面
一元回歸分析窗体由27个TextBox、1个RadioButtonList、1个DropDownList、1个GridView、1个Image以及若干个Button和多个Label控件组成。其中20个TextBox负责接收样本观测值数据对输入,如果数据超过20对,可单击“继续输入”按钮继续输入。RadioButtonList和DropDownList两个控件配合可选择不同的数据模型。如果输入的数据需要保存,可单击“保存ToXml”按钮,系统会保存用户输入的数据(系统会自动命名数据文件,用户应牢记,以便下次导入数据时使用),并在GridView控件上显示出来。如果从文件中导入数据,则会提示输入文件名。导入成功或输入数据结束后,系统会在TextBox21文本框中显示已输入或导入的数据,并可执行回归计算、预测、控制、打印分析报告等操作,同时在Image控件上显示回归曲线。图2是一元回归分析的操作界面。
多元回归可分为二元线性回归、二元非线性回归、三元线性回归和高元回归等可选子项,操作界面设计大同小异。
2.模块类代码设计
对于HgfxMain.aspx窗体文件,其底层类代码文件是HgfxMain.aspx.vb。代码结构如下:
Imports System.Xml
Partial Class HgfxMain
Inherits ClsOperation
Dim webs As localhost.ShuoShiService = New localhost.ShuoShiService
…
"当RadioButtonList1控件选项改变时调整界面相关控件属性子过程
Protected Sub RadioButtonList1_SelectedIndexChanged(ByVal sender As Object, ByVal e As System.EventArgs) Handles RadioButtonList1.SelectedIndexChanged
If RadioButtonList1.Text = "其他" Then
DropDownList1.Visible = True
Else
DropDownList1.Text = "1/X"
DropDownList1.Visible = False
…
End If
End Sub
" Button1.Click確定并处理已输入数据子过程
" Button2.Click处理继续输入数据子过程
" Button3.Click回归计算子过程
Protected Sub Button3_Click(ByVal sender As Object, ByVal e As System.EventArgs) Handles Button3.Click
…
Select Case RadioButtonList1.SelectedValue
Case "线性回归"
…
Case "对数回归"
…
Case "其他"
Select Case DropDownList1.Text
"非线性回归选择函数线性化处理模型
Case "1/X"
…
Case "ln(x)"
…
Case "Х2"
…
Case "(X+C)^2"
…
Case "Х3"
…
Case
…
Case "1/X,LnY"
…
Case "1/X,lgY"
…
Case "1/(X+c),LnY"
…
Case "1/(X+c),lgY"
…
Case "Y=a·X^b"
…
Case "e^(-X),1/Y"
…
"非线性回归选择高次回归模型
Case "β0+β1X+β2X2"
…
Case "β0+β1X+β2X2+β3X3"
…
End Select
End Select
End Sub
"Y值预测子过程
"X值估控子过程
"保存数据子过程
"导入数据子过程
"打印分析报告子过程
"清除数据子过程
…
End Class
当选择一元回归分析后,可从窗体界面输入待分析的n对样本观察值数据,或直接从文件导入数据。数据输入确定后,在TextBox21文本框中显示输入的样本数据。单击“计算”按钮,便可计算并显示出回归系数与回归方程、相关系数等,并作出回归曲线,见图3。还可用交互方式,进行Y值预测和X值估控。
图3 一元回归分析输出界面(1)
4.一元回归案例分析
对于图2所示的实例,我们选择在种不同的回归模型,结果有一定的差别。例如我们觉得图3所示的回归模型不够理想,可在不重新输入数据的情况下,重新选择回归模型,再行回归计算,从而可在极短时间内通过比较,选出较佳的回归模型。由图3、图4和图5均是对图2中的实例数据进行回归分析的结果,我们从结果中可以看出,图4和图5所示的数据模型是较优的数据模型。当然我们也可通过编程实现较优模型的自动选择。
图4 一元回归分析输出界面(2)
图5 一元回归分析输出界面(3)
5.二元回归分析
对于多元回归,根据数学描述,可通过矩阵运算求出回归系数,复相关系数,并进行检验。还可直接在界面上进行Y值预测。图6是二元线性回归分析输出界面。
对于四、五元以上的高元回归,输入数据采用字符串输入方式,自动识别元数,可给界面设置带来方便。这里不再陈述。
图6 二元线性回归分析输出界面
6.结语
由上可以看出,开发上述回归分析Web应用软件可十分方便地应用于回归分析案例分析并可作为教学过程中回归分析的演示工具,给课堂带来生气与活动。随着云教育平台在高校的逐步建立,Web教育应用软件更是大有用武之地。
参考文献
[1]程维虎.拟合优度检验的回归分析方法及其应用 [J].北京工业大学学报, 2000(02)
[2]樊重俊.贝叶斯向量自回归分析方法及其应用[J]. 数理统计与管理,2010(06)
[3]郭秀花SAS6.11版岭回归分析程序设计及其实例分析[J]. 数理统计与管理, 2001(01)
[4]朱卫华.多元回归分析程序设计与实现[J]. 河南教育学院学报(自然科学版), 1999(02)
[5]唐和平.双变数回归分析程序设计及其应用[J]. 湖南农业大学学报, 1998(06)
[6]阳晖.一款小巧新颖的Web查表程序[J]. 计算机与现代化, 2009(11)
基金项目:本文为作者国内访学课题《云时代高校学生计算机与信息教育改革创新和高校云教育平台构建研究》的科研成果之一。