第2讲线性回归案例分析

上传人:仙*** 文档编号:104689661 上传时间:2022-06-10 格式:DOC 页数:28 大小:67.01KB
收藏 版权申诉 举报 下载
第2讲线性回归案例分析_第1页
第1页 / 共28页
第2讲线性回归案例分析_第2页
第2页 / 共28页
第2讲线性回归案例分析_第3页
第3页 / 共28页
资源描述:

《第2讲线性回归案例分析》由会员分享,可在线阅读,更多相关《第2讲线性回归案例分析(28页珍藏版)》请在装配图网上搜索。

1、第2讲 线性回归案例分析参与本讲的嘉宾姓名单位职称、职务王尚志首都师范大学张饴慈首都师范大学张思明北大附中张质祎北大附中高二1班学生陈翀尧北大附中高二1班学生主持人:各位老师大家好!欢迎大家继续参加我们模块三有关统计教学的讨论。 首先允许我来介绍一下请来的讨论的评论嘉宾,我身边这位是非常熟悉的首都师范大学张饴慈教授,这边是首都师范大学博士生导师王尚志教授,欢迎两位到场参加我们的讨论。 我们今天讨论的话题是统计学教学里面一个非常重要的内容。我们标准里面提出来统计学内容在模块三里面是一个很重要的,实践性很强的内容,很多老师都做了一些专门的设计,提出来怎么学好统计,有一个很重要的思想,就是要通过活动

2、课来学。我们首先问王老师,活动在统计学学习里面有什么价值和作用? 王尚志:统计学的教学或是概率统计或是必修三的教学,在标准上有一个特别建议,就要希望通过案例来进行教学。就是希望通过具体的东西,让学生进行感悟,再逐渐上升成为对于这样一些统计、概率、算法的认识,我觉得这一点是特别重要的。而案例教学对于统计这样特殊的课程来说,如果再赋予活动的内容,我想就更好了。学生可以在做问题的过程中去体会,收集数据、怎么收集数据、怎么整理数据,怎么从数据中提取信息帮助我们说明问题这样一个过程。 根据我们的实践感觉这样的课如果加进去一些活动,会使我们学生通过自己的经历更好地展示,更好地理解他们要学习的内容。张饴慈:

3、我想统计这个课,在中学讲统计课不是从定义、总体、样本、众数,不是在这方面强调,而是希望他经历一个统计的整个过程,从开始的收集数据一直到最后得到结论,对结论的分析。他有这个过程的话,对这个统计学的概念意义也能够很好的理解,而不是抽象的从一些定义、靠推理出发得到一些结论,跟那种还是不太一样的。王尚志:另外在统计中应该更着重体现数学中的归纳的思想,我们要抽象地讲总体、抽样这些 我想在中学层面上可能也很难讲得很清楚,包括在大学层面上可能也不一定能够讲清楚,可能更多的是现在在很多问题上,以及从专家上面还是有一些问题。但是从处理数据这件事情,已经变成我们必须学习和理解的一个东西。所以我想通过活动第一能吸引

4、学生,学生愿意做,比如流行歌的变化趋势,结婚年龄的变化趋势,学生很感兴趣,首先问题就抓住他们,然后通过分组大家合作,一起来收集数据,一起整理数据,一起从数据中提取信息说明问题。我想这个过程对统计学的学习是非常重要的,而且也是能够调动我们学生积极性的一个非常好的一种创意。主持人:我觉得老师们都提得很清楚,这个活动的价值不仅有助于学习数学,学习统计,理解这个内容,而且是一个过程,积累这方面经验的过程。我想结合我这个课给老师们谈一点想法,首先要做好这样的活动课的核心,是要有一个核心问题,问题的产生有两种方式,一种比较容易控制。就像用用课本上现有的例子让学生实践一遍 这个最容易 还有一种是老师提出具体

5、的问题,用这种方式提出两个例子。 第一个问题就是做一个人口,给学生一个实际问题。比如2008年中国18岁的人口,给这个人口数一个估计。王尚志:我想你要是估计2010年更好?主持人:我们要今年就这么出了,今年18岁的人口就这么问,当年留这个问题学生认为好象这个事情没有当做是一个统计学的认识,认为这个是找个公式算算,根据什么算?不知道,那就查书,老师没有给,就去找问题源 最后发现上网说 老师我要真的直接查出来,我说那也算得到结果。大家一查没有结果,没有这个结果是两种 一种是中国经济年鉴上面对这个数据是收费、保密;有一个测算的结果,常规的结果只有哪年做的统计、人口普查有这个数据。学生认为没有就说 老

6、师好像你给得条件不够,你总得给我们点什么?但是经过查了以后,他说没有 是一个检查的结果,但是他有一些别的查出来了。比如说15亿 说人口预计估计是15亿,有了这个结果 同学就觉得那好办了,有很多同学提出一些想法,有些同学还有查平均寿命,中国人73岁。把15亿除以73就认为是18岁人口,当然老师看了这个数据的时候,不是表态,大家参与这个过程,要说对还是不对,有人说这个不对?为什么不对 其实问一个技术的问题,如果18岁人口是15除以73再乘以15亿,就会出这样一个问题 就是一个分布积累。我问1岁的人或者74岁的人,学生马上就找我说,老师这个不应该是这样,应该是前面多一点后面少一点,但是不知道多多少。

7、 到这儿讨论就进了一步,知道这个分布肯定是这么下降,那怎么办呢 再放开,就是这个过程要让同学体会 结果再说 大家再想办法的时候,这个办法是隔了三天再讨论的时候又有新的办法,最有意思的是一个同学说,我妈妈告诉我 我们这个楼有188个人,其中有3个人是18岁,然后就是188分之3,乘以15亿,这个结果又进了一步。但是大家又开始争论,凭什么拿你这个楼的数据,有的同学很恶劣或者很有意思问,你们家住哪儿?是不是一个老年公寓,18岁的人少,或者是一个青年公寓 代表性不好,大家又进一步讨论到代表性,什么叫好的代表性数据,要抽出代表性好的数据。 大家再想办法,于是就有各种各样的办法,其中有的家长是劳改局的局长

8、,把监狱里18岁的犯人人数抽出来,这也有问题,男性、女性犯罪率也不一样,级别每一年也是不一样的。王尚志:犯罪也不是平均分配,不均匀。主持人:但是最后有的同学说,他抽他们家乡福建省 他有有一个数据,这个代表性就比较好一点。但是不管怎么说,这个讨论结果,大家对于抽样的质量、抽样的代表性有了更深刻的认识。这种过程一直做下去的时候,我们把这个过程拖得比较长,但是最后大家得到一个感觉,把这个问题解决过程中,对于样本、估计总体、对于数据的代表性,对于一个好的抽样,对于分层抽样、还有随机抽样,这些概念都慢慢进行复习,我觉得这个过程可能对学生学习统计是很需要的过程。王尚志:思明这个做法,我知道。他刚才讲得这个

9、过程,老师一定会提出一些置疑,一会儿收集这个,一会儿收集那个,这个课怎么安排?我记得思明是这么操作这件事的,在每一课的前五分钟左右的时间讨论这个统计问题,讨论出一点结论就打住 进入这个课的学习,既调动了学生的学习热情,又进行了统计课的进展,我觉得一举两得,把课上和课下结合起来,把几节课结合起来,因为都是学生参与的,所以学生做这些问题一般比较兴奋,所以我觉得这是挺好的一个创意。主持人:因为这个问题,统计学开始不是特别明显,后面做了一个问题,是学生反给我的一个问题,我们觉得全班都可以一直做。全班同学都有学英语的电子词典,电子词典大家就比谁得好?一开始比价钱,800元、1000元、500元,还有比名

10、牌,突然学生提出一个质量标准。其实一个好的词典有两种,一种是含得词库大,解释丰富,有原文的解释,我们就统一说你能不能告诉我们你拿的电子词典里面有多少单词?这个问题大家就说没有什么可做的,看看说明书就行,我们有一款说明书上面标记出来 说它有40万英文单词,这是我们首先说的,做40万的单词是可能达到一个超级大的字库,是不是真使这样?我们提出这样的问题,大家觉得这是一个统计学的问题,我们就拨下去,大家帮我们验证手里有的电子词典,真实的词库有多大? 这个问题宏观的学生能平行能提出好几个问题,我的单词量是什么样?国家规定高中毕业生应该达到5000-6000,我到没到?一个英语专业的毕业生在二年级时应该到

11、8000,他怎么来测算自己?都是这样的问题,结果我们就小组讨论,大家针对同一个问题用课题研究的方法,大家先来一起做,说怎么解决个问题?那就要抽样,先要把单词的分布说清楚。A打头、B打头,26个字母各自打头单词分布是多少?同学们就提了很多办法,比如查字典,看字典的页数比,A有多厚,这是一个挺好的办法,再返回来在字典上挑最短,比如V打头的单词最少,按出来,VO更少,就把这个东西弄出来根据它的分布,测算出整个词典的库容是多少? 最后这个库容做出来之后,发现基本上有一半的字典都是虚库容,一般学生用的字典也就是6-10万左右。在这个过程中,对大家的影响就是统计学很有用,统计学的方法在这个过程大家都做了一

12、次实践,甚至大家提到了平行横向,比如减少测量误差,减少统计学误差,挑字典就不能挑化工字典,医学医药字典,要挑通用字典,很多很多这样的思想就对统计学的工作的过程有一个更深的理解。 王尚志:找问题 我觉得是我们老师面临的一个挑战性问题。刚才思明说,一个班可以选择共同的问题大家一起来做,也有的老师允许学生去找问题。 我也给大家补充一个故事,北京市8中前几年的一个故事,一个小女孩,她们家住一个宿舍,门口有一个老太太,这个老太太生活也很可怜,儿子不孝顺,没人养活她,所以老太太不得不在宿舍门口摆一个摊儿,就卖杂物,特别是卖雪糕、冰淇淋、牛奶这些东西。这个小孩非常有同情心,她很希望帮助这个老太太,但是这个老

13、太太又希望自食其力,这个小姑娘想我怎么帮助她?于是她就发现老太太面临着一个主要的问题,就是每一天进货的数量是多少?我想我们都可以明白,如果进货的数量过大而卖不出去就有可能坏掉。如果你进货量不够,而买的人又多,你又赚不了这个钱,于是这个小孩就想用自己学得统计学办法来解决这个问题,她用两个星期的时间每天请很多人帮忙来记录购买各种不同饮料的情况或者冰淇淋的情况,这就是所谓的抽样,然后进行统计,最后计算出一个结果,提出一个方案告诉老太太,比如说牛奶要进多少?什么牌子的进多少?雪糕什么牌子进多少? 老太太很不相信这个小孩,就不愿意用她这个方案?这个小孩就说服了她妈妈,说我做得这个是很有道理的,一定能让老

14、太太能够增加收入 最后小孩的妈妈找到这个老太太,说您就用她这个方案,如果亏了我来补这个钱,后来老太太被母女俩的行为很感动,就开始使用小孩提出这样的一个统计方案。结果老太太比原来多赚了一些钱,老太太非常高兴,这个同学也非常高兴。就在我们这个活动中报告了她的结果,我想这些都是很有个性的问题。 我觉得不是没有问题,我们身边有大量的统计学的问题,可供学生选择,它们是非常有吸引力的问题,又是学生力所能及能够解决的问题。所以我们希望我们的老师可以让我们的学生从他们的身边发现一些统计问题,或者通过小组合作的方式完成这些统计问题,他们在这个过程中能更好地学习统计学。张饴慈:这里我还想谈一谈,统计教学对我们高中

15、的老师来说也是一个挑战,现在我去听了一些课,发现老师对这些问题缺乏意识,或者老是那几个问题,课本上的问题,书本上的问题很难举出自己的问题例子。 所以我觉得刚才王老师还有张思明老师说了,实际上有很多问题,我想对老师来说,首先在自己上要有心观察这些问题,要有问题意识,这是一非常重要的事。其次的活,现在在一些地方,比如北京积累了一批的案例,拿这些案例做参考,我觉得也是一个不错的方法,另外最好能把这些题目让学生看一看,学生有很大的积极性,学生能够提出非常多的案例。甚至有一些案例老师都不敢做,都觉得这能不能做,我不懂?甚至会有这样的情况,我认为这是非常好的现象,利用别人的资源充分发挥学生,自己做一个有心

16、人,我想这样就能把问题越来越能找到,就能找到一些适合中学生做的案例。王尚志:因为我们在北京搞了一个数学应用知识的一个活动,这个活动应该提供了大量可以做的统计案例。在我们报告附件里面,大家可以发现我们学生所选择的一系列案例,我们每年都把这些问题公布出来,学生可以选择,学生也可以发现新的问题。我想今年我们就有一个非常好的案例,是北大附中,是不是能够看一下他们所做的情况。主持人:王老师的提醒,我们也趁这个机会把北大附中开展数学建模活动中的统计活动,我们也找了一个例子,找了两位同学,下面也请这两位同学给我们讲一讲,他们用统计活动的方式写论文,报告论文以及整个工作过程。 下面请这两位同学出场,各位老师,

17、我们这节课的主题是统计活动课,在前面我们已经和两位专家讨论过统计活动课开展的意义,很多学校、很多老师都创造了一些开展统计活动课的经验。今天我们换一个方式,我们请来北大附中的两位同学,来介绍他们通过统计活动课来数学建模的方式,完成一个统计学习的作品,通过这样的活动来提升自己学数学、用数学的意识。 左边这位同学是北大附中高二(1)班的陈翀尧同学,那位是同班的张质祎同学,欢迎两位来现场。 我也想问问你们什么时间开始做数学建模,做统计小论文的。陈翀尧:我们大概高一上半学期开始的,大概高一下半学期的时候结束的。主持人:整个做统计活动,把这个论文做出来到结题做报告一共花了多长时间?张质祎:大概花掉了我们半

18、年的时间。主持人:你们两位把这个过程和你们的结果向老师们做个报告。张质祎:好的,老师们,大家好!我是来自北大附中高二(1)班的张质祎,坐在我旁边的是我的同班同学陈翀尧。今天我们来简单介绍一下我们的函数建模课程,学校为我们展开了函数建模课程,为了配合我们同时开设的统计课程,在课程安排下来之后,很多同学也开始去思考自己的课题。 在我们小组讨论中发现了这样一个现象,就是在我们中文汉字中不同汉字使用频率是不同的,其中有很多字是非常常见的,就像我们经常使用的:“的、一、不、是”这样的一些字,还有一些汉字它是非常罕见的,甚至在一本文学作品中几乎就不曾出现。为什么会有这样的情况呢?在我们讨论之后,发现不同使

19、用频率的汉字都有一些不同的特点。比如说像使用频率多的汉字,它们更容易书写,或者它们的读音更加简单,使用频率低的汉字,它们可能相对会比较复杂,而且它们读音会比较拗口生涩。 我们组员进行讨论之后希望探究这样一个问题,究竟是哪些因素影响了一个汉字的使用频率?究竟是哪些因素决定了一个汉字的使用频率?所以我们的探究主题就是探究单字在现代汉语书籍中的使用频率与字义个数、常用词组个数、读音难度以及书写难度的函数关系。经过我们小组的讨论,我们发现影响汉字的使用频率有主要这样几个因素,第一个是它的字义的个数,也就是一个汉字在字典里有多少个意思?第二个是它常用词组的个数,就是说一个汉字在字典当中有多少个常用的词组

20、。第三个是它的读音难度,读音难度包含多个方面,在之后的建模中我们会详细地讲到。还有一个是书写难度,影响书写难度主要因素是它的笔画。首先来看一下我们的函数设定,因为我们可以知道,一个字的字义或者词组的个数越多,那么它的使用频率相对会可能更高一些,字义的个数和词组的个数与这个结果是正相关的关系,而一个字越难读越难写,那么它可能的使用频率会更低,所以说这是负相关的关系,因而我们这样建立一个函数。 对于函数中的变量,下面我想给予一个解释,首先我们定义了单字的使用频率,这个频率是我们最终建模的一个理论计算值。第二是单字的字义个数还有常用的词组个数,分别用字母P和R来表示,假设它分别与最终概率成正比;另外

21、两个变量,一个是单字的读音难度,另外一个是单字的书写难度,分别用S和Q来表示,这两个难度我们希望用一个固定的算法来求出一个量化的值,最后代入到式子中进行一个计算开始探究,首先我们要选取样本分析数据,也就是我们题目的来源,在选取样本的时候,我们决定采用统计的方法,正好我们也在开设统计的课程,所以我们希望能够用到统计的知识。首先用计算机将五本电子版书籍中的所有汉字出现频率做出了一个统计,将频率大于千分之三的汉字归为常用字,频率小于千份之一的字归为罕用字,而介于之间的字归为较长用字。我们统计了这三种类型的汉字所占的一个比重,按比重我们决定进行分层抽样的方法,因为我们知道,常用的汉字可能在书中出现的更

22、多,那么它对数据结果的影响会更大,而罕用的汉字,它出现的频率更低,相对的对数据结果的影响会相对较小。所以说我们按照这三类汉字在书中出现的频率进行一个分层抽样,我们选取的样本容量是100个字。 下面是我们的工作流程图,首先是用在电子版书籍中统计频率,因为我们希望能够借助于计算机辅助的方式,所以采取了电子版的书籍,然后根据频率的大小将汉字排序分成三个频段,同时我们会将这些数据用表格的形式进行一个整理,将它加以保留,以备后面的继续分析数据来使用。 最后我们从各频段中按照权重来取样,组成样本容量为100的样本字库。在选取样本的时候,因为我们考虑到中国作家不同人写作风格会有差异,这样会对样本的代表性起到

23、了非常大的影响。所以我们采取了一个折中的办法,我们考虑选取外国作品的中文译本作为样本文本。因为考虑到这样一般外国作品中文译本语言会更加普通化,更具有代表性,这样选取来的数据对最终结果的影响会更小。 样本参数的统计,一个汉字在我们建模当中包含了四个变量,第一个是字义的个数,第二个词组的个数;第三个是单字的读音难度还有一个是单字的书写难度。我们在统计这些样本字的参数的时时候,同样采取了计算机辅助的办法,因为我们的数据量非常大,虽然只有100个汉字,但是人工统计起来会非常困难,所以我们采取了计算机程序的辅助方法,在资料的收集过程中,我们主要是依赖网上的搜索和权威文献的查阅,我们认为这样既方便、而且准

24、确性、可靠性会更高一些。而在资料整理的时候,我们是将收集到的资料按字逐一整理,这也同时运用到计算机辅助统计的办法。陈翀尧:下面我来具体介绍一下,我们探究函数确立的步骤。首先我们先进行了变量赋值,我们通过查阅字典还有计算机统计的方法,将每个样本中字的词组个数和字义数量分别赋值给P和W,并在字典中记录下这些汉字的读音。我们先进行了第一次建模,是汉字书写难度的建模,首先对样本中各字的笔画数量以及连笔字所需笔画数量进行统计,建立了书写难度Q与这两个T和K的关系,然后解出每一个样本当中每一个汉字Q的值。具体函数在后面会有。 我们第二次进行的汉字读音难度的建模,根据不同读音组合的阅读难易程度制定读音难度的

25、评分标准,建立读音难度S与语音元素的函数关系,解出样本中每一个汉字的S值。这个S值具体影响的是它的声母、韵母以及它的读音。因为在中国很多地区,有些声母、韵母,还有一些读音的发声难度会有一些差异。最后经历了两次建模之后,最终有一个函数建模,将各数据P、W、S、Q代入关系式中,拟合出k1和k2两个值。这个k1和k2值的设定一会儿我会再提到。 首先是汉字读音难度的建模,我们查阅数据一共分成这四组数据,声调、声母、韵母以及常见字音个数。因为有些字是多音字,它的声调韵母和声母会有不同的取值,在对上述变量进行权重分析以后制定了难度数值,比如f、h这些声母,不同声母难度数值,不同韵母难度数值以及不同读音的难

26、度数值。张质祎:这样的数据主要是靠我们统计过程得出来的结论。陈翀尧:最终我们确定了一个字的难度值,是它的声调难度系数之和与声母难度之和再加上韵母难度之和除以它的常见字音个数。 接下来,我们对汉字书写难度进行建模,因为考虑到现实生活中有时候人们写汉字有时候不是一笔一划,所以我们统计了这些字的笔画数,如果用连笔字写的话需要的笔画数分别计为K和T。由于在现实生活中,人们多使用连笔字,所以我们加大了连笔字的影响效果,得出了书写难度Q=Tln(K+1)。 最终函数建模,首先由于考虑到字典收录的问题,我们决定降低字义、词意的数目对最终函数的影响效果,而增加书写难度的影响效果。根据读音难度、书写难度,关于出

27、现概率的正负的相关情况。刚才张质祎同学已经对它们进行了分析,这里我就不再赘述。运用待定系数和应用平方反比率的函数进行系数拟合,具体先设定k1为1,k2为一个变量,然后进行线性回归,当然前面需要乘一个系数,因为它与最终出现频率成乘一个倍数关系得出k1值,由于在式子的前面可以乘到上面,最后得出K1和k2两个值。这个是我们得到的k1和k2的值。 接下来是部分数据的展示,可以看到被红色标注的汉字是与实际误差较大,误差超过50%的,这个误差出现的原因,下面我来解释一下。 我认为这部分字出现较大误差的原因有以下几点: 第一,我国从上世纪推行了简化字,其中特别简化了特别复杂的常用字,造成了这些常用字较古代简

28、单了许多,造成较大的误差,比如说“尔”,古字的笔画数比现在的字要多很多,还有“让”也是这样的。 第二,选取文章样本,考虑外国名著的译本,字词依照外国人的习惯,而且受译者水平影响较重,所以有些复杂的字或者成语中用的字就没有出现,而且会有一些外国人的名字或者外国地名的翻译,这些都会比较多。 第三,由于外国文章的译本目的在于普及大众,所以对于生僻字和字意独特的字,基本上不会再过多的使用,所以古汉语使用中的字就没有出现。张质祎:不能够完全反映我们中国文献的一个特点。陈翀尧:第四,选取的生字样本难度及常见程度分为三个级别,最常用字出现次数较高,生僻字出现过于较少,造成样本两级分化严重,对于线性拟合的准确

29、度造成了很大的误差。 第五,由于没有生字的字意在汉代汉语中几乎不再沿用,所以探究结果与某些汉字的字义数有所出入。这一点出入并不会很大,因为我们降低了字义数的影响效果。 第六,由于我国地域广阔,各地方言影响不得不加以考虑。比如东北话的“贼、老”这些词。张质祎:而且不同地方的人发音有一些不同的习惯,可能会影响到他们对单字的一些使用。陈翀尧:第七,由于每个人写连笔字的方式不同,这项统计一般性不是很强。在我们组的两个同学做的这项数据的收集,他们的结果相差非常大。 第八,误差较大的字,多为量词、助词。相比之下名词、副词则误差较小。比如说刚才“一”就是一个量词,这个词在书写过于简单而使用并不是那么寻常。张

30、质祎:像“的”既可以做助词,同时还有其他的意思,虽然它的意思不多,但是它在一个句中是必需的,所以在一个句中出现的会相对更高。陈翀尧:最后一点,有些字为中国地名、人名的专用字,在外国名著中,中文译本中是不会出现的,所以造成频率失真。张质祎:我们这样的一个问题,最初来源于对平常问题的发现。就是我们在读书中突然感觉到有些字为什么使用的多?有些字它使用的少?进而我们再探究,在探究结果出来之后,我们发现我们通过这样一个式子对一个新的汉字,对它的使用频率做出预估。这样的话,我们的这个式子将来就会有更多的用处。 首先这个研究结果可以为以后的输入设备,比如像中文键盘,因为我们现在的键盘的英文排布是按照外国人的

31、习惯,那么如何研发一款更适合中国人书写习惯的键盘,我们可能会需要用到这样一个问题,就是要考虑到不同的汉字,它不同的笔画结构出现在键盘中的不同频率,这样对它进行一个重新的排布,这里就可以用到我们这样的函数式,作为一个参考。陈翀尧:这个函数式对于读音难度的建模,也可以为拼音输入键盘做一些帮助。张质祎:因为我们在读音难度建模的时候也考虑到了很多有关读音方面的影响因素,这样对于一个更适合中国人打字的拼音键盘确实有一定的帮助。主持人:我想问你们这个课题之外的一些问题。你们做了这些事情以后,你们怎么去看学习、你们怎么去看学数学,你们花了很多时间做这么一个课题,认为它对你们学习的价值在什么地方张质祎:是这样

32、的,我觉得学校给我们开这么一个课程,给我们开一个函数建模的活动,正好配合我们当时学习的统计课。首先给了一个在课外使用课内数学的一个机会,让我们自己去思考,如何在生活中发现问题,并且用课内的知识来解决。因为在我们的建模过程中,大量的用到了统计学的知识,比如抽样调查,可能还会用到一些最后的频率统计,包括展现数据用的表格、直方图的一些数据分析。这些都是我们在课堂中使用的一些知识、学习到的一些知识。但是我觉得用课堂知识解决课外的东西会让我们更有兴趣。因为我们对这个问题的思考来源于我们生活中自己去思考的一个问题,想去解决这样的问题,必然会用到这样的数学知识。这样会让我们饶有兴趣解决生活当中的问题,而且又

33、使用到了课堂上的数学知识。主持人:我还想问一个问题,你们在一起做,一个人做也是做,两个人做也是做。你们在这个过程中感到搭伴做或者说合作学习,这样的事情对解决问题的价值和作用有什么?你们这个课题一共有几个同学做? 陈翀尧:四个同学,有没有分工?有分工。两个人负责数据收集,我们两个负责函数。张质祎:因为我学习了计算机编程,所以正好做了一些统计方面的工作。正好我们课内也学习到一个数学程编辑语言,我们对它的应用又加深了印象。主持人:四个人是不是各有特长,大家一起有分工合作。在这一起里面你们有没有互相交互?是不是所有知识在做之前你们都已经会了,知道不知道可能用到什么知识,要不要自己去学习一点东西?陈翀尧

34、:有一些统计学知识,我们在课本中没有学到。因为函数建模活动我们非常有兴趣,我们自己还阅读一些相关书籍提升自己的知识层面。张质祎:包括一些数据处理还有最后的函数合成,好多知识是没有学过的,我们在网上进行了一些查阅,也请教了老师,最后把问题这样解决了。主持人:你们觉得像这样的学习方式,对你们学数学有什么作用?什么地方用这种方式学比较好,或者说同学之间这么学,对你们的学习你们觉得他们有什么样的价值?跟以前从初中上来全是老师教,你们感觉到有什么地方不一样?那些地方更好?那些地方会有问题?张质祎:首先唤起了我们对数学的一个兴趣,因为我们对实际问题中发现自己要想思考和解决不了的问题,但是数学给我们提供了这

35、样一个工具。让我们对课堂的数学学习更有兴趣。第二个是我们学习了一些基本的探究知识,因为这样的问题不是说像老师设计好的习题那样,有已知、有求证。而这样的一个问题,它从已知条件,包括问题都是自己我们自己提的。我们要尝试分析这些问题有多少个方面,再找到解答问题的过程。这样对我们的分析能力和自己进行研究的能力确实是一个提升,确实之前我们也没有做过这样的事情。 有这样的一次尝试之后,尤其对科学论文的研究方式,确实有了一定的了解和掌握。主持人:而且我们特别感动的是,你们做这个结果的时候查了很多的文献,你们对自己做的问题里面不太成熟的地方,做得误差分析是非常严谨的。比如我们有什么地方做得不够,什么地方造成误

36、差大,是非常好的科学态度,并不是因为这个降低我们论文的价值。而这种态度对我们特别有感染。我特别想知道你们是不是连文献都要在论文里面标记出来。张质祎:确实是这样,而且我们在用一些纸制的论文时会在文献中标记,电子版的文献需要用到的地方考到自己的文档里,在操作的时候我们还会查阅。主持人:这也是一个知识产权。在学习的过程中,课本上的东西和这个要结合张质祎:而且我们知道了在写学术论文的最后一定要注明参考文献,这也是对别人劳动成果的一个尊重。主持人:我还想问一个问题,你们参加这个活动,就光你们这些人么?年级里、班级里面还有哪些同学做了相关活动?你们能不能简单介绍一下你们知道有多少同学参加?还有哪些做得比较

37、好的课题?张质祎:应该是有很多同学,应该是全班都参与到了这样的活动,而且年级里面也有绝大多数的同学也参与到这样的一个活动当中。主持人:了解不了解别人做了什么结果?张质祎:他们好象和我们是一样的,也是结成小组,有些同学可能讨论一些物理方面的问题。比如汽车运动、人在走路时候如何更省力,都是来源于生活当中的思考。陈翀尧:有的同学对经济学的问题,比如黄金价格的分析。主持人:对,我也听说,黄金期货价格曲线,走势?张质祎:因为有的同学喜欢自然科学,比如像物理、化学他们喜欢用数学知识解决这些方面的问题,还有同学可能喜欢社会科学,像经济,还有一些同学做一些道路上的交通统计,为以后的市政规划提出一些建议。主持人

38、:这是方方面面。张质祎:这都是来源于自己对问题的思考。陈翀尧:有90多组同学。主持人:对 我也听说了,刚才从两位同学的介绍里我们大概了解了开展统计的建模或者统计学习,甚至函数学习在很多方面,我们采取了一种学生自主的学习、研究提出课题,开发研究的过程,自己得到结论同时把它写成论文。在这个过程里,实实在在看到两位同学的介绍里他们的成长和收获。如果大家对这些材料感兴趣,我们会在课程附件里为大家提供这些思考。在此我们也感谢两位同学的参与,谢谢你们。 刚才同学讲完他们学习的过程时,我们会有一种感受。这个过程中,这两个同学开始的时候怎么做的这个工作,一步一步到最后交流,完成了一篇非常好的论文,这个论文在北

39、京市应用数学知识竞赛得论文报告中获得了奖项。我也请张老师帮我们看看,学生做出这样的结果,对他的学习有什么价值?在这个过程中,我们也会发现论文从数学上并不是十分严谨。您怎么来看待这个问题?张饴慈:首先这样一个活动这两个孩子做得非常好,我们可以体会整个过程,从这个问题的提出,怎么收集数据,怎么做一些假设,怎么做一些处理。我觉得我们的孩子做得非常好,而且他们自己也谈到在合作学习方面,自己学了一些感兴趣的课外知识以及自己怎么做科研论文,怎么收集数据,怎么参考别人的文献,尊重人家的成果。我觉得这是全方位的对他们有所提高,这一点他们做得非常好。 所以这里我想说这么几件事情,第一个我想说,对他们来说,一方面

40、对他们本身学生来说论文课题做得还是比较高,对一般的孩子来说还可以找各种各样的课题,不见得能做得这么深。我觉得刚才说的关注热点,所有的数据拿出来都可以得很多东西,比如奥林匹克的奖牌数,奖牌数有人说从金牌来看中国第一,有人说不看金牌数看总的奖牌数。或者有的国家提出来按人均奖牌数来看,像这样一些数据方放这儿,但是可以从不同的角度抓不同的信息。王尚志:怎么处理这个数据?怎么从不同的角度提炼出对我们有用的信息。张饴慈:不像刚才北大附中学生做得那么高深,但是都可以做,包括今年的世博会可能也会有很多的数据,只要用心就可以做的。主持人:今年的气温,水灾多少年来一次,对气候有什么影响。通过数据来表现。张饴慈:还

41、有一个问题,很多老师在担心这些影响不影响学习?影响不影响高考?耽误不耽误时间等等问题?学生哪儿有时间来做?我想他们做了大概半年的时间,但是充分都利用课外的时间做的,我也看到一些课外活动课,在课上效率不太高。比如课上花了10到15分钟量身高,分组,这6个人就在课上做,而这些学生在课下抽个时间就可以做到,这个是效率问题。 在活动课当中我们老师怎么组织安排,把效率提高,我觉得都不会影响学生的念书,对这些东西要有一个很好的安排。有些觉得是不是耽误时间,不愿意做,我想北大附中就有这个问题,开始做一些活动,学生、家长都有担心,最后家长反应非常好,觉得他们一点都不耽误学习,而且能力有所提高。 另外,在这里面

42、这些论文不会像真正科研论文一样尽善尽美,可能里面有不足有缺点,比如说是函数关系还是相关关系等等。像这样一些问题,刚才北大附中这两位同学也不是做得非常非常清楚,但是我觉得这些东西相对来说是比较次要的。我们老师也能够通过这个活动提高自己,有的老师组织活动做父亲跟儿子身高的关系,八个数据做一条回归线,八个人一组,全班比如六个组就做出六条回归线,那么八个数据是不是太少了。我们讲课的时候都可以讲,只有数据很大的时候可以做,但是在实际活动中会出现这样的问题。也是在老师和同学之间对这些问题逐渐提高自己,通过这些活动以后才真正能提高,否则光在理论上说一说可能就没有这个机会。王尚志:我想统计的活动课,需要注意下

43、面这几个问题。我先说,你们二位做一个补充。 第一件事,最重要的一件事,就是确定要做什么问题?所以我建议我们的老师要提高自己对于统计问题的识别能力。这件事在统计教学中是非常重要的,这个问题可以是书上的问题,也可以是我们从别人那儿得到的一些问题,也可以是报纸上得到的一些问题,或者我们可以让全班做同一样问题。另外我们有一些老师的做法,也可以供老师参考。有的老师公布一组问题,让学生在这一组问题里进行选择。 第三类做法也值得鼓励,老师鼓励学生从自己身边发现问题。这件事我觉得问题的来源是多渠道的,是多种多样的。我想这是上好统计活动课的第一个重要的一个环节。 第二个重要的环节,老师还是需要设计一下的,要把这

44、个做的过程提出一些要求,这些要求无非就是我们统计中的一些具体做法。比如说老师可以要求同学收集数据,并且提出收集数据的依据。一个是数据量,凭说什么这个量大概能够说明问题;第二个是数据的来源,是随机抽样还是分层抽样,你要说一点道理。然后第二个重要的,当你得到数据时,怎么把这些数据表示出来?就是我们通常所说的描述数据。我觉得这件事老师也可以提出一些要求,老师可以把我们表示数据一系列的方法提供给孩子,比如柱状图、列表、饼状图、扇型图、茎叶图等等,让学生做选择,然后你要说道理。你为什么要选择这样的方式描述你的数据,为什么选择两种或者三种方式来描述你的数据。这个描述数据的方法对于我们发现数据中的信息有什么

45、好处?提出要求。 第四个阶段,这些数据中蕴含着哪些基本的信息?比如数据的集中程度,有几种表达形式?哪一种集中的表达形式有助于你解决这个问题,分散程度有几种形式。比如方差、标准差等等,最后我们又提出要求,你要用从你的数据中得到的信息来说明你要解决的问题。这样提出的一系列要求,就使我们的活动课能落在实处。另外我们也可以鼓励孩子们小组合作,又要对小组合作提出要求,要明确分工,要承担责任,要互相帮助,要集体讨论等等。我想这是一个重要的环节。张饴慈:刚才北大附中的两位同学得比较好,我做出这个结果来了,我认为在哪些方面我还不足,数据收集的不够或者不够全面等等,可能有哪些问题。这种反思也是非常好的。王尚志:

46、我想这是最重要的,也是最后一个环节,就是要把自己的结果用某种方式把它固定下来。然后老师可以组织同学们进行交流、进行总结、进行反思。老师在学生总结、交流、反思的过程中来提升、来加深我们的孩子对于统计,什么叫总体?什么叫抽样?抽样有哪几种方式?如何来表达数据、描述数据?如何来提取信息?如何利用信息说明问题?老师进行点评,在这个过程中,我想孩子们就一定会更好地把握我们统计的学习。 另外,我们希望在教学上也可以更放开一点,能不能有的课把几节课连成一节课来上。就是这节课我们做什么?下一节课做什么?我们可以有机的结合起来。还可以把课内和课外有机的结合起来。总而言之,我相信只要我们的观念发生变化,我们敢于放手,我相信我们山东的老师一定能创造出非常多的,好的经验来。我们期待着大家,把你们好的经验发送到我们这儿来,我们来替你们展示。主持人:刚才王老师对我们如何做好统计的活动课,做了一个非常全面的总结。我们真的期待着山东的老师们,和所有参加我们研究的老师们,都把您们做统计活动课的经验及时的总结出来,给我们传上来,让我们一起分享大家的成果。我们的课就到这里,谢谢大家的参与。28

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!