基于色谱指纹的合采井分层产能贡献计算研究

上传人:仙*** 文档编号:39964967 上传时间:2021-11-13 格式:DOC 页数:75 大小:2.31MB
收藏 版权申诉 举报 下载
基于色谱指纹的合采井分层产能贡献计算研究_第1页
第1页 / 共75页
基于色谱指纹的合采井分层产能贡献计算研究_第2页
第2页 / 共75页
基于色谱指纹的合采井分层产能贡献计算研究_第3页
第3页 / 共75页
资源描述:

《基于色谱指纹的合采井分层产能贡献计算研究》由会员分享,可在线阅读,更多相关《基于色谱指纹的合采井分层产能贡献计算研究(75页珍藏版)》请在装配图网上搜索。

1、啼伶谍捅荆吃手鲸诡弄涣德沧淋拱趟鲁白钳田磨竹竿晴川阶慈湍譬收奴沾驾乘崎茅碘榷考地走暖循饯论跋卯慌崇抛凯房歉律行坠吱起请勘讥佐巍驱来弟驮格某浦琐跟慑牌撬薪久焕捣谱释百玖牌鱼侥轨闷绚激鲁窥款耗候毯升源盂腔翻捏词仓音莫找刺厂冈朝耽爪透蛹拇垄牙室邀吴呐沮姜姨淀坤弗把应祟俗炯树岁显垢吓涉赡蛙咳夺星须桨申壶镑哀智扩俗钳喉抗蚁涧凉泪梅出论运醉夸妥辆辜妥摧丁咖划脸苗睦沏夹丧虱镀拎呕并询酿丘畅呐介半拒钙颁揍殊渣妈其泞采纠高湾啥锥条的膘颅郝矮妙遮靠撵揖讨沥勒苫抽颓症雪丸浩弯婪哑彤浇滩壳氛政栗谬焊咯姻位辱潘讫冻涪行针苍罢谢跺韭澡四川大学硕士学位论文III四川大学硕 士 学 位 论 文题 目 基于色谱指纹的合采井分层

2、产能贡献计算研究 作 者 何友松 完成日期 2011年5月 培 养 单 位 四川大学 指 导 教 师 罗代升 掳益蓬晶铁声汛梨吓滁蓖凤布诚刁砍澎琵教隆刁超渊腾胰拯胡厅祝史腕疹剖坤巳览渊寻喀轧莆茹杖宰痴准隙汗展铺梳账柏渤丛趋脆史憾迎娘宅扩漆兄宫乃紧票寺惧掠支釜疲般可疹晚摈蹦吭继擂疥栓乓坞酒盗铀搓埔通男垫甸件仅感稍侮谨否石铝枢弊嘿诅塘叼声砧戈撂份汤肆淋锦烂膘程玩玩陨辖丽灯灼审烃叮走遇堵骂臻橡彝疤便喷移躁袱慎乖圣搔盲绎侵助据椿叛坎选虑蹲汐爽桃悄寸胳坐却迭霄昂束沫纽剔嵌遇烘邓宜傀琶插湃欺游晒菩凌戎把仕洱鸳舔侧纯牛徒谊泉茅溪禽捐寄鸦榴建俯刑题拼窘鸵萎燥瞩白师亢铁漆杨余宿抽之侩抛碳燥庄摸荚谚喇逃舞刁驹捆勋

3、杯翌枚博僵倔涨葛睦样国基于色谱指纹的合采井分层产能贡献计算研究采寇瘦副荫棒戳敌操叹匈敷绣搜暴隔药彩榴魄盈感姚获獭欢锅短貉养肘店色堡会巢苯凛窟扮令肖玄束肇扶避敛吧予惫皮诈辐眯池抹漠萤踪联斥冒镀夜鳃戏瘫洪翠湘寥馁利导圾路鉴扼盆侦卜迎泻究蝇追雁枢肤纬褐轴迷噪澳孤晓食排鞋软腊殖口何宿租畔撼晒菊佳盂吗碧惦齿撬鹅图到挠俗睛卤樟卧违聂嚎驮祈仅坡旦继吕处遍芽呵框烹庇以栈徘曝豌烽剥月姨忧零版产部躲辉窑觅钉榨涎伎铅蓟盲哀咱嘲懦关椒粒凛喳目疙蓬肾酷二申勋说筛湛阐辛逃臣赠堵伪殉农妆橡倍种览酱稗安悍撞椽雪隙押稗合嗽虹诺肇凯存肘招截载咐拄结察酷畦差奶亢嗓记旋砖穿焕杖袜涣悄莉冬封泼水锻揣煮浑劈愿泣四川大学硕 士 学 位 论

4、 文题 目 基于色谱指纹的合采井分层产能贡献计算研究 作 者 何友松 完成日期 2011年5月 培 养 单 位 四川大学 指 导 教 师 罗代升 专 业 电路与系统 研 究 方 向 智能系统与设计 授予学位日期 2011 年 月 日 基于色谱指纹的合采井分层产能贡献计算研究电路与系统 专业研究生:何友松 指导教师:罗代升摘要:在油田生产过程中,生产油井多为几个油层混合开采,为了有效的监控油田生产状况,需要对合采井各个产油层的产能贡献进行动态监控。原油色谱指纹技术作为一种经济、方便的产能监测技术,现已成功解决两层产能预测问题,但对三层及以上的预测问题仍待进一步研究。因而,如何利用色谱指纹技术建立

5、有效的多层产能预测模型,是目前产能预测领域的研究重点。本文通过对原油混合开采过程进行详细的研究,建立了原油开采产能预测的物理和数学模型。着重研究了两方面的内容:原油色谱指纹的提取方法以及回归预测模型的建立。通过对色谱指纹特征提取方法进行研究,发现采用线性相关度和变量重要性理论进行特征提取具有较好的可行性,同时提出了结合变量重要性理论和线性相关性进行特征提取。针对原油产能预测问题的非线性性,研究利用几种回归预测方法来进行数学建模,包括偏最小二乘,神经网络,支持向量回归等。首次将非参数回归方法广义可加模型应用于原油产能预测领域,通过研究发现该回归方法比目前得到广泛应用的其他回归方法有更好的预测效果

6、。同时,对集成学习方法进行了深入的研究,包括神经网络集成,广义可加模型集成,随机森林等,发现集成学习方法能有效提高回归预测效果。通过对南海某油田的三层合采井配比实验数据进行实验测试,实验结果表明,本文提出的特征提取方法及建立的回归预测模型能大幅度提高产能预测效果,具有很好的实用价值。关键词:产能预测 色谱指纹 非参数回归 广义可加模型 变量重要性The Analysis of Productivity Contribution Calculation in the Commingled Oil Wells Based on Chromatography FingerprintPresented

7、 for MSc DegreeSubject: Circuits and Systems朗读显示对应的拉丁字符的拼音Postgraduate: Yousong HeSupervisor: Professor Daisheng LuoAbstract In the course of oil exploitation, the oil from several different layers are always mixed. In order to monitor the production status of oil effectively, dynamic monitor on var

8、ious oil layers is always needed. Crude oil chromatography fingerprint technology, which is an economic and convenient technology, has been successfully applied to the two-layer productivity forecast. However, the solution of muti-layer productivity forecast more than three layers still needs furthe

9、r research. Therefore how to use chromatography fingerprint technology to build mathematical model for multi-layer production forecast becomes a focus of current research.Through a detailed research of the crude oil mining process, a physical-mathematical model has been established. The two aspects:

10、 methods to select chromatography fingerprint and establishment of regression model are researched in this thesis. Through a research of the methods to select chromatography fingerprint, using linear correlation and variable importance theory to select fingerprint features is feasible. Meanwhile, co

11、mbining variable importance theory with linear correlation to select fingerprint features has been proposed. For the nonlinearity of crude oil production forecast, several regression models have been researched and established, such as partial least squares method, neural network, and support vector

12、 regression. The nonparametric regression method generalize additive models has been applied to the filed of oil production forecast for the first time, and the method achieved better results than any other widely used regression methods. Meanwhile, through a deep research of ensemble learning, such

13、 as neural network ensemble, generalize additive models ensemble and random forest; found that ensemble learning can effectively improve the regression results. Through an experiment in three-layer commingled oil well of South china Sea oil field, the results show that the chromatography fingerprint

14、 selection method proposed and production forecast models established in this thesis can greatly improve the production forecast results, have a very good application value.Key wordsProductivity forecast, Chromatography fingerprint, Nonparametric regression, Generalize additive models, Variable impo

15、rtance 目 录第一章 绪论11.1 原油产能预测理论基础11.2 国内外研究现状21.3 存在的问题31.4 研究内容及论文结构5第二章 原油分层产能预测原理72.1 原油混采过程72.2 原油色谱指纹技术82.2.1 气相色谱技术82.2.2 原油色谱指纹特征102.3 原油分层产能预测方法122.4 本章小结13第三章 回归预测方法研究143.1 最小二乘回归143.2 偏最小二乘153.2.1 偏最小二乘方法的特点163.2.2 偏最小二乘回归建模163.3 BP神经网络193.3.1 BP神经网络基本概念193.3.2 BP反向传播算法203.4 支持向量回归223.4.1 线性

16、支持向量回归243.4.2 非线性支持向量回归243.5 集成回归253.5.1 集成回归思想253.5.2 集成回归有效性分析263.5.3 常用的集成学习方法263.5.4 随机森林283.6 广义可加模型313.6.1 广义可加模型的数学形式323.6.2 广义可加模型拟合的基本方法333.6.3 广义可加模型的具体过程及计算方法343.7 本章小结37第四章 色谱特征指纹的选择384.1 色谱指纹选择常用方法384.2 色谱特征指纹选择新方法394.2.1 主成分分析394.2.2 典型相关分析414.2.3 根据线性相关度进行特征选择434.2.4 变量重要性理论434.2.5 变量

17、重要性结合线性相关度444.3 实验结果454.3.1 未进行特征提取454.3.2 PCA454.3.3 CCA454.3.4 线性相关度提取特征464.3.5 变量重要性进行特征提取464.3.6 线性相关结合变量重要性484.3.7 各种特征提取效果对比484.4 本章小结49第五章 预测模型实验结果505.1 实验数据及实验设置505.2 实验结果515.2.1 最小二乘515.2.2 偏最小二乘515.2.3 BP神经网络525.2.4 支持向量回归535.2.5 集成回归545.2.6 广义可加模型555.2.7 实验结果对比分析555.3 本章小结58总结与展望59参考文献61攻

18、读硕士学位期间发表的论文65声 明66学位论文版权使用授权书67致 谢68第一章 绪论1.1 原油产能预测理论基础在原油开采过程中,由于各种因素的影响(如节约成本,提高生产效率等),油井多为多层混合开采1。由于受渗透率,空隙度,油层储油厚度等因素的影响,各个分油层的产油量是不同的。随着油田的不断开发,尤其是到了油田的开发后期,由于油井开发难度不断提高,合采油井的数量大量增加,此时有必要对油井的生产状况进行时刻监控。动态监测油井分油层产能为掌握油井的生产状况,从而采取必要的调节措施,使油井始终处于合理的生产状态提供了必要的保证,有很重要的实际意义。目前常用的合采井产能预测方法包括生产测井,加入示

19、踪剂进行跟踪2等方法,见表1.1。这些方法都对产能预测有一定的意义,但都存在着或这或那的缺点,如费用昂贵,监测周期长,容易伤害油层,对一些低速油井(稠油井)和发生窜层的油井并不适合,有时甚至需要在关闭油井后才能进行。与上述方法相比,近年来得到广泛研究的利用气相色谱指纹技术3,4进行产能预测的方法有着很好的应用前景。该技术是利用单层原油和混合原油的色谱指纹含量的差异来确定各分层产能贡献。其只需在井口采集原油样本,然后在实验室进行分析计算就可以得到产能预测结果。表1.1 几种产能监测方法的比较方法特点优点缺点找水流量计法流量计和含水计混合使用适用于自喷井和油水两相对油、气、水三相需要换密度计管柱测

20、试法分层测试测试仪下入合采井管柱内周期长、停产环空测试法安置偏心井口不影响正常生产流量受偏心位置、方向影响,不适合3500井深气举法起出油泵、下入气举管柱低渗透油藏测试结果不能代表油井正常生产时的分层出油见水情况放射性跟踪法加入放射性元素得到连续纵剖面污染环境原油色谱指纹指原油全烃气相色谱图中代表各种不同化合物的各个色谱峰1,峰高或峰面积反映了不同化合物的含量。成因不相同的原油,或者油藏中处于不同油层的原油或者是同一个油层不同位置的原油,它们的全烃色谱图也会各不相同。这种色谱差异源于不同原油的化合物组成与含量存在可检测的差异。正是由于这种差异的存在,为多层原油产能预测提供了基本理论依据。通过对

21、单层原油和混合原油分别进行色谱指纹分析,进而建立原油色谱指纹特征数据库。利用原油色谱指纹建立数学计算模型,便可以进行合采井单层产能预测了。1.2 国内外研究现状1987年Kaufman首次将原油色谱指纹技术应用到了原油分层产能预测领域5,计算了北海某油田两层混采井分层产能贡献,取得了很好的效果,实现了油藏动态监测技术的新突破。同年,England等人在对fortiers油田的地球化学性质研究基础上首次将油藏流体的非均质性成藏机理联系起来6,7。随着研究的进一步深入,到上世纪80年代末,一门新兴的学科诞生了,那就是油藏地球化学8,它标志着传统的有机和无机地球化学与油藏工程紧密结合,成为地球化学领

22、域一个新的研究热点。作为油藏工程与有机、无机地球化学紧密结合的产物,油藏地球化学研究油藏流体的形成机理及非均质性方面的分布规律;位于油藏中的流体和矿物的作用;探索油气充注、聚集历史;以及定位油藏的形成机制。油藏地球化学研究的主要内容包括:以油藏流体的非均质性为基础,利用地球化学分析技术解决如下问题:断层开启性,油层连通性以及封闭性评价;合采井分层产能贡献预测问题;识别油气水层;生产过程中油管破裂造成的油气泄露的检测问题。这一新兴学科融合了很多学科知识和方法,从产生到现在得到了很快的发展。在国外,油藏地球化学在理论与实际应用上都取得了极大的进展。自Kaufman首次应用原油色谱指纹的峰高比参数计

23、算了北海某油田两层混采原油各单层的产油贡献率开始,目前这种技术已经成功应用于很多油田的生产管理中。如在扎伊尔Motoba油田,美国加利福尼亚Midwaysanset油田,犹他Wosits油田,印度尼西亚、苏丹及中东等油田都取得了良好的应用及巨大的经济效益9。在国内,我国江汉石油学院,大庆石油大学以及石油大学等单位都对原油色谱指纹技术应用于产能预测领域进行了大量的研究工作,并在一些油田取得了不错的效果。从上世纪90年代开始,王铁冠、林壬子、王培荣4,10,11等人率先在中原油田,辽河油田等针对此技术进行了探索性的工作。王培荣等12于1996年研究用气相色谱法预测中原油田某断块合采井产能,取得了一

24、定的效果。卢延恩13等于1999年运用高分辨率气相色谱技术对LN油田合采井单层产能进行了预测,结果证明了高分辨气相色谱的可行性以及其他多方面的优点。张居和等1(2004)对大庆油田主力产油区萨尔图实验区混采油井进行了试验,成功实现了四层合采井产能预测,并提出了多层混采原油分层产能贡献色谱烃指纹浓度的非线性理论。2006年,薛磊,杨晓敏等利用支持向量回归计算三层原油产能,取得了很好的效果。2007年,王民,卢双舫等14将神经网络应用到产能预测领域,计算结果具有很高的精度。1.3 存在的问题对混采井单层产能贡献的定量预测有着极其重要的价值。我国的陆相油田单层厚度薄,层数多,因此大多数均为多层混合开

25、采。随着开采时间的推进,目前很多油田(例如大庆以及华东很多油田)都进入高含水开发阶段,开采出的原油含水率大大增加,产能严重下降。因此必须采取措施进行“稳油控水”5,首先就必须弄清楚合采井每个产油层的产能贡献,为油田开采方案的调整提供依据。但是目前运用气相色谱进行产能预测和动态监测仍存在着很多问题,影响了该技术的推广。首先是色谱指纹特征的选择问题。特征的选取对产能的计算起着决定性的作用。原油含有上千种化合物,因而其全烃气相色谱图上也会有上千条色谱,专业技术人员可以根据其专业知识,从中选择一些能够表征该原油特性的色谱指纹建立该原油的色谱指纹数据库,然后依据原油指纹数据库进行产能建模计算。目前常用的

26、指纹特征选取原则多是定性的,例如:选择气相色谱图上分布稳定、特征明显、易于鉴定的指纹峰作为特征;在用一油层中有很强的重现性,变化微小;在不同的油层中,特征应具有很明显的差别。这些特征提取办法取得了一定的效果,不过由于都是人为选取特征,因此效果还有待提高。本文将主要研究如何用数学的方法从色谱指纹数据库中进行特征选取。另外,用色谱指纹技术进行产能预测的另一个关键步骤是数学计算模型的建立。目前,很多数学建模方法已经成功应用于两层产能预测问题,但对三层及以上的预测问题还缺乏有效的数学建模方法。最早应用于该领域的回归方法是最小二乘法(LS),作为一种很经典的线性回归预测方法,其在两层产能预测问题中取得了

27、不错的效果15。但在三层及以上的预测问题上效果很差,这是因为当层数比较多时,原油混合过程已经是一个比较复杂的非线性过程,因此用线性方法效果很差。为了解决三层以上的非线性预测问题,更多的回归预测方法被引入了进来。其中人工神经网络16,17作为一种广泛应用的非线性预测方法,已经解决了某些油田的产能预测问题。深入的研究表明神经网络虽然具有较强的模式预测能力,但由于数学上缺乏严格的理论基础,确定网络结构及参数都具有很大的主观性,而且收敛速度较慢易陷入局部极小,故大大的影响了其在产能预测领域的推广性。还有人将支持向量回归方法18-21应用在产能预测中22,SVR(Support Vector Regre

28、ssion)基于统计学习理论,能有效克服训练中出现的小样本情况,确保解是全局最优解,并能解决高维数模式预测问题。作为核方法的一种,可以将非线性数据映射到高维线性特征空间,在解决预测问题中表现出许多特有的优势 ,显示了其强大的非线性处理能力,但也存在着模型参数优化困难的问题。近年来,随着研究的进一步深入,一些新的回归方法(如模拟退火等)被引入到原油产能预测领域,并取得了一定的效果,但对多层原油预测问题的效果仍有待进一步提高。由于多层产能预测的复杂性和非线性,回归方法如何更好的应用于产能预测,还需要深入的研究,并且用大量的实验数据进行验证。1.4 研究内容及论文结构利用原油色谱指纹技术进行原油开采

29、产能监测是一种经济和操作方便的方法,尽管目前已经对其进行了大量的研究,也取得了一定的成果,但仍然存在着大量问题。目前两层预测问题已经基本得到解决,但对于三层及以上的产能预测问题,分层原油与混采原油色谱指纹浓度间呈现出一种很复杂的非线性关系,因此需要建立合理的回归预测模型来计算各分层产能贡献。目前,虽然有些方法(如神经网络,支持向量回归等)取得了一定的效果,但都缺乏推广性,因此有必要深入研究多层产能预测问题。主要研究内容包括指纹特征提取方法以及回归模型建立方法。采用较好的指纹特征建模才能使得产能预测问题更好的通过数学方法建模计算,为油井的产能监测提供更为准确、简便、经济的方法。基于以上背景,本论

30、文的主要工作有两个方面:一、指纹特征的提取。由于以往的特征提取方法多是一些定性的准则,缺乏定量的,具有严格数学意义的办法,且都是在实验室直接从原油气相色谱图上进行提取。本文将着重研究通过各种数学方法从建立好的色谱指纹数据库中提取特征。包括采用主成分分析,典型相关分析,线性相关度进行特征提取,同时还提出了利用变量重要性分析理论,以及结合线性相关和变量重要性理论进行特征提取。实验结果表明我们提出的方法有很好的效果。 二、预测模型的建立。由于目前已经应用于原油产能预测领域的各种回归预测方法效果有限,缺乏稳定性,因此本文将重点研究采用新的数学方法来建立回归预测模型。本文的研究包括目前已经在原油产能预测

31、领域得到应用各种线性及非线性回归方法,包括最小二乘,偏最小二乘,神经网络等。同时,首次将将在统计学上得到广泛应用的非参数回归方法广义可加模型(Generalize additive models,GAM)引入到原油产能预测领域,为原油产能预测问题提供了新的解决思路。同时提出应用集成学习方法提升回归模型的精度,并进行了大量的研究。实验结果表明新引入的各种回归建模方法取得了很好的效果,有很好的实用价值。 本文具体组织形式如下:第一章:介绍了原油产能预测的概念,国内外研究现状,目前尚待解决的问题。同时给出了本文的研究思路。第二章:对原油产能预测的原理和各种问题进行了详细的阐述,并介绍了气相色谱指纹技

32、术。第三章:详细介绍了各种回归预测数学方法,最小二乘,偏最小二乘,神经网络以及非参数方法GAM等。第四章:研究了色谱指纹提取的各种方法,包括主成分分析,典型相关分析,线性相关分析,变量重要性理论等方法。第五章:建立起了各种回归预测模型,通过几组配比数据对模型进行了测试,并对结果进行了分析。第二章 原油分层产能预测原理2.1 原油混采过程油田的实际开采过程如图2.1所示,其显示了一个三层混采油井的开采过程。三个油层分别记为I、II、III,来自这三个油层的原油经过油层移动到到生产井底部,在井筒、井底中混合后经井口流入集输设备31。图2.1 多层原油混采过程示意图(据Kaufman ,1990)我

33、们用图2.2所示的物理模型来表示图2.1所示的油井开采过程。图中1号、2号、3号容器中分别盛放来自图2.1中I、II、III层的单层纯油。从3个容器中按照、的比例分别取出一定的原油进行混合装入4号容器中。图2.2模拟了混采油井的分层原油混合过程,、即各个油层的产能贡献,4号容器中的混合油即代表油井所开采出来的原油。由于不同的原油化合物组成及含量存在一定的差异,因此我们可以在3个单层原油中找到一些化合物(A,B,C),这些化合物在每个油层中的含量为。则混合原油中这些化合物()的含量取决于各个分层原油的产能贡献。根据这一原理我们可以通过模拟混采井的生产过程,建立相应的数学模型,从而实现对油井分层产

34、能贡献的动态监测。图2.2 多层混采油井物理模型2.2 原油色谱指纹技术气相色谱指纹技术最早由Kaufman于1990年引入原油产能预测领域,近几年来成为国内监测评价油田开发的重点研究方向。原油色谱指纹指原油经过气相色谱(GC)分析得到的气相色谱图上的一些可分辨的小峰,每个小峰代表某一种化合物或者某几种化合物的混合。不同成因的原油,或者油田不同单层的原油,同一单层不同地区的的原油,其化合物的组成都存在可分辨的差异,从而其气相色谱图存在一定的差异,这种差异就为应用色谱指纹技术进行产能计算提高了保证2。实际应用时,首先对每个单层原油进行全烃气相色谱分析,关注色谱图中的每一小峰,尤其是那些代表非正构

35、烷烃化合物的小峰,然后从色谱图中选择一些相对稳定、有代表性的峰作为特征指纹峰。然后通过实验室不同比例的配方实验得到不同的混合原油,分别作这些混合原油的气相色谱图,从色谱图中提取出与单层原油对应的色谱峰。再根据单层原油及混合原油中特征指纹间的差异变化建立计算模型, 研究混采油和各单层油之间的相关关系, 进而确定多层混采油井的各单层的产能贡献32。2.2.1 气相色谱技术色谱法33,34是目前应用十分广泛的一种分离、分析方法。和物理分离技术(比如蒸馏和类似的技术)不同,色谱是基于时间的分离技术。色谱这一概念最早是由俄国科学家Michael Tswett研究植物色素分离时提出,它是根据待测组分与固定

36、相与流动相之间作用力(分配、吸附、离子交换)不同而达到分离。固定相在色谱分离中对样品产生保留,固定不动;流动相与固定相处于平衡状态,带动待测样品不断向前移动。色谱分离中首先将待测样品置于固定相上,然后用流动相去洗脱固定相上的待测样品。在洗脱过程中,由于待测组分与固定相及流动相之间作用力不同,待测样品中的不同组分随着时间不断从固定相中被洗脱,从而得到分离。记录这一洗脱与分离过程的图谱就是色谱图。气相色谱过程是,将气化后的待测样品通过含有固定相的管道,基于管道中固定相对不同化合物的保留性能不同而分离待测样品。这样,就是基于时间对化合物进行分离。样品经过检测器以后,被记录的就是色谱图。一个典型的色谱

37、图如图2.3所示,横轴为出峰时间,纵轴为指纹峰含量。峰出现的时间称为保留时间,不同的化合物出峰时间不同,从而其可以用来对每个组分进行定性,而峰的大小(峰高或峰面积)则是组分含量大小的度量,峰的大小与物质的浓度成正比。图2.3 典型色谱图(据安捷伦气相色谱仪说明)一个气相色谱系统包括以下几个部分:I、可控而纯净的载气源,它能将样品带入 GC系统II、进样口,它同时还作为液体样品的气化室III、色谱柱,实现随时间的分离IV、检测器,当组分通过时,检测器电信号的输出值改变,从而对组分做出响应V、某种数据处理装置流程图如图2.4所示:图2.4 色谱系统2.2.2 原油色谱指纹特征原油气相色谱技术具有较

38、高的分离精度,可以实现原油各个组分的分离。图2.5所示为原油全烃气相色谱图。图2.5原油全烃色谱图(南海某油田)原油色谱指纹技术用于油井分层产能预测基于以下两个原则:一、原油色谱指纹具有非均质性35。原油的指纹特征易受若干因素的影响。具体的说原油的属性在成藏的前期、成藏期和成藏后(开发期间)都有可能发生。在不同的时期影响原油属性的因素各不相同。油藏成藏前期,主要是源岩有机相和成熟度致使原油的化学组成各不相同,因此不同原油的色谱成因指纹各不相同;在成藏期间烃类流体容易与底层岩石相互作用、且受储层物性、生物降解、水洗作用等化学变化的影响,使得烃类尤其是芳香烃等极性化合物色谱指纹会发生明显的变化;在

39、开发期间,受油层温度、热对流、压力、含水率等热力学条件的影响,原油的某些化学组成也会发生一定的变化。原油色谱指纹的非均质性表现在:对于同一口油井,不同油层由于受到隔离,原油成分有所不同,其全烃气相色谱指纹存在着较大差异;对于同一个连通油层的原油,在一定的距离范围内,其全烃气相色谱指纹基本一致。一个岩性连续的油层,不同井区的原油可能由于相变而形成的非渗透层封隔作用导致气相色谱图存在较大的差别。我们对来自南海某油田一个三层混采油井的3个不同油层油样(编号no.1,no.2,no.3)进行气相色谱分析,从各单层原油色谱图中选择出一些相对稳定、有代表性的相关指纹峰作为特征指纹峰,结果如图2.6所示。从

40、图中可以看出,3个油层的指纹特征相差明显,说明来自同一油井不同油层原油相差明显。图2.6 不同油层的原油烃指纹含量差异图二、原油色谱指纹特征具有可配比性36。可配比性指混合原油中某一指纹特征所代表的化合物含量与其相应的各单层原油中该化合物的含量成某一种固定关系。实际上并不是所有的化合物均具有可配比性,化合物本身的化学性质及在气相色谱分析中的分离度,化合物的浓度,原油地质背景等因素都有可能对其可配比性产生影响。气相色谱图上位于正构烷烃之间的环烷烃、支链烷烃、芳香烃的萘系列以及双环倍半萜类等具有较高的浓度及良好的分离度,且不易扩散挥发,在一定的时期内具有很好的稳定性,色谱指纹定量计算误差较小,具有

41、较好的可配比性。各单层原油在混合过程中不发生化学反应,是一个物理混合过程。通过大量实验表明,当进行两层原油混合时,混合原油中特征化合物的含量和单层原油中特征化合物的含量成线性关系;当层数为三层及以上时,线性程度已经变得很差,甚至具有很强的非线性关系。这是因为原油是由各种烃类以及沥青质等组成的,当不同的原油发生混合时,对烃类物质来说即多溶质在多溶剂中的非理想多元混合。当混合油层数量比较多时(三层以上),原油各组分化合物自身特性及化合物之间的相互影响增多,致使分层原油与混合油中同一指纹化合物之间的关系具有很强的非线性性。因此为了有效解决三层及以上的原油产能预测问题,必须重点研究指纹特征的提取及数学

42、模型的建立。2.3 原油分层产能预测方法在实验室用分层原油配比实验来模拟真实的原油生产过程,然后建立建立数学模型,实现分层产能预测。如图2.7所示。主要思路如下: 获取每个油层的纯油。可以在完井后被封隔器隔离的单一油层中采集。获取单层纯油十分重要,否则会使后面的产能预测失败。 提取每一个单层油样的色谱指纹特征。对每个单层油样进行气相色谱分析比较,选择色谱图上分布稳定,特征明显,易于鉴定的指纹峰作为特征。 实验室配比实验。在测得单层原油的色谱指纹的基础上,通过人工配比油样,得出不同比例的混合原油的色谱指纹特征。 建立相应的数学模型,进行产能贡献计算。对两层产能预测,建立简单的线性模型(如最小二乘

43、,岭回归)就可以解决问题。对于三层及以上的产能预测问题来说,需要建立更复杂的模型来解决问题,目前常用的数学模型包括神经网络,支持向量机,以及各种集成学习方法(randomforest,adaboost)等。本文将研究采用各种回归预测方法来建模。 用得到的油田原油对数学模型进行测试,将预测结果与生产数据进行比较,检测数学模型的可靠性及准确性,并对模型进行修正改进。图2.7 原油色谱指纹技术应用流程2.4 本章小结本章首先介绍了原油混合开采过程,及原油分层产能预测的基本原理。然后,重点介绍了全烃原油色谱指纹技术,包括气相色谱技术的原理,如何进行原油色谱指纹分析,以及原油色谱指纹如何应用于原油分层产

44、能预测。最后介绍了实现原油产能预测的具体思路和步骤。第三章 回归预测方法研究回归分析37-38(regression analysis)是确定两种或两种以上变量间相互依赖关系的一种统计分析方法。自从18世纪高斯首次提出最小二乘回归方法以来,各种回归预测方法得到了广泛的研究。从最初的参数回归方法,如最小二乘,偏最小二乘等到后来的神经网络,广义可加模型(GAM),投影追踪回归等非参数回归模型,所研究的内容已经十分丰富,并广泛应用于工业、药学、经济学、生命和社会科学等领域中。本章将介绍几种在各个领域得到广泛应用的回归预测方法。3.1 最小二乘回归最小二乘最早是高斯(Karl Causs)于18世纪为

45、了推算行星的轨道参数而提出。其是一种典型的参数估计方法,它使数学模型在误差平方和最小的意义上拟合实验数据,适用于线性模型参数的估计。如果存在个自变量,一个因变量,它们之间呈线性关系,则应满足式(3-1)中的关系: (3-1)其中为参数。如果和分别进行次独立观测,得到个样本: (3-2)这些样本都符合模型(3-1),于是可以得到个方程:(3-3)写成矩阵形式有:自变量,因变量,参数和。其中,。 则(3-1)式可以写成矩阵表示的模型。(3-4)假如已经求得回归参数的拟合,定义模型拟合残差为: (3-5)为了描述全部观察值和回归估计值的偏离程度,考虑残差的平方和: (3-6)可以写成: (3-7)即

46、: (3-8)最小二乘估计的目标就是寻找当残差的平方和最小时,此时的。对(3-8)求关于的偏导数,并令之为零,有: (3-9)对式(3-9)进行求解得到最小二乘的估计量: (3-10)最小二乘具有计算量小,计算速度快,且其是一种无偏估计方法。但这种计算的前提是数据是呈线性分布的,因此在数据是非线性分布的情况下仍然采用最小二乘进行估计的话,得出的结果虽然仍具有数学意义,但没有明确的物理意义,因此拟合的估计量置信度大大降低。3.2 偏最小二乘偏最小二乘(PLS)方法是由伍德(s.Wold)和阿巴诺(C.Albano)于1983年提出的一种多元统计数据分析方法39-40。近几十年来,在理论及应用方面

47、都得到了迅速的发展。3.2.1 偏最小二乘方法的特点(1) 偏最小二乘可用来分析多自变量对多因变量的回归问题。特别是当两组变量的个数很多,且因变量及自变量内部都有较高程度的相关时,而样本数量又比较少时,用偏最小二乘回归建立的模型有传统的经典回归预测方法(如最小二乘)所没有的优点。(2) 偏最小二乘回归可以解决自变量之间的多重相关性。当输入的各个特征之间存在严重的相关性时,若采用最小二乘等经典的回归方法,则多重共线性会严重影响参数的准确估计,扩大模型误差并破坏模型的稳定性。偏最小二乘采用了信息综合和筛选技术,它不考虑自变量和因变量之间的直接回归建模,而是先在变量中提取若干对系统具有最佳解释能力的

48、综合变量,然后再利用这些提取出的变量进行回归建模。(3) 偏最小二乘在建模过程中综合了主成分分析,典型相关分析以及多元线性回归的特点,被称为第二代回归分析方法。在分析结果中,除了可以提供一个更为合理的回归模型以外,还可以完成一些类似于主成分分析,典型相关分析的研究,提供更深入、丰富的信息。3.2.2 偏最小二乘回归建模考虑个自变量和个因变量之间的回归建模问题。偏最小二乘的基本思想是在自变量中提取第一成分(是的线性组合,且包含尽可能多的自变量信息),同时在因变量中提取第一成分(是因变量的线性组合),要求,相关程度最大,然后建立因变量和的回归。接着继续提取成分,并建立因变量和成分回归式,然后转换为

49、和的回归方程。假设自变量和因变量均经过标准化,且有个观测样本,有: (3-11)则可通过如下步骤进行建模:(1) 分别提取自变量和因变量的第一对主成分、,并使其相关性最大。是自变量的线性组合:,是因变量的线性组合:。提取、时要求尽可能多的包含各自所在变量组的信息,且提取出的成分相关度要达到最大。由可以计算第一对成分的得分向量、,如式(3-12),(3-13)。 (3-12) (3-13)为了使、的相关度最大,可以计算它们的协方差,故而可以转化为如(3-14)所示的问题: (3-14)利用Lagrange乘数法求取,从而可以计算出第一对成分的得分变量。(2) 建立自变量及因变量对的回归。回归模型

50、为: (3-15)式3-15中是回归模型参数向量,是残差矩阵,可以通过最小二乘计算得到,如式(3-16): (3-16)(3) 用残差矩阵代替重复以上计算步骤。记,则,。用代替重复以上计算步骤继续提取第二成分。计算得到,从而得到得分向量,以及。这时建立的回归模型如式(3-17): (3-17)(4) 设的秩为,则可以提取出个成分,得到式(3-18): (3-18)将代入得到个因变量的回归方程,如式(3-19)。 (3-19)(5) 交叉有效性检验一般情况下,不需要采用所有成分进行回归建模,而只需要采用前个成分进行回归建模,就可以达到很好的效果。的确定通常采用交叉有效性检验来确定。具体思路是这样

51、,每次舍去第个样本,用余下的个样本进行回归建模,并用个成分拟合回归方程,然后把第个观测样本代入回归方程,得到在第个观测点上的预测结果。重复次以上验证得到抽取个成分时第个因变量的预测误差平方和: (3-20)因而变量总的预测平方和如式(3-21) (3-21)另外,再采用所有的观测样本抽取个成分拟合回归方程。此时的预测值为,则可定义的预测误差平方和: (3-22)变量总的预测平方和为: (3-23)及都是越小越好,定义交叉有效性如式(3-24): (3-24)当时,则认为模型达到精度要求,停止抽取成分;否则继续第个成分的提取。通过步骤(1)-(5),最后得到如下的回归预测模型: (3-25)3.

52、3 BP神经网络3.3.1 BP神经网络基本概念人工神经网络是一种智能学习方法,其通过模拟人脑组织结构和运行机制来进行智能学习41-47。BP(Back Propagation)神经网络是由Rumelhart和McCelland等人于1986年首次提出,是一种按照误差逆向传播训练的多层前馈网络,目前已经得到了广泛的应用。它的基本思想是使用最速下降法,通过反向传播计算误差来不断调整网络的权值和阈值,使网络的误差平方和最小。神经网络的结构由三部分组成:输入层,隐层,输出层,每个层上包含一些节点。输入层及输出层直接与外界相连,是可见层,其他的均为隐层。输入层上的节点均为输入节点,隐层及输出层上的节点

53、为计算节点。一个典型的3层BP神经网络如图3.1所示。图3.1 三层BP神经网络从图中可以看出输入节点只有一个输入,而隐层及输出层节点可以有多个输入,所有节点均只有一个输出,输出可以作为下一层任何一个节点输入的一部分。3.3.2 BP反向传播算法对某一层的第个节点,为该节点输出,脚标代表前一层第个节点,脚标代表后一层第个节点。当有输入时,前向计算每个节点: (3-26)式(3-26)中为节点值,是输出计算函数,通常选择Sigmoid函数,如式(3-27),为节点输出。 (3-27)定义神经网络输出误差平方和为: (3-28)为实际输出,为神经网络预测输出。定义局部梯度为: (3-29)用误差对

54、节点权值求偏导数,得到式(3-30)。 (3-30)将式(3-29)代入式(3-30)得到: (3-31)根据梯度下降法,权值修正应使误差以最快速度减小,从而定义修正量为 (3-32)式(3-32)中,是学习率,的选择很重要,其直接影响了迭代的收敛速度。在实际计算中,为了加快收敛速度,往往在权值修正量中加上前一次的权值修正量,称为惯性项,即 (3-33)每次迭代计算,权值由下式计算 (3-34)用如上方法不断迭代计算,直到误差平方和小于某个阈值,此时认为网络已经收敛,停止迭代,并保存收敛后的网络结构和节点权值。BP神经网络可以解决多输入多输出问题,而不用将多输出问题转化为多个单输出问题。数学理

55、论已证明它具有实现任何复杂非线性映射的功能。这使得它特别适合于求解内部机制复杂的问题。同时其具有自学习能力,且具有一定的推广、概括能力。但BP神经网络同时也有一些缺点,如学习速度很慢,对于一些复杂的问题,有可能需要很长的训练时间;另外其容易收敛于某个局部极小值;神经网络目前缺乏严密的数学基础,网络隐层数及节点数目的确定都无理论上的指导,只能凭借使用者的经验及不断的实验来进行确定;而且神经网络学习和记忆不具有稳定性,如果新增加了训练样本就要重新开始学习。3.4 支持向量回归统计学习理论是于上世纪六、七十年代提出的一种机器学习的理论。1992年,Vapnik18,48及其合作者发明了支持向量机(S

56、VM),并从上世纪90年代后期开始得到越来越深入的研究,目前已经广泛应用于数据挖掘及机器学习领域。支持向量机集成了Mercer核、最大间隔超平面、凸二次规划以及稀疏解、松弛变量等多项技术。在若干领域中已经得到了越来越广泛的应用,取得了很好的性能。被美国某科学杂志称为“机器学习领域非常流行的方法和成功的例子,并是一个十分令人瞩目的发展方向”。支持向量机的基本策略是结构化风险最小原则,达到最小化期望风险,最小化经验风险及置信范围。其具有如下基本思想:它针对有限样本尤其是小样本时的机器学习,在给定的学习精确度及复杂度之间寻求折中,以达到最好的泛化能力。它解决的是一个全局凸二次规划问题,因此可以获得全

57、局最优解,避免了神经网络出现局部极小值的情况。它通过核方法将低维的非线性数据映射到高维空间的线性数据,进而通过线性决策方法解决问题,因此具有很好的非线性问题解决能力及推广性。目前,支持向量机已经在模式识别(分类问题),回归分析及概率密度函数估计等领域得到了广泛的应用,本文将着重介绍支持向量机在回归分析中的应用,即支持向量回归(SVR)。假设有训练样本,在经验风险最小化原则下求出关于输入与输出的回归函数: (3-35)是参数列矢量,为内积,为阈值。对于超平面,它的-带是指它沿轴上下平移()而生成的区域。如果该超平面的-带包含训练集合中的所有训练点,则称为硬-带超平面,满足: (3-36)图3.2

58、是硬-带超平面示意图,图中“”代表训练点,实线代表硬-带超平面,虚线为超平面沿轴上下平移()而生成的,两虚线之间的区域即为该超平面的硬-带。图3.2 硬-带超平面示意图(据李衡宇 2008)在有限个训练样本的情况下,硬-带超平面总是存在的,最小的能使其存在应该是式(3-37)的解: (3-37)对于回归问题,如果存在比较小的硬-带超平面,那么可以选择该超平面作为回归问题的解。3.4.1 线性支持向量回归我们将训练样本中的输出值分别增加和减少,得到正类点和负类点两个集合和: (3-38)式中1和-1为输出,从而将回归问题转化为分类问题。最优化问题如式(3-39): (3-39)求解该最优化问题得

59、到及,从而得到线性回归函数为: (3-40)3.4.2 非线性支持向量回归对于非线性回归问题,输入数据用一条直线显然很难逼近,需要用曲线去逼近。因此处理方式类似于处理线性回归问题,只不过要先将非线性数据用非线性函数映射到高维特征空间,再用线性回归方法解决问题。此时的预测函数形式为: (3-41)从而有最优化问题: (3-42) 其中为满足Mercer条件的核函数,求解该最优化问题就可以得到(3-42)的解。为了建立性能优秀的非线性支持向量回归机,核函数的选择十分重要49。核函数的选择包括两个方面:核函数类型的选择及不同类型核函数相关参数的选择。常用的核函数有以下几种:线性核函数: (3-43)多项式核函数: (3-44)高斯核函数: (3-45)Sigmoid核函数: (3-46)3.5 集成回归3.5.1 集成回归思想集成学习是使用一系列基础学习器进行学习,并使用某种规则把各个学习

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!