asp网站毕业论文(推荐7篇)
124
2024 / 07 / 23
进入信息时代以来,世界电子商务呈现飞速发展的势头。站在长远的角度,企业能否在新经济的背景下生存,关键在于企业能否利用电子商务的优势,但是电子商务在发展的同时也使得企业暴露了一些问题,其中企业的数据量大,而真正有用的信息却很少。所以现代企业急需解决的问题是如何在大量数据中发现有用数据,获得利于企业的商业运作的数据,从而提高企业的竞争力。要解决这些问题,传统的数据分析已经不能适应企业的发展需求,传统的数据分析工具对数据的内在信息无法提取,而是对指定的数据进行简单的处理。信息管理系统的运用以及信息量的加大,企业希望有人可以创新及提高数据分析功能,只有拥有了高层次的数据分析功能,才能对企业决策工作提供有效的支持。所以,数据挖掘技术呈现在人们的眼前。
一、数据挖掘技术的发展背景
在近几十年中,人们在利用信息技术生产和搜集数据的能力上有了很大提升。商业管理、政府办公以及科学研究等等都应用了大量的数据库。并且仍在继续发展,所以人们为此将面临一个新的挑战,在信息爆炸的今天,我们都需面对地问题是信息过量,那么我们将如何在大量的信息库当中获取有用的知识,提高信息利用率呢?要想让数据成为企业的有效资源,并使它为企业的战略发展及业务决策提供有效保障。否则,大量的数据将会阻碍公司的发展。因此,数据挖掘技术在人们被数据淹没且急需知识的境地中带来了希望,并在发展过程中显示了它顽强的生命力。
人们长期对数据库的技术进行研究和开发而创新出数据挖掘技术,刚开始时商业数据一般存于计算机的数据库里,然后变成了对数据库进行访问并查询,而数据库技术进入更高的台阶是由于数据挖掘技术的广泛应用,数据挖掘技术给企业的运作和发展带来很大便利,它不仅可以对以往的数据进行查阅,从而可以把各个时期的数据进行对比分析,利于商业水平的提高。商业数据库正呈现空前发展的态势,并且在各种行业中数据仓库得到了广泛的应用。数据挖掘的`核心包括数据统计、人工智能以及机器学习等等。且历经了十多年的发展历程,使得数据挖掘技术趋向于稳定。
二、数据挖掘技术在电子商务中的应用
1.数据挖掘技术在客户关系管理中的应用
一种把客户当作核心的经营策略就是客户关系管理,为了满足企业的产品开发、市场营销以及管理的决策,而通过现代技术来满足。为获取商业知识而利用客户的信息,并以此来提高企业在市场当中的竞争力,采用数据挖掘技术,企业可以充分地利用客户数据资源,并对客户进行分类分析,这样不仅有利于企业对客户的盈利能力进行分析,更有利于寻找有潜力的客户,为企业带来发展。另夕卜,为应对商业数据的不断增多,数据挖掘技术将成为企业立足的关键技术,这项技术不仅可以加强企业对客户的管理及其跟踪市场活动,预测客户的消费方向,并依据消费的趋势开发产品。另外,客户评价模型对客户进行评价,并在分析客户行为对企业收益产生的影响,达到企业与客户和企业利润最优化。同时,在客户数据挖掘技术应用的基础上,企业可以依据重点客户和评价市场性能。为扩大企业销售的渠道,制定个性化的营销策略。通过呼叫中心优化及畅通沟通的渠道,强化客户关系管理的智能化并提高服务质量。
2.数据挖掘技术在网站运营中的应用
3.数据挖掘技术在商业信用评估中的应用
目前,不良的商业秩序受低劣信用状况影响,网上诈骗的事件屡见不鲜及企业财务中的造价现象也时有发生,这些现象的发生导致了信用危机的产生,严重制约着电子商务的发展和繁荣。发达的社会信息水平作为发展电子商务的基础,通过偏差分析,控制企业数据的统计和历史记录的差别,为构建完善的安全体系,采用数据挖掘技术对企业的经营情况进行分析,并对企业进行资产的评估以及收益分析等等。另外,为强化网站中的网上交易行为的安全,应对网络进行全程的监控。在此基础上,建立客户的信誉记录,这样不仅可以有效地防止信用危机,更有利于提升企业风险管理的水平和能力。
三、结语
在电子商务点中应用数据挖掘技术,并对这些数据进行挖掘,在挖掘当中找到有价值的数据。所以,将数据挖掘技术应用于电子商务,并建立数据挖掘为核心的客户管理系统,将使得企业在市场变化中立于不败之地。
摘要:本文简述如何将数据挖掘技术应用于图书馆各部门管理中,帮助图书馆管理者依据数据挖掘技术更好地为读者提供科学化和人性化的服务,促进图书馆事业的创新与发展。
关键词:高校图书馆;数据挖掘;创新;发展。
随着网络技术、计算机技术的快速发展,高校图书馆事业也顺应时变,不断向高科技、高水平领域进展,尤其是当今处于数字信息发展的时代。如果利用图书馆现有以及收集的数据资源,通过数据挖掘技术来分析、筛选对图书馆有用的数据信息,依据提炼的数据资源来指导、推进图书馆事业的创新与发展,是当今信息时代图书馆亟待研究、探讨的一个问题。本文将简述如何将数据挖掘技术应用于图书馆各部门管理之中,帮助图书馆管理者依据数据挖掘技术更好地为读者提供科学化和人性化的服务,促进图书馆的事业创新与发展。
一、数据挖掘技术综述。
数据挖掘定义。数据挖掘(Data Mining,DM)是一种新的信息处理技术,其主要特点是对单位、企业数据库中的大量业务数据进行抽取、转换分析和其他模型化处理,以从中提取辅助管理决策的关键性数据。数据挖掘就是从大量的、不完全的、有噪声的、模糊的和随机的数据中,提取隐含在其中的、人们事先不知道的但又是潜在有用的信息和知识的过程。换句话说,数据挖掘技术就是从收集的大量、繁杂的数据中挖掘出其隐含的、未知的、对决策有潜在价值的关系、模式和趋势,并用这些知识和规则建立用于决策支持的模型,提供预测性决策支持的方法、工具和过程。
数据挖掘的意义。在当今的竞争时代社会中,随着计算机的飞速发展,计算机强大的数据处理能力、内存储存容量和网络宽带等价格的持续快速下降,因此大型的数据分析、提取技术不再是一个障碍。面对图书馆每天接收的庞大数据源,管理者必须学会从所拥有的大量数据信息源中提取并利用隐含在这些数据中的有用价值以及有用新信息,从而获取对图书馆事业研究领域的本质认知和未来认知,帮助图书馆管理者从传统的经验管理、主观管理提升为理性管理和科学管理。
数据挖掘的应用分类。目前较常用的一般有分类与回归、关联规则、聚类分析、时序模式等。
二、数据挖掘技术对图书馆事业创新与发展的影响。
面对大量数据,如何去存储和收集数据,如何利用数据挖掘技术将图书馆海量信息数据中提取供管理者决策的有价值的数据,提取并利用隐藏在这些数据中的有用知识的能力变得越来越重要。运用数据挖掘技术从数据中获得有用的知识,这在图书馆管理方面显得尤为重要,本文将简述如何将数据挖掘技术应用于图书馆各部门工作,为今后各部门的创新与发展提供策略分析。
流通部门。流通部门作为图书馆的一线服务岗位,对图书馆功能的发挥起着举足轻重的作用。作为窗口形象岗位,直接体现了图书馆的整体工作状态。
要实现从以往的经验管理、主观管理提升为科学管理和理性管理,数据挖掘技术将利用现代技术展现其独天得厚的优势。图书馆每天都会产生大量的图书流通数据,这些数据包含进、出馆读者人数,借、还书数量,检索查询次数以及网上咨询等大量繁杂的数据。在流通部门最为常用的数据就是借书、还书量,通过借书、还书数据的统计,可获取读者信息行为、借阅书兴趣导向,充分利用数据挖掘技术如关联规则、分类、聚类、时间序列分析等,对图书馆蕴含的大量丰富的用户行为进行建模,从而挖掘出有用的或有兴趣的信息和知识。如可利用这些有价值的信息,借鉴“啤酒与尿布”的经典商业案例,尝试在流通部开辟一块试验田地――搭档书架,即通过借、还书数据挖掘,将读者感兴趣、组合搭档频率高的书籍挑选出来,开辟一块搭档书架,方便读者在借用专业书籍的同时顺便也借阅自己感兴趣的图书,既学习了自己的专业知识,同时也顺便阅读了自己感兴趣的书籍,充分实现了图书馆“第二课堂”的育人价值。
采编部门。传统的采编部门在采集书籍时大多数情况是依据采集经验或是依据各院系、读者反馈的需求书籍进行征订。大部分购买的图书还是比较适合读者所用的,但也会存在一些盲目性,有时会造成采集的偏差,这是采编部门一直比较困惑的问题。如何既将购书经费合理利用好,同时又能满足读者借阅所需,是采编部门长期探索、研究的问题。如果将数据挖掘技术运用到采编部门,通过一线的文献借阅数据,分析、挖掘、提炼读者借、还书的信息量,且一直追踪这些信息数源的变化,即可获得可被部门利用的有价值数据,并汇总出读者借、还书的规律。依据这些一线信息数源的价值,加之网上荐购及读者书面荐购等信息,汇总出哪些是读者专业常用书籍,哪些是读者感兴趣的书籍,哪些又是常年被冷落的书籍,从中提炼出书籍采集的方向;合理化的采集方案继续延用,不合理的采集要进行科学化的数据分析,及时理清思路,尽可能做到书籍采集的合理化、科学化。
技术部门。在信息飞速发展的时代,作为图书馆负责信息网络技术的部门,其肩上的重量显得格外沉重。技术部门不但肩负着网络技术的责任,当今也要肩负起图书馆所有数据的收集、存储、挖掘及分析技术。数据挖掘及分析技术在技术部十分重要,技术部应将图书馆各部门所产生的相关数据进行长期性、系统性的收集和科学分析,并将研究数据的.挖掘及分析作为当前和今后技术部研究及发展的方向,承担起“数据监护员”的角色,通过实践为图书馆提供数据监护操作技能及策略。注意将可获得的数据及时进行收集,并通过收集数据使用案例,分析并总结用户需求及使用规律,为数据监护提供基础资料。
摘要:现今社会计算机技术在人们的日常生活中越来越普及,和大家的生活息息相关。高中课程中计算机信息技术的课程占有重要的位置。不过现在的高中计算机信息技术教学存在一些弊端,如何高效的进行教学就是本文要探讨的问题。
关键词:计算机信息技术;高中;教学;有效性
一、高中信息技术在教学中存在的弊端
(一)学校和学生的忽视。升学制度使得现今高中生的课业繁重,高考的压力导致高中的精力有限,作为技能拓展的课程自然不会受到老师和学生的重视。信息技术这门学科实践要求较强且难懂不宜学习[1]。在教学的过程中,学生必须要跟紧老师所讲的内容,了解掌握计算机的操作步骤,并且利用课余时间反复进行练习,掌握流程。但由于现在高中老师和学生的不重视,上课的时候教学往往是简单的,课下也不会花时间去复习所学操作。学校和学生的忽视是计算机技术教学有效性的重要瓶颈。
(二)上课形式较为单一。计算机信息技术是发展非常的快的行业,迅速的发展也使得信息技术变得越来越多元化。知识点的逐渐丰富,要求老师的教学模式也要不断地多样化。但现在的高中老师仍然采用传统的教学方法,和老旧的教学思路,只是重点讲解计算机的基础知识,没有过多的实际操作,使得学生们很难提起兴趣。这会让学生们产生厌烦的情绪,对计算机学习逐渐失去热情,形成恶性循环。所以要提高计算机信息技术的教学效果,就需要老师从学生的角度出发,改变传统单一乏味的教学方式,根据计算机的特点结合实际进行教学,比如中经常能够用的微博、远程教学等等,学以致用会激发学生们的兴趣。
二、提高高中计算机信息技术有效性的策略
(一)提出问题情境,激发学生兴趣。对于有升学压力的高中生而言,让他们去花时间学习一门与考试无关的课程,最好的办法就是引起他们的兴趣。作为拓展课,计算机技术课程的排课量并不大,并没有多余的.时间给学生进行实际操作,这会降低学生们的学习热情。改善这一问题的方法就是激发学生们的兴趣,在教学的过程中,教师可以提出问题情境,例如:在讲解“获取信息的方法”时,老师可以拿出让学生看蜘蛛网的照片,并向学生提问“Internet”和这张照片的联系。使学生通过蜘蛛网的形状形象立体的想象出Internet网形状,从而进一步的给学生剖析知识点,让学生知道Internet网络像蜘蛛网一样错综复杂的分布着。以实例来讲解抽象的知识,能清晰明确地讲解难以想象的问题,激发学生的兴趣。
(二)增加所学知识的实用性。现在有很多的计算机技术能够帮助学生学习,教师在教学中可以改变传统的教学模式,对于计算机信息技术基础的理论知识进行适当的调整,比如在实际操作上用不上的知识点就可以不讲,而对日常的生活中可以用的到的操作,如QQ、hotoshop软件,Flash动画软件等进行讲解。帮助他们学会一门实用的技术,使学生日常的生活和学习中真正的使用到。
(三)选择合适的教学策略。教材的选取直接影响着教学质量的好坏,影响着学生们上课的积极性。所以在上课之前,教师一定要结合教学准确地分析,选择合适的教学方式,从而达到事先预计的教学目标[2]。例如教“获取网络信息的策略与技巧”的时候,这一课的主要目的就是让学生学会在网上搜索信息,对网上的信息来源有一定的了解。虽然网络已经普及,但是有些学生并不懂的如何下载自己需要的资源,这时老师可以让掌握的好的学生去帮助那些掌握较弱的学生,充分利用教育资源取得比较理想的成果。
(四)合理利用评价体系,高效处理学生问题。数据表明,准确及时地处理学生学习信息的反馈情况,可以对课堂教学的有效性产生积极的影响。老师除了在课上解决的学生学习中遇到的问题外,还可以鼓励学生把自己的问题上传到网上,例如论坛发帖和QQ咨询等等。通过这样的形式学生存在的问题可以及时地反馈到老师那里,老师可以及时了解学生们知识点的掌握情况,及时调整教学内容,有针对性的讲解。而在课堂上不能所有人兼顾的问题也会得到解决,对于表现积极、学习掌握较好的学生,老师需及时进行表扬,增加学生们的热情。
三、总结
通过本文对高中计算机技术教学的高效性的应用对策和发展的进一步分析,使我们了解到目前我国高中计算机技术教学还是存在一些弊端的,而解决这个问题根本是需要全体师生一起加油的。希望通过本文的进一步阐述,能够给高中计算机信息技术的立足和发展方面提供一定的帮助。
参考文献
[1]施国栋.论高中计算机信息技术教学有效性提高[J].中小学电教(下),20xx,11:34.
[2]景志新.试论如何提高高中信息技术教学有效性[J].中国教育技术装备,20xx,34:55-56.
摘要:随着计算机信息网络的快速发展,数据挖掘在软件工程中的地位越来越突出。软件工程数据挖掘是在冗余的数据中发现有用的数据,从而得到更好地利用。社会的发展,科技的进步使得社会进入了网络信息热时代,随之计算机软件也不断增加,人们获取的信息大部分是人手动操作软件获得的,这样的信息量具有一定的局限性。因此,为了满足当今社会的需要,必须借助于软件工程数据挖掘的手段。
关键词:软件工程;数据挖掘;研究现状
利用数据挖掘技术对大量冗余的数据进行筛选从而得到少量精确的信息。冗余的数据是指既包含有用信息有包含无用信息,利用数据挖掘技术剔除掉多余的无用信息留下有用信息,这样既可以提高手机数据的质量又可以提高工作效率。所以,数据挖掘技术在当前的软件工程中起着越来越重要的作用。数据挖掘技术提取、筛选、分析和整理数据比人工操作软件获得的数据更精确更高效。同时,使用这种技术为软件开发者提供了有利的条件,它可以给软件开发者提供一些对其开发软件有用的信息。软件开发者想要更有效率的开发出更高质量的软件,就必须获得更多的更有用的数据,而想要收集和整理出有用数据就需要借助数据挖掘技术来实现,进而提高工作效率。
1 数据挖掘的基本概述
软件工程数据主要是指开发软件过程中所涉及的各类数据,如需求分析、可行性分析、设计等文档,开发商通信、软件注释、代码、版本、测试用例和结果、使用说明、用户反馈等信息数据,一般情况下其是软件开发者获取软件数据的唯一来源;而数据挖掘是指在海量数据中集中发现有用知识或信息的过程。
软件工程数据挖掘的工作原理 主要包括数据预处理阶段、挖掘阶段以及评估阶段三个方面。在挖掘阶段主要是运用分类、统计、关联、聚类、异常检测等一系列算法的过程。在评估阶段数据挖掘的意义主要在于其结果应易被用户理解,其结果评估主要有两个环节分别是模式过滤和模式表示。
数据挖掘在计算机软件工程中的研究相当多,它是分析数据的一种新颖方式。目前,随着社会工作的复杂度,需要更加完善的软件,因此对于软件代码的数量也在急剧增加进而导致了数据量的快速增长。而传统的`数据计算方式已经不能满足目前对于大量数据进行分析的要求,所以,研究者希望能够发掘出一种新的数据分析方式更高效的整理出有用的数据信息。软件开发中会积累大量的数据,比如说文本数据,测试数据,用户信息数据以及用户体验反馈数据等等,软件开发者为了开发出更好的软件就必须分析和整理这些数据。但是,目前软件工程开发的软件越来越大,其数据越累越复杂对于数据的处理已经超出了人工处理的能力的范畴,所以说继续使用传统数据处理的方式来收集,整理和分析数据已经不可能实现。因此,推动了人们对于新的数据处理方式的研究,所以才提出了软件工程数据挖掘技术。
2 软件工程数据挖掘的应用
随着计算机软件工程的发展,可以发现传统的数据挖掘技术具有很多的不足,存在一定的缺陷。传统的数据挖掘技术的定位系统不完善,定位不精确,并没有体现出数据挖掘技术的高性能,它不足以满足当代对于数据处理的要求,因此需要对传统的数据挖掘技术进行改进和完善,这是我们目前的首要任务之一。为了迎合现代化网络信息技术的快速发展,需要发掘出新的数据处理模式,就是在这样的背景条件下,诞生了软件工程数据挖掘技术。相比于存在很多缺陷与不足的传统软件工程而言,软件工程数据挖掘技术更加简单、方便、高效以及精确。软件工程数据挖掘技术并不需要特定的技术平台,体现了其普适性。当前,我国已经开始深入的研究软件工程数据挖掘技术,但是,仍然需要更深的开发其性能以便更好地满足社会的需求。
3 软件工程数据挖掘面临的挑战
软件工程数据相比于普通数据更加复杂,所以对于软件工程数据进行处理具有很大的挑战性。处理软件工程的大量数据具有:软件工程数据复杂性,软件工程的数据处理非传统以及需要严格精确的软件工程数据的分析结果等三方面的困难。
对数据复杂性的分析
软件工程数据包括结构化数据和非结构化数据。软件工程中所产生的缺陷报告以及各种版本信息构成了结构化数据信息;而软件工程处理过程中所产生的代码信息和文本文檔信息构成了非结构化数据信息。由于这两类数据包含的具体内容不同,所以需要分别处理这两种数据,需要使用不同的算法对他们进行处理。虽然说需要不同方式处理这两种数据但是并不表示这两种数据之间没有任何联系,事实上,它们之间存在着重要的对应关系。例如:代码中存在着缺陷报告,版本信息中存在着对应的文档信息,由于它们之间存在着这样的对应关系,所以使得人们不能很好地对其进行整体分析,这就促使了人们开发出一种新的算法,新的数据分析技术能够同时将结构化信息和非结构化信息这两种对应数据一起挖掘出来。
对数据处理非传统的分析
分析和评估软件工程数据挖掘出来的信息,这是数据挖掘过程的最后一步。客户是软件工程数据挖掘数据处理的最后宿体,软件开发者需要对最终挖掘出来的数据进行转变,格式转变是为了满足广大客户对于数据不同的要求。但是,由于需要对数据进行格式转变,相当于增加了一定的工作量,那么软件工程数据挖掘的效率则会被大大降低。对于客户而言,他们需要的信息各种各样并不单一,比如说客户可能会同时需要具体的例子和编程代码等;或者说需要具体例子和缺陷报告等;或者三者皆需要。由此可见,我们仍然需要改进和完善软件工程数据挖掘技术来提高其效率。怎样才能做到让客户得到满意的数据挖掘结果呢?那么就需要高效的数据挖掘技术将各类信息进行归纳总结,改变其格式。这样的技术,不仅仅可以满足客户需求而且还可以使软件开发者从中得到更大的利益。
对数据挖掘结果好坏的评价标准
对于传统的数据挖掘技术而言,它也有一套自己的对于数据结果处理好坏的分析标准,而这个标准对于传统数据挖掘技术数据处理的分析较准确。但是,在当前的软件工程所要处理的数据量很大,传统的评价标准已经不能满足现在的数据分析要求;使用不同的数据结果评价标准来评判不同的数据挖掘结果。然而不同的评价标准之间的联系并不紧密,因此就需要开发者针对不同的数据类型做出不同的评价分析标准以便满足客户需求。想要对数据分析结果是否准确,数据挖掘的信息是否合理等等这些不同的问题进行更加深刻的了解,就要求开发者有独特的见解,对于数据结果是否精确有一定的判断能力。总之,获取准确的信息就是软件工程数据挖掘的目的。所以,最后获得的数据是否满足要求就是评判软件工程数据挖掘结果是否完美的标准。endprint
4 对软件工程数据挖掘应用进行分析
对软件数据挖掘技术进行分析
在软件开发的过程中,数据挖掘技术包括两个方面:(1)程序编写;(2)程序成果。在这个过程中,程序结构和程序功能技术的主要作用就是检索出有效的信息。提升信息的有效性需要联系到客户的实际需要,同时也需要对程序编写过程进行智能化培训。将调用、重载和多重继承等关系家合起来进行有效的记录各种相关信息,重视静态规则的同时利用递归测试的方式来分配工作,从而更有效的掌握关联度之间的可信性。
做好软件维护中的软件工程数据挖掘工作
在软件维护的过程中,软件修复和软件改善工作依赖于数据挖掘技术。数据挖掘技术在软件缺陷以及软件结构等也起到了重要的作用。软件修复即维护者通过依据缺陷分派进行有效的评估并改善缺陷程序进而确定修复级别或者维护者可以选择缺陷修复方式,无论哪种方式最终目的都是进行软件修复来保证数据挖掘的高效性。缺陷分派即将缺陷转化为文本类型,采取有效措施来进行修复。但是,这样的方式它的实际准确率并不高,因而需要利用强化检测来完善缺陷报告技术。
注重高性能数据挖掘技术开发工作
数据挖掘技术体现在软件开发工作中的创新性不可或缺,在实际的工作过程中,目前的软件工程数据挖掘更加重视两个工作:(1)规则分析方式;(2)项目检索工作。总而言之,想要高效快速地寻找病毒,并对其进行全方位分析和评估得到准确的病毒数据需要高性能数据挖掘技术。只有提升数据分析的可行性,提升软件开发安全性能,才能更好地实现软件工程的良好发展。
5 总结
综上所述,數据挖掘技术的应用非常广泛,比如说分析代码、软件故障检测以及软件项目管理等三个方面应用较多。值得关注的是,当前对于数据挖掘技术的研究还不够成熟。因此,研究者需要对软件工程数据挖掘技术进行深入的研究,从而能够促进软件更好地开发和管理。相信在不久的将来,我们一定可以在数据挖掘方面取得非常好的优化效果。
参考文献:
[1] 江义晟.软件工程数据挖掘研究进展[J].电子技术与软件工程,20xx(22).
[2] 胡金萍.探析软件工程数据挖掘研究进展[J].电脑知识与技术,20xx(34).
[3] 马保平.关于对软件工程中的数据挖掘技术的探讨[J].电子技术与软件工程,20xx(19).
[4] 徐琳,王宁.数据挖掘技术在软件工程中的应用分析[J].数字通信世界,20xx(8).
[摘要]计算机的出现和发展极大地推动了社会的发展和进步,人们在工作和生活的方方面面都能见到计算机的“影子”。当前,计算机信息处理技术已成为办公自动化处理的重要组成部分。本文将从计算机处理技术的角度对办公自动化的影响和应用进行分析和阐述。
[关键词]信息处理;办公自动化;技术应用
办公自动化信息处理技术在办公过程中实际就是产生和处理信息的技术,当前社会经济的巨大发展,人们所需要面对和处理的信息和数据量也越来越大,传统的信息手段和技术已不能满足人们的工作和生活需求。随着计算机信息技术的快速发展,基于计算机处理技术和互联网技术的数字化办公信息处理技术逐渐在大众推广,办公自动化日益被人们所接受。办公自动化不仅有效提升了办公的工作效率,同时对工作管理决策提供了更加科学的平台和依据,因此,要重视计算机信息处理技术在办公自动化中的应用。
1计算机处理技术与办公自动化的关系
计算机信息处理技术是指通过计算机获取、传输、监测和处理分析的信息技术,能有效对获取信息进行控制和管理。主要是由传感技术、通信技术、电子技术以及互联网技术构成的。办公自动化的产生和发展正是基于计算机技术和互联网技术的发展而形成的,通过将计算机技术、互联网技术结合通信科学技术让人们在进行办公活动时能使用办公现代化的技术和设施对各项办公活动进行方便快捷智能处理,是办公人员和办公技术设备共同组成的处理系统,在办公处理时必须要处理软件和硬件都齐全完好。办公自动化这项综合办公技术在发达国家兴起于20世纪70年代中期,而在我国的出现则相对较晚,但是经过数十年来的不断创新和发展,办公自动化从最开始只能在办公过程中扮演辅助角色提供辅助作用的办公产品向着能系统操作大型工程项目产品的方向靠拢。而随着办公自动化和智能化的实现,办公管理和操作决策的科学性大大提高。
2计算机信息处理技术在办公自动化中的应用
有效扩大办公管理区域,优化办公处理环境。在传统的办公室处理工作和业务中,往往会受很多客观条件限制。比如说办公的时间、办公的空间、办公的场地条件等,这就导致了在办公室处理中难以发挥出作用,浪费时间和人力物力。随着计算机信息处理技术的使用,有效改善了这种办公客观条件的限制。这样在日常处理事情和办公时就不再局限于在楼房、在房间内,可在任何地方、任何场所实现办公,这样使得办公的区域和环境得到明显优化。而且,办公人员的办公操作也不需要进行单纯的手工操作了,而是可通过计算机和网络技术,实现机器操作和人工操作相结合,形成良好的人工机器办公系统,使得办公模式实现办公自动化管理。这样通过计算机信息处理技术,能使得相关单位、相关企业、相关部门有效实现资源共享,更加完善彼此之间的分工协作,大大提升了办公效率。在未来的日常办公管理中,办公自动化会成为发展的趋势和潮流。能简单及时快速地满足信息资源的检索需要。当前,信息化高度发达,在新信息时代,尽可能地了解最新社会经济动态、随时掌握最准确的数据信息能对生产营销提供判断并作出科学合理的决策,网络结构的四通八达能让各项信息和资源数据的检索更加方便快捷,摆脱了办公时间和空间的局限性。通过在办公部门建立数据信息库,对于办公的文件档案进行规范化和系统化管理,在数据信息库中通过多种形式的存储形式像文字、声音、图像等方式进行存储。办公人员在需要信息和数据的时候就通过数据信息库进行系统检索,由于检索包含了各种存储形式,这样在进行办公信息处理的时候就可选择不同的方式和呈现的效果检索,满足不同的检索需求,在数据信息库中可查询过往的存储文件。同时,还可借助互联网技术了解和掌握第一手的信息和动态,对于办公人员所需要的各种有效信息,都能通过互联网及时得到,有利于提升办公决策的准确性,有效提高办公效效率。
3计算机信息处理技术在办公自动化的未来发展
随着无线通信网络技术的发展,无线通信信息处理技术在办公自动化画的应用也在逐步推广。通过无线网络办公的形式,能让办公更加多元化,办公设备更加便捷化,只要有无线通信数据的传输,办公人员就能实现办公,无论是在机场、酒店、公园、家中都能进行。而且,办公设备也更加先进,像平板电脑、手机等等都成为新一代办公自动化管理设备。在办公信息和数据传输上,未来的计算机信息处理会更加快捷和迅速,而且不仅仅局限于简单的文字、声音,还包括视频、录像、实时传输等等,在文件形式上更加丰富,而且通过云语言等现代存储平台能实现永久性保存。
4结语
由于计算机信息处理技术的发展,对于办公自动化的应用程度和广度都不断提高。因而,要进一步完善计算机信息处理技术,将计算机处理技术与其他信息技术进行有效结合,更好推动办公自动化发展,提升企业和单位工作效率。
主要参考文献
[1]刘伟.计算机信息处理技术在办公自动化中的应用[J].科技传播,20xx(20).
[2]周丽丽.计算机信息处理技术在办公自动化中的应用[J].科技与企业,20xx(15).
[3]常学洲,朱之红.计算机信息处理技术在办公自动化中的应用研究[J].软件,20xx(2).
[4]顾伟.计算机信息处理技术在办公自动化中的应用[J].才智,20xx(6)
一、选题背景
公司治理有效性与公司融资结构密不可分。负债融资,作为一种融资方式可以使企业获得财务杠杆从而创造收益,同时作为一种治理结构,债务融资同样具有重要的治理效应。首先,负债融资可以有效发挥监督约束作用,抑制经理的非效率投资;其次,负债融资也是一种担保机制,可以使公司管理人员更加认真投入地工作,并且令其在决定投资时采取更谨慎的方案;再次,在经理持有公司一定股份时,负债融资可以通过增加经理人员相对持股份额的做法,激励其努力工作,降低聘请经理人员而产生的代理成本;从次,负债对经理形成一种压力,如经理人经营失败,令企业陷入财务危机时,会迫于债权人承受着执行控制权而不得不努力工作;最后,企业价值的信息可以通过负债体现,由于破产机率与企业效绩负相关,与负债水平正相关,即在相同的负债水平下,优质企业破产概率低,反之亦然。
因此,研究公司治理问题时,只考虑股权融资而忽视负债融资是不是可取的。因此本文立足于负债融资和公司治理之间的关系,力求更全面的研究公司治理问题。交通运输行业,是指通过利用交通工具,完成人员或货物的空间位移的生产经营活动过程。作为国民经济的重要基础产业,交通运输行业在国民经济和社会发展中发挥举足轻重的作用,同时直接影响区域产业经济结构的发展。目前,交通运输业中的新建项目以基础产业投资为主,而上市公司募集资金的绝大部分被投入主业,其中多数公司与关联方进行的资产重组收益较好,且近年来该行业上市公司投资效率较高。但行业内的上市公司仍存在一些问题,如一股独大造成的大股东操纵、可行性分析落后和非理性融资等。从资产负债率的角度看,我国交通运输行业上市公司历年来平均资产负债率低于全行业上市企业的平均水平,整体来说相对较低,且基本处于平稳趋势。资产负债率较低体现了我国债券市场发展的不完善以及上市企业的股权融资偏好。
大多数企业资产负债率较低,但仍存在过高和过低的企业。小部分企业过高的资产负债率是因为,传统国有产权制要求国家是交通运输行业上市公司的唯一所有者,在财政上实行统收统支,企业生产经营的资金过多依靠银行借款,因此有部分企业盲目举债造成高负债率。虽然现在交通运输行业上市公司经历了股份制改革,但是无节制借贷的陋习仍有残留。而另一小部分企业资产负债率过低,虽然凭借自身的垄断条件平稳发展,但也限制了企业的长期发展空间。
导致交通运输行业上市公司这一系列问题的原因,很重要的一点就是公司治理结构的不完善,而交通运输行业的融资结构中特别是负债融资,在一定程度上制约着交通运输业上市公司的资本结构,从而影响公司的治理效应。不合理的资产负债率造成负债融资应有的治理效应未能得到很好的发挥。那么,为何会造成这样的发展情态?在我国现有的经济政治体制下,如何强化交通运输行业上市公司的负债融资治理效应呢?因此本文认为,想要提高交通运输行业上市公司的治理效率,就必须从其负债融资的治理效应角度深入探讨,将更加有利于提高上市公司的治理效应,并且具有重要的现实和理论意义。
二、研究目的和意义
我国债券市场的目前的首要问题仍是总量不足。由表5—1可知,近五年来,债券发行总量逐年降低,由于GDP的持续增长,债券比GDP的倍数呈下降趋势。根据中债发布数据显示,20xx年的债券发行总量为55517。3亿元,比上一年度继续减少,在GDP可预测增长的情况下,债券比GDP的倍数仍将降低。债券发行总量不足,致使我国债券市场的发展较为缓慢。从我国债券市场的结构可以看出,我国债券市场目前仍以政府债券为主导。
20xx年我国发行的公司债券在总发行量中只占12。04%。我国交通运输行业上市公司的主要债务融资渠道仍是银行借款,债券发行较少。相对于企业债券,当债权人为银行时,由于企业和银行的长期信用合作关系,以及协商对象较少且不分散,经理人与银行协商成本相对低,加之政府对这一关系的千涉,请求债务延期或减免就更容易实现。由于这种软约束,且出于控制权的考虑,经理人就不会提前终止无效率项目。总之,银行借款的软约束相对于企业债券的硬约束,大大增加了经理人策略性违约的可能性。因此交通运输行业利用这一特性发挥负债融资的公司治理效应,将目标转移至资本市场是必然趋势,但就目前而言,债券市场远不能满足这一目标的需要。虽然政府已经意识债券市场不足的问题,但要真正改善债券市场的融资问题,仍需要时间。
三、本文研究涉及的主要理论
关于债务融资的公司治理效应,国外的研究起步较早,研究成果相对丰富。Modigliani,Miller(1958)起初认为,企业价值与企业资本结构不相关,后在考虑所得税的条件下,对MM模型进行修正,认为负债利息支付计入成本后享受免税优惠,因此高财务杠杆会此机制增加企业价值。因此得出企业负债越多,价值越大的结论,认为企业应该100%负债。Brxter,Cragg使用了1950至1965年期间的129家工业企业的230次证券发行数据,检验了企业对融资工具的选择,得出企业规模越大越倾向于采用负债融资方式的结论。Jensen,Meckling(1976)是融资结构理论的开创者,较早地从公司治理角度来研究资本结构。通过构建代理成本模型分析,他们指出,如果公司总投资额与经理层的投资额不变的情况下,债务融资与经理层拥有的股权比例正相关,这使得经理层与股东目标趋于一致,从而达到降低代理成本,优化公司治理的目的。
同时,Jensen(1986)在其另一篇论文中指出,负债合约可以减少企业的自由现金流量,也可以达到减少公司代理成本的目的。Ross(1977)建立了“激励——信号”模型,其中引入了管理者行为。认为企业中经理人对融资方式的选择,实际上是在向投资者传递信号,投资者认为企业发行股票,则传达出一种质量恶化的信号,反之视债务融资为资产质量优良的信号。因此认为:企业质量越高,负债率越高。Leland,Pyle(1977)认为企业杠杆率与管理者的股权呈正相关关系,高质量项目的管理者可以提高杠杆率,向外部投资者传递这个投资项目优质的信号。同时证明了选择高负债率是一种有效减少经理与外部投资者的信息差异、减少因此产生的资金成本、增加企业价值的方式。也就是说,在信息不对称的前提下,企业家进行投资的意愿在本质上是投资项目质量优劣的信号。
Myers(1977)认为当公司的负债比率增加时,公司的破产概率也随之增加,股东与经理对NPV大于零的项目可存在着投资不足的现象。负债削弱了企业投资优良项目的积极性,减少了企业价值,也就是负债会引起投资不足。Grossman,Hart(1982)在一个代理成本模型基础上,解释了负债融资缓解经理和股东之间冲突的作用机制,认为经理效用同时依赖于其职位和企业存续,因为企业一旦破产,经理必然承担破产成本。因此经理人面临的问题是,较高的个人收益与因此造成企业破产的风险而失去在职好处之间的权衡。企业的融资结构决定了破产对经理的约束是否有效,尤其是负债与股权的比。因此经理会为了避免企业破产,保有现有的职位及其好处,而尽职工作。
因此负债是一种约束经理个人消费,激励其努力工作的担保机制。Bowen,Daly和Huber(1982)发现其研究样本中约百分之二十五的企业因其所处行业而影响了资本结构的变化。认为处于一个行业中的企业,比处于不同行业的企业,在行业特征和资本结构的程式化事实方面更趋于一致,而且每个行业均都保持着一个相对的杠杆比率。Masulis(1983)将负债成本从破产成本进一步扩展,如代理成本、财务困境成本等方面,同时又把税收利益从原先的债务税收利益引申到非债务税收利益方面,扩大了成本及利益的内涵,把企业最优资本结构视为税收利益与各类负债相关成本之间的权衡。得出结论:普通股票价格的变动与企业财务杠杆的变动正相关,企业绩效与其债务水平正相关。
Harris,Raviv(1988)认为,新债发行后,股权换债权以及股票回购消息会随之公布,股票价格也会随之上涨。这被归纳为债务融资信号效应。这两位学者(1991)对美国企业的样本进行分析后,认为:在停业清算对股东有利的条件下,经理仍希望延续当前的企业运营,其冲突可以通过债权人强迫停止清算从而得到缓和。
同时得出行业特性的结论:“医药、仪器、电子和食品行业杠杆比率一直很低,而造纸、纺织品、钢铁、航空和水泥行业的杠杆比率一向较高”。Fama(1990)认为负债融资的方式使得债权人集中监控违约风险,例如借款、债券,能够降低债务——权益契约结构中的契约成本,并提出企业可以通过更多的短期负债融资减少代理成本的观点。Aghion,Bolton(1992)以控制权转移的角度分析了债务融资的公司治理效应,认为当债务契约失败,其控制权就会发生从债务人转移到债权人手里的情况,即为债务的本质特征。
其模型提出了债务融资的这一关键方面,即控制权转移理论。如果企业仅选择普通股来融资,那么投资者就会保有剩余控制权;如果企业发行不带投票权的优先股,经营者则会掌握剩余经营权;如果企业选择负债融资,有偿还能力则经营者拥有控制权,无偿还能力则控制权转移至债权人。同时还提出,由于存在代理问题,合约的不完全性和刚性使得这种潜在利益冲突不能靠事前契约消除,所以控制权随融资结构变化,而导致的“相机治理”是一种明智的做法。Berglof,Thadden(1994)着重研究不同期限债权的不同作用,并且认为短期债权人获得控制权更有效。
四、本文研究的主要内容
第一部分,引言。引言部分总体上介绍了本文的选题背景及意义、研究方法、创新点等。
第二部分,文献综述。以本研究为主线,介绍了国外及国内的研究成果,对负债融资公司治理效应的各类观点进行评述。
第三部分,理论综述。此部分阐释了本文涉及到的相关概念,包括公司治理、负债融资以及负债融资的公司治理效应。同时回顾了负债融资公司治理效应的相关理论,包括代理理论、激励理论、不对称信息理论、控制权理论、利益相关者理论。
第四部分,全面介绍中国交通运输业上市公司的现状。首先从宏观上分析了中国交通运输行业的行业特点及在国民经济中的地位。然后具体对我国交通运输上市公司的负债结构以及治理结构进行分析。
第五部分,实证研究。本章节对20xx年到20xx年的中国交通运输行业上市公司样本进行描述性统计和回归分析,继而对得出的实证研究结果进行分析,最后进行稳健性检验。
第六部分,结论与建议。本章节总结上文研究,得出本研究的结论,并提出优化我国交通运输行业上市公司负债融资公司治理效应的相应建议。
题目:档案信息管理系统中的计算机数据挖掘技术探讨
摘要:伴随着计算机技术的不断进步和发展, 数据挖掘技术成为数据处理工作中的重点技术, 能借助相关算法搜索相关信息, 在节省人力资本的同时, 提高数据检索的实际效率, 基于此, 被广泛应用在数据密集型行业中。笔者简要分析了计算机数据挖掘技术, 并集中阐释了档案信息管理系统计算机数据仓库的建立和技术实现过程, 以供参考。
关键词:档案信息管理系统; 计算机; 数据挖掘技术; 1 数据挖掘技术概述
数据挖掘技术就是指在大量随机数据中提取隐含信息, 并且将其整合后应用在知识处理体系的技术过程。若是从技术层面判定数据挖掘技术, 则需要将其划分在商业数据处理技术中, 整合商业数据提取和转化机制, 并且建构更加系统化的分析模型和处理机制, 从根本上优化商业决策。借助数据挖掘技术能建构完整的数据仓库, 满足集成性、时变性以及非易失性等需求, 整和数据处理和冗余参数, 确保技术框架结构的完整性。
目前, 数据挖掘技术常用的工具, 如SAS企业的Enterprise Miner、IBM企业的Intellient Miner以及SPSS企业的Clementine等应用都十分广泛。企业在实际工作过程中, 往往会利用数据源和数据预处理工具进行数据定型和更新管理, 并且应用聚类分析模块、决策树分析模块以及关联分析算法等, 借助数据挖掘技术对相关数据进行处理。
2 档案信息管理系统计算机数据仓库的建立
客户需求单元
为了充分发挥档案信息管理系统的优势, 要结合客户的实际需求建立完整的处理框架体系。在数据库体系建立中, 要适应迭代式处理特征, 并且从用户需求出发整合数据模型, 保证其建立过程能按照整体规划有序进行, 且能按照目标和分析框架参数完成操作。首先, 要确立基础性的数据仓库对象, 由于是档案信息管理, 因此, 要集中划分档案数据分析的主题, 并且有效录入档案信息, 确保满足档案的数据分析需求。其次, 要对日常工作中的用户数据进行集中的挖掘处理, 从根本上提高数据仓库分析的完整性。
(1) 确定数据仓库的基础性用户, 其中, 主要包括档案工作人员和使用人员, 结合不同人员的工作需求建立相应的数据仓库。
(2) 档案工作要利用数据分析和档案用户特征分析进行分类描述。
(3) 确定档案的基础性分类主题, 一般而言, 要将文书档案归档情况、卷数等基础性信息作为分类依据。
数据库设计单元
在设计过程中, 要针对不同维度建立相应的参数体系和组成结构, 并且有效整合组成事实表的主键项目, 建立框架结构。
第一, 建立事实表。事实表是数据模型的核心单元, 主要是记录相关业务和统计数据的表, 能整合数据仓库中的信息单元, 并且提升多维空间处理效果, 确保数据储存过程切实有效。 (1) 档案管理中文书档案目录卷数事实表:事实表主键, 字段类型Int, 字段为Id;文书归档年份, 字段类型Int, 字段为Gdyear_key;文书归档类型, 字段类型Int, 字段为Ajtm_key;文书归档单位, 字段类型Int, 字段为Gddw_key;文书档案生成年份, 字段类型Int, 字段为Ajscsj_key, 以及文书档案包括的文件数目。 (2) 档案管理中文书档案卷数事实表:事实表主键, 字段类型Int, 字段为Id;文书归档利用日期, 字段类型Int, 字段为Date_key;文书归档利用单位, 字段类型Int, 字段为Dw_key;文书归档利用类别, 字段类型Int, 字段为Dalb_key;文书归档利用年份, 字段类型Int, 字段为Dayear_key等[1]。
第二, 建立维度表, 在实际数据仓库建立和运维工作中, 提高数据管理效果和水平, 确保建立循环和反馈的系统框架体系, 并且处理增长过程和完善过程, 有效实现数据库模型设计以及相关维护操作。首先, 要对模式的基础性维度进行分析并且制作相应的表, 主要包括档案年度维表、利用方式维表等。其次, 要建构数据库星型模型体系。最后, 要集中判定数据库工具, 保证数据库平台在客户管理工作方面具备一定的优势, 集中制订商务智能解决方案, 保证集成环境的稳定性和数据仓库建模的效果, 真正提高数据抽取以及转换工作的实际水平。需要注意的是, 在全面整合和分析处理数据的过程中, 要分离文书档案中的数据, 相关操作如下:
from dag gd temp//删除临时表中的数据
Ch count=dag ( wswj) //将文书目录中数据导出到数据窗口
Dag 1.() //将数据窗口中的数据保存到临时表
相关技术人员要对数据进行有效处理, 以保证相关数据合并操作、连接操作以及条件性拆分操作等都能按照数据预处理管理要求合理化进行, 从根本上维护数据处理效果。
多维数据模型建立单元
在档案多维数据模型建立的过程中, 相关技术人员要判定联机分析处理项目和数据挖掘方案, 整合信息系统中的数据源、数据视图、维度参数以及属性参数等, 保证具体单元能发挥其实际作用, 并且真正发挥档案维表的稳定性、安全性优势。
第一, 档案事实表中的数据稳定, 事实表是加载和处理档案数据的基本模块, 按照档案目录数据表和档案利用情况表分析和判定其类别和归档时间, 从而提高数据独立分析水平。一方面, 能追加有效的数据, 保证数据仓库信息的基本质量, 也能追加时间判定标准, 能在实际操作中减少扫描整个表浪费的时间, 从根本上提高实际效率。另一方面, 能删除数据, 实现数据更新, 检索相关关键词即可。并且也能同时修改数据, 维护档案撤出和档案追加的动态化处理效果。
第二, 档案维表的安全性。在维表管理工作中, 档案参数和数据的安全稳定性十分关键, 由于其不会随着时间的推移出现变化, 因此, 要对其进行合理的处理和协调。维表本身的存储空间较小, 尽管结构发生变化的概率不大, 但仍会对代表的对象产生影响, 这就会使得数据出现动态的变化。对于这种改变, 需要借助新维生成的方式进行处理, 从而保证不同维表能有效连接, 整合正确数据的同时, 也能对事实表外键进行分析[2]。
3 档案信息管理系统计算机数据仓库的实现
描述需求
随着互联网技术和数据库技术不断进步, 要提高档案数字化水平以及完善信息化整合机制, 加快数据库管控体系的更新, 确保设备存储以及网络环境一体化水平能满足需求, 尤其是在档案资源重组和预测项目中, 只有从根本上落实数据挖掘体系, 才能为后续信息档案管理项目升级奠定坚实基础。另外, 在数据表和文书等基础性数据结构模型建立的基础上, 要按照规律制定具有个性化的主动性服务机制。
关联计算
在实际档案分析工作开展过程中, 关联算法描述十分关键, 能对某些行为特征进行统筹整合, 从而制定分析决策。在进行关联规则强度分析时, 要结合支持度和置信度等系统化数据进行综合衡量。例如, 档案数据库中有A和B两个基础项集合, 支持度为P (A∪B) , 则直接表述了A和B在同一时间出现的基础性概率。若是两者出现的概率并不大, 则证明两者之间的关联度较低。若是两者出现的概率较大, 则说明两者的关联度较高。另外, 在分析置信度时, 利用Confidence (A→B) = (A|B) , 也能有效判定两者之间的关系。在出现置信度A的情况下, B的出现概率则是整体参数关系的关键, 若是置信度的数值达到100%, 则直接证明A和B能同一时间出现。
神经网络算法
除了要对档案的实际内容进行数据分析和数据库建构, 也要对其利用情况进行判定, 目前较为常见的利用率分析算法就是神经网络算法, 其借助数据分类系统判定和分析数据对象。值得注意的是, 在分类技术结构中, 要结合训练数据集判定分类模型数据挖掘结构。神经网络算法类似于人脑系统的运行结构, 能建立完整的信息处理单元, 并且能够整合非线_换结构, 确保能凭借历史数据对计算模型和分类体系展开深度分析[3]。
实现多元化应用
在档案管理工作中应用计算机数据挖掘技术, 能对档案分类管理予以分析, 保证信息需求分类总结工作的完整程度。尤其是档案使用者在对档案具体特征进行差异化分析的过程中, 能结合不同的元素对具体问题展开深度调研。一方面, 计算机数据挖掘技术借助决策树算法处理规则化的档案分析机制。在差异化训练体系中, 要对数据集合中的数据进行系统化分析以及处理, 确保构建要求能适应数据挖掘的基本结构[4]。例如, 档案管理人员借助数据挖掘技术能整合档案使用人员长期浏览与关注的信息, 并且能集中收集和汇总间隔时间、信息查询停留时间等, 从而建构完整的数据分析机制, 有效向其推送或者是提供便捷化查询服务, 保证档案管理数字化水平的提高。另一方面, 在档案收集管理工作中应用数据挖掘技术, 主要是对数据信息进行分析, 结合基本结果建立概念模型, 保证模型以及测试样本之间的比较参数符合标准, 从而真正建立更加系统化的分类框架体系。
4 结语
总而言之, 在档案管理工作中应用数据挖掘技术, 能在准确判定用户需求的同时, 维护数据处理效果, 并且减少档案数字化的成本, 为后续工作的进一步优化奠定坚实基础。并且, 数据库的建立, 也能节省经费和设备维护成本, 真正实现数字化全面发展的目标, 促进档案信息管理工作的长效进步。
参考文献
[1]曾雪峰.计算机数据挖掘技术开发及其在档案信息管理中的运用研究[J].科技创新与应用, 20xx (9) :285.
[2]王晓燕.数据挖掘技术在档案信息管理中的应用[J].兰台世界, 20xx (23) :25-26.
[3]韩吉义.基于数据挖掘技术的高校图书馆档案信息管理平台的构筑[J].山西档案, 20xx (6) :61-63.
[4]哈立原.基于数据挖掘技术的高校图书馆档案信息管理平台构建[J].山西档案, 20xx (5) :105-107.
数据挖掘论文四: 题目:机器学习算法在数据挖掘中的应用
摘要:随着科学技术的快速发展, 各种新鲜的事物和理念得到了广泛的应用。其中机器学习算法就是一则典型案例——作为一种新型的算法, 其广泛应用于各行各业之中。本篇论文旨在探讨机器学习算法在数据挖掘中的具体应用, 我们利用庞大的移动终端数据网络, 加强了基于GSM网络的户外终端定位, 从而提出了3个阶段的定位算法, 有效提高了定位的精准度和速度。
关键词:学习算法; GSM网络; 定位; 数据;
移动终端定位技术由来已久, 其主要是利用各种科学技术手段定位移动物体的精准位置以及高度。目前, 移动终端定位技术主要应用于军事定位、紧急救援、网络优化、地图导航等多个现代化的领域, 由于移动终端定位技术可以提供精准的位置服务信息, 所以其在市场上还是有较大的需求的, 这也为移动终端定位技术的优化和发展, 提供了推动力。随着通信网络普及, 移动终端定位技术的发展也得到了一些帮助, 使得其定位的精准度和速度都得到了全面的优化和提升。同时, 传统的定位方法结合先进的算法来进行精准定位, 目前依旧还是有较大的进步空间。在工作中我选取机器学习算法结合数据挖掘技术对传统定位技术加以改进, 取得了不错的效果, 但也遇到了许多问题, 例如:使用机器学习算法来进行精准定位暂时无法满足更大的区域要求, 还有想要利用较低的设备成本, 实现得到更多的精准定位的要求比较困难。所以本文对机器学习算法进行了深入的研究, 希望能够帮助其更快速的定位、更精准的定位, 满足市场的需要。
1 数据挖掘概述
数据挖掘又名数据探勘、信息挖掘。它是数据库知识筛选中非常重要的一步。数据挖掘其实指的就是在大量的数据中通过算法找到有用信息的行为。一般情况下, 数据挖掘都会和计算机科学紧密联系在一起, 通过统计集合、在线剖析、检索筛选、机器学习、参数识别等多种方法来实现最初的目标。统计算法和机器学习算法是数据挖掘算法里面应用得比较广泛的两类。统计算法依赖于概率分析, 然后进行相关性判断, 由此来执行运算。
而机器学习算法主要依靠人工智能科技, 通过大量的样本收集、学习和训练, 可以自动匹配运算所需的相关参数及模式。它综合了数学、物理学、自动化和计算机科学等多种学习理论, 虽然能够应用的领域和目标各不相同, 但是这些算法都可以被独立使用运算, 当然也可以相互帮助, 综合应用, 可以说是一种可以“因时而变”、“因事而变”的算法。在机器学习算法的领域, 人工神经网络是比较重要和常见的一种。因为它的优秀的数据处理和演练、学习的能力较强。
而且对于问题数据还可以进行精准的识别与处理分析, 所以应用的频次更多。人工神经网络依赖于多种多样的建模模型来进行工作, 由此来满足不同的数据需求。综合来看, 人工神经网络的建模, 它的精准度比较高, 综合表述能力优秀, 而且在应用的过程中, 不需要依赖专家的辅助力量, 虽然仍有缺陷, 比如在训练数据的时候耗时较多, 知识的理解能力还没有达到智能化的标准, 但是, 相对于其他方式而言, 人工神经网络的优势依旧是比较突出的。
2 以机器学习算法为基础的GSM网络定位
定位问题的建模
建模的过程主要是以支持向量机定位方式作为基础, 把定位的位置栅格化, 面积较小的栅格位置就是独立的一种类别, 在定位的位置内, 我们收集数目庞大的终端测量数据, 然后利用计算机对测量报告进行分析处理, 测量栅格的距离度量和精准度, 然后对移动终端栅格进行预估判断, 最终利用机器学习进行分析求解。
采集数据和预处理
本次研究, 我们采用的模型对象是我国某一个周边长达10千米的二线城市。在该城市区域内, 我们测量了四个不同时间段内的数据, 为了保证机器学习算法定位的精准性和有效性, 我们把其中的三批数据作为训练数据, 最后一组数据作为定位数据, 然后把定位数据周边十米内的前三组训练数据的相关信息进行清除。一旦确定某一待定位数据, 就要在不同的时间内进行测量, 按照测量出的`数据信息的经纬度和平均值, 再进行换算, 最终, 得到真实的数据量, 提升定位的速度以及有效程度。
以基站的经纬度为基础的初步定位
用机器学习算法来进行移动终端定位, 其复杂性也是比较大的, 一旦区域面积增加, 那么模型和分类也相应增加, 而且更加复杂, 所以, 利用机器学习算法来进行移动终端定位的过程, 会随着定位区域面积的增大, 而耗费更多的时间。利用基站的经纬度作为基础来进行早期的定位, 则需要以下几个步骤:要将边长为十千米的正方形分割成一千米的小栅格, 如果想要定位数据集内的相关信息, 就要选择对边长是一千米的小栅格进行计算, 而如果是想要获得边长一千米的大栅格, 就要对边长是一千米的栅格精心计算。
以向量机为基础的二次定位
在完成初步定位工作后, 要确定一个边长为两千米的正方形, 由于第一级支持向量机定位的区域是四百米, 定位输出的是以一百米栅格作为中心点的经纬度数据信息, 相对于一级向量机的定位而言, 二级向量机在定位计算的时候难度是较低的, 更加简便。后期的预算主要依赖决策函数计算和样本向量机计算。随着栅格的变小, 定位的精准度将越来越高, 而由于增加分类的问题数量是上升的, 所以, 定位的复杂度也是相对增加的。
以K-近邻法为基础的三次定位
第一步要做的就是选定需要定位的区域面积, 在二次输出之后, 确定其经纬度, 然后依赖经纬度来确定边长面积, 这些都是进行区域定位的基础性工作, 紧接着就是定位模型的训练。以K-近邻法为基础的三次定位需要的是综合训练信息数据, 对于这些信息数据, 要以大小为选择依据进行筛选和合并, 这样就能够减少计算的重复性。当然了, 选择的区域面积越大, 其定位的速度和精准性也就越低。
3 结语
近年来, 随着我国科学技术的不断发展和进步, 数据挖掘技术愈加重要。根据上面的研究, 我们证明了, 在数据挖掘的过程中, 应用机器学习算法具有举足轻重的作用。作为一门多领域互相交叉的知识学科, 它能够帮助我们提升定位的精准度以及定位速度, 可以被广泛的应用于各行各业。所以, 对于机器学习算法, 相关人员要加以重视, 不断的进行改良以及改善, 切实的发挥其有利的方面, 将其广泛应用于智能定位的各个领域, 帮助我们解决关于户外移动终端的定位的问题。
参考文献
[1]陈小燕, CHENXiaoyan.机器学习算法在数据挖掘中的应用[J].现代电子技术, 20xx, ; (20) :11-14.
[2]李运.机器学习算法在数据挖掘中的应用[D].北京邮电大学, 20xx.
[3]莫雪峰.机器学习算法在数据挖掘中的应用[J].科教文汇, 20xx (07) :175-178.
数据挖掘论文五: 题目:软件工程数据挖掘研究进展
摘要:数据挖掘是指在大数据中开发出有价值信息数据的过程。计算机技术的不断进步, 通过人工的方式进行软件的开发与维护难度较大。而数据挖掘能够有效的提升软件开发的效率, 并能够在大量的数据中获得有效的数据。文章主要探究软件工程中数据挖掘技术的任务和存在的问题, 并重点论述软件开发过程中出现的问题和相关的解决措施。
关键词:软件工程; 数据挖掘; 解决措施;
在软件开发过程中, 为了能够获得更加准确的数据资源, 软件的研发人员就需要搜集和整理数据。但是在大数据时代, 人工获取数据信息的难度极大。当前, 软件工程中运用最多的就是数据挖掘技术。软件挖掘技术是传统数据挖掘技术在软件工程方向的其中一部分。但是它具有自身的特征, 体现在以下三个方面:
(1) 在软件工程中, 对有效数据的挖掘和处理;
(2) 挖掘数据算法的选择问题;
(3) 软件的开发者该如何选择数据。
1 在软件工程中数据挖掘的主要任务
在数据挖掘技术中, 软件工程数据挖掘是其中之一, 其挖掘的过程与传统数据的挖掘无异。通常包括三个阶段:第一阶段, 数据的预处理;第二阶段, 数据的挖掘;第三阶段, 对结果的评估。第一阶段的主要任务有对数据的分类、对异常数据的检测以及整理和提取复杂信息等。虽然软件工程的数据挖掘和传统的数据挖掘存在相似性, 但是也存在一定的差异, 其主要体现在以下三个方面:
软件工程的数据更加复杂
软件工程数据主要包括两种, 一种是软件报告, 另外一种是软件的版本信息。当然还包括一些软件代码和注释在内的非结构化数据信息。这两种软件工程数据的算法是不同的, 但是两者之间又有一定的联系, 这也是软件工程数据挖掘复杂性的重要原因。
数据分析结果的表现更加特殊
传统的数据挖掘结果可以通过很多种结果展示出来, 最常见的有报表和文字的方式。但是对于软件工程的数据挖掘来讲, 它最主要的职能是给软件的研发人员提供更加精准的案例, 软件漏洞的实际定位以及设计构造方面的信息, 同时也包括数据挖掘的统计结果。所以这就要求软件工程的数据挖掘需要更加先进的结果提交方式和途径。
对数据挖掘结果难以达成一致的评价
我国传统的数据挖掘已经初步形成统一的评价标准, 而且评价体系相对成熟。但是软件工程的数据挖掘过程中, 研发人员需要更多复杂而又具体的数据信息, 所以数据的表示方法也相对多样化, 数据之间难以进行对比, 所以也就难以达成一致的评价标准和结果。不难看出, 软件工程数据挖掘的关键在于对挖掘数据的预处理和对数据结果的表示方法。
2 软件工程研发阶段出现的问题和解决措施
软件在研发阶段主要的任务是对软件运行程序的编写。以下是软件在编码和结果的提交过程中出现的问题和相应的解决措施。
对软件代码的编写过程
该过程需要软件的研发人员能够对自己需要编写的代码结构与功能有充分的了解和认识。并能够依据自身掌握的信息, 在数据库中搜集到可以使用的数据信息。通常情况下, 编程需要的数据信息可以分为三个方面:
(1) 软件的研发人员能够在已经存在的代码中搜集可以重新使用的代码;
(2) 软件的研发人员可以搜寻可以重用的静态规则, 比如继承关系等。
(3) 软件的开发人员搜寻可以重用的动态规则。
包括软件的接口调用顺序等。在寻找以上信息的过程中, 通常是利用软件的帮助文档、寻求外界帮助和搜集代码的方式实现, 但是以上方式在搜集信息过程中往往会遇到较多的问题, 比如:帮助文档的准确性较低, 同时不够完整, 可利用的重用信息不多等。
对软件代码的重用
在对软件代码重用过程中, 最关键的问题是软件的研发人员必须掌握需要的类或方法, 并能够通过与之有联系的代码实现代码的重用。但是这种方式哦足迹信息将会耗费工作人员大量的精力。而通过关键词在代码库中搜集可重用的软件代码, 同时按照代码的相关度对搜集到的代码进行排序, 该过程使用的原理就是可重用的代码必然模式基本类似, 最终所展现出来的搜索结果是以上下文结构的方式展现的。比如:类与类之间的联系。其实现的具体流程如下:
(1) 软件的开发人员创建同时具备例程和上下文架构的代码库;
(2) 软件的研发人员能够向代码库提供类的相关信息, 然后对反馈的结果进行评估, 创建新型的代码库。
(3) 未来的研发人员在搜集过程中能够按照评估结果的高低排序, 便于查询, 极大地缩减工作人员的任务量, 提升其工作效率。
对动态规则的重用
软件工程领域内对动态规则重用的研究已经相对成熟, 通过在编译器内安装特定插件的方式检验代码是否为动态规则最适用的, 并能够将不适合的规则反馈给软件的研发人员。其操作流程为:
(1) 软件的研发人员能够规定动态规则的顺序, 主要表现在:使用某一函数是不能够调用其他的函数。
(2) 实现对相关数据的保存, 可以通过队列等简单的数据结构完成。在利用编译拓展中检测其中的顺序。
(3) 能够将错误的信息反馈给软件的研发人员。
3 结束语
在软件工程的数据挖掘过程中, 数据挖掘的概念才逐步被定义, 但是所需要挖掘的数据是已经存在的。数据挖掘技术在软件工程中的运用能够降低研发人员的工作量, 同时软件工程与数据挖掘的结合是计算机技术必然的发展方向。从数据挖掘的过程来讲, 在其整个实施过程和周期中都包括软件工程。而对数据挖掘的技术手段来讲, 它在软件工程中的运用更加普遍。在对数据挖掘技术的研究过程中可以发现, 该技术虽然已经获得一定的效果, 但是还有更多未被挖掘的空间, 还需要进一步的研究和发现。
参考文献
[1]王艺蓉.试析面向软件工程数据挖掘的开发测试技术[J].电子技术与软件工程, 20xx (18) :64.
[2]吴彦博.软件工程中数据挖掘技术的运用探索[J].数字通信世界, 20xx (09) :187.
[3]周雨辰.数据挖掘技术在软件工程中的应用研究[J].电脑迷, 20xx (08) :27-28.
[4]刘桂林.分析软件工程中数据挖掘技术的应用方式[J].中国新通信, 20xx, 19 (13) :119.