1.会计信息的安全性存在隐患。网络是一把双刃剑,它使企业在利用网络寻找信息或进行经济等活动的同时,也将自己暴露于风险之中;同时,因计算机病毒多样化、传播速度快、破坏力强、传播途径多和难以防范等特点,容易篡改和毁坏数据,造成会计信息失真,加大了风险。
2.计算机系统设施存在缺陷。主要体现在计算机基本硬件缺少保护,网络会计需要有功能强大而且安全的计算机硬件来支持其运作,但目前计算机硬件的性能还没有得到有力的保障。
3.网络系统内部控制不健全。在网络环境中,“扁平”的组织内部将取代“垂直”的组织结构,使传统会计系统中某些职权分工、相互牵制的控制失效。
4.复合型会计从业人员的缺乏。网络会计需要既熟悉信息技术又掌握会计知识的复合型人才,无论多么完善的硬件软件以及网络系统,都需要人的驾驭。
5.相关网络会计法规不完善。网络会计作为新生事物,尚处于萌芽理论和雏形应用,国家在网络会计准则、法规方面滞后。网络会计具体在会计程序和方法上如何操作,理论界和实务界也都在探索,尤其是实务中各企业作法不一,使得会计信息质量缺乏可比性,网络会计的合法性、规范性有待商榷。
二、构建安全保障体系,确保网络会计信息安全
(一)提高网络会计信息安全
网络是一个开放性的领域,会计信息安全问题是网络会计发展中面临的首要问题,必须要有一个安全、可靠的通信网络,以保证会计信息安全迅速地传递与共享。1.对于信息流采用对称加密和非对称加密等全面加密技术,以防止会计信息在传输过程中被泄密。2.采用防火墙和过滤技术,将包括病毒和网络黑客的恶意攻击在内的非法入侵、访问抵挡在内部网络之外。3.计算机硬件、相关软件的质量性能必须得到有力的保障,以防止硬件、软件故障。4.根据会计核算的要求和网络系统的特点,记账凭证、账簿账表的生成可采用集中管理模式,同时,网络结算要经过严格检验,并对相关凭证进行纸质备份。
(二)加强对数据的管理
网络环境下,大量不相同的会计业务交叉在一起,再加上多用户共享数据库的出现,如果内部控制制度不严密,一旦有缺乏严格控制检验的凭证录入到整个网络系统中,就很难查明原因,会直接影响到会计信息的准确性。因而把好数据录入关,保证数据录入的真实性、合法性、完整性十分重要。在输入系统前,数据都要经过检验,输入工作也应由多人多组分担;对输入的数据、代码等进行必要的校检,以保证其合法性和真实性;根据会计核算的要求和网络系统的特点,可以把同类凭证按凭证号顺序分成几组进行输入。
(三)加强技术层面的管理
1.保证硬件管理。应合理选择网络结构,优化网络硬件,保证网络的安全性及可维护性。同时,要提高操作系统的安全可靠性,要尽可能地选用安全等级较高的操作系统产品并经常进行版本升级。2.应当制定计算机机房和设备的管理制度、岗位职责和操作规程,禁止无关人员接触系统,专机专用。3.应当采取保护计算机机房安全的措施。计算机房重要的通道有门卫把守,必要情况下可以采用电子门锁、指纹核对、用计算机控制进出并登记进出人员的姓名和时间等防范控制手段。计算机机房还应充分满足防火、防潮、防尘、防磁和防辐射及恒温等技术要求,关键性的硬件设备可采用双系统备份。
(四)开发和更新软件
。可对购入的商业化软件进行二次开发,并通过接口和系统集成的办法克服二次开发软件和商业软件不能共享的缺点。同时,也可以考虑引入人工智能技术,发挥专家系统在预测、决策工作中的作用,加强会计的管理控制职能,以顺应网络会计的要求。2.全面采取网络技术,适应网络化管理,实现财务集中式管理、动态核算、实施监控软件在符合国际会计准则、多语言、多币种的情况下,提供具有国际化的会计信息,满足企业参与国际竞争的需要,实现财会国际化;形成网上公证由第三方牵制的安全机制努力使会计软件的运行环境向更高领域发展。3.会计与业务协同,实现物流、资金流、信息流、票据流的有效整合。网络环境下原始凭证用数字方式进行存储,应利用网络所特有的实时传输功能和日益丰富的互联网服务项目,实现原始交易凭证的第三方监控。财会软件是实施网络会计信息系统的基本构件,也是实施的关键所在。因为网络化财会软件具有投资大、风险大的特点,一旦系统运行不畅将使企业在经济上遭受损失,所以应对如何提高软件质量以及软件维护水平等方面给予重视。
三、健全内部控制机制,完善安全措施
(一)规范授权管理
财务部门应通过严格的权限管理及系统控制参数设置,界定操作员及各部门的操作权限范围,只有被授权的用户才能在系统中进行相应的操作。同时,还应建立起网络会计环境下的岗位责任制,明确所有岗位职责范围,做到不相容的分离,各岗位之间有一定的内部牵制作保障。这些措施进一步完善会计信息系统权限管理的漏洞,为会计信息构筑一道“防火墙”。
(二)加强数据管理和控制
针对网络传输和保存时电子数据容易被修改问题,企业应把整个财务账套建立在一个服务器上,规范基础设置,设计统一财务报表体系,保证财务核算主体数据格式一致。各自账套进行初始数据输入时,通过互联网上传至企业服务器,并按设定的会计处理方法和流程自动完成基本业务处理,实现会计核算数据直接采集、集中处理,减少信息处理环节,减少人工干预,提高信息传递速度,确保会计信息质量。实现一切数据的输入、存取过程规范化,从而保证企业会计信息质量的真实、完整和准确。
(三)解决系统软件问题
。
四、加强基础建设,培养高素质的网络会计人员
必须改变传统会计的人才观念和管理模式,加大网络会计人才的智力投入。为解决人才缺乏问题,首先要引进既懂会计又懂管理;既有原则性,又有灵活性;既熟悉电算化知识,又熟悉网络知识;既会会计业务操作,又能解决实际问题的高层次会计人才。其次,要建立、完善培养和培训体系,优化人才结构。有计划、有步骤、有针对性地组织开展会计人员的培训工作,采用多种形式更新财会人员的知识结构,特别是要提高会计人员的计算机应用水平,尤其是计算机网络技术,优化人才结构,增加人力资本的价值。会计教育和实践方面,高校和各级培训机构需要在战略上重视毕业生和会计师等网络会计人才的培养。
1.高校专业课程的设置和人才培养目标方面,应考虑网络会计的发展现状与变化进行动态调整,使网络会计人才的培养速度能够跟上职业界的发展速度。
2.为了适应网络会计对现有人才的需求,企业必须有计划、有步骤、有针对性地组织开展现有会计人员的继续教育和培训工作,改善会计人员的知识结构、计算机应用水平及网络理财意识,不断学中干、干中学。网络会计人才教育、培训需要包括五个方面的内容:计算机应用能力、网络常规维护能力、数据保密技能、网络安全技能、外语技能。通过培训,财务会计不断汲取新知识,将经济、财会、网络技术有机结合,以适应网络会计对信息时代复合型人才的需求。此外,在提高从业人员专业胜任能力的同时,还必须提高其职业道德。
【关键字】移动通信网络;网络优化;发展前景;广西
1移动网优的必要性
(1)移动网优的概念及其具体操作
移动通信网络优化是通过对现已运行的网络的通信数据进行收集处理分析后,制定优化方案达到扩充网络容量、增加覆盖范围、提供良好的通信服务的目标。
移动网优的具体操作可以分为四个步骤,为采集数据、分析数据、具体实施、网络评估。
。第一,OMC数据采集:通过OMC操作管理中心对整个话务数据进行统计,这些主要数据通常有:话务量、掉话率、拥塞率、接通率以及成功切换率等。第二,DT数据采集,驱车在车上通过各种仪器设备对无线网络进行测量和记录,测量的记录主要有场强覆盖情况、信令序列、通话质量、切换情形以及受干扰情况和发生的主要通话沟通事项等。第三,CQT语音质量测试,在测试区内选取测试点,进行一定数量的拨打测试。第四,用户投诉。第五,其他数据收集。
。第二,对路测数据分析,通过DT测试了解发生掉话、切换失败和语音质量不高等问题的原因,调整不当的参数,优化配置资源分配。第三、对信令进行分析,信令分析主要是对A接口、Abis接扣进行跟踪的数据进行分析。
完成数据分析后应根据其分析出来的问题提出具体实施方案,具体实施主要包括硬件调整、参数调整等,调整后还应对优化后的网络进行测试,查看其是否达到预期目标,对方案进行评估。
(2)移动通信网络优化的重要性
面对日益增长的通信用户数量,仅靠现有的技术是无法维持所有用户数的通信需求,网络出现的问题也不断增多,诸如手机掉话、无信号覆盖、通信质量差等问题极大地削减了用户对移动通信的认可度。面对诸如问题便滋生了移动网络优化这一技术产业,以维持日常的移动网络维护与建设,以保障用户能够使用更加稳定及完善的通信质量。
当前,移动通信网络优化已成为移动通信行业发展的关键点。对于移动通信运营商而言,移动通信网络优化既是移动通信行业衍生出来的子行业,又是其发展重点。随着竞争不断激烈化,各个运营商为了不断壮大用户数量并发展其新的用户,那么他们的工作重心必须从网络建设转向网络维护以及管理,这样,在庞大的不断快速增长的用户群的基础上开展增值业务的开拓,才能保证其健康发展。而网络质量是提高竞争力的最关键和前提的因素,从技术上来说就是实施网络优化。
网络优化是一个长期的过程,它贯穿于网络发展的全过程。只有不断提高网络的质量,才能增加移动用户的满意和对服务品牌的认知度,进而吸引和发展更多的用户。
2移动网优的发展前景
目前我国的网络优化行业的还处于以服务为主、产品为辅的市场结构模式,指标优化服务仍然是主流业务。随着移动通信技术的快速发展,移动网络优化也在不断向前发展。对此,国家对通信行业给予了大力的政策扶持,通信业处于高速发展时期,而网络优化作为网络部署及运营周期中的重要部分,注定了其市场规模的逐渐增大,其中网络优化市场规模由2006年的77.54亿元至2010年的155.23亿元,年复增长率达到18.95%,增长的速度远远高于经济的发展速度,拥有国家的大力扶持,移动网络优化在今后几十年内仍将快速发展,市场规模也将不断增大。
可以预见,以网络优化为主的新兴公司数量迅速增加,竞争着移动通信产业高速发展带来的商业机遇。随着行业竞争激烈化和用户需求多样化与差异化,网络优化服务也开始由基本的网络测试层面向用户感知与体验层面的方向发展。同时行业的发展与竞争促进了具有高技术含量的网络优化软硬件产品在整个网络优化市场规模的不断增加,激烈的竞争环境也将为网络优化行业的发展注入活力,竞争的加剧也在为网络优化服务市场带来广阔发展空间。
3 广西移动网优的现状
广西的总体地貌是山地丘陵地貌,几个较发达的城市位于山地丘陵之间的盆地之中,天然的地理地势制约着全区的通信网络覆盖,这也无形中给广西移动网络优化业务的发展带来了更大的潜力。在广西许多的山地地区,由于孤岛效应,经常出现切换关系的相邻基站因地形的阻挡覆盖不到的“飞地”,当用户在“飞地”覆盖区,很容易因没有切换关系而引起掉话、无法接通等问题,要解决这一系列的通信问题,就必须优化移动通信网络,为运营商提供更好的基站建设方案和网优系统,提高用户移动通信的稳定性。
网络优化的流程分为数据采集、数据分析、制定网络优化方案、实施优化方案、优化总结等。数据采集是网络优化的前提,需要运用大量的人力,数据的采集、整理、归纳和汇总都需要由人工来完成。在这一阶段虽然工作难度比较低,但是工作量比较大,所以需要的人力也比较多;而数据分析则难度较大,需要由工程师来完成数据的判断、分析和确定工作,并且要对数据所反映出的问题进行系统的总结,从而制定出一套完善的优化方案需要较高专业素质的人才。在广西,大多数移动网优公司采用的是DT数据采集法,即驱车在各采集点进行数据收集分析,由于许多地方的交通状况、人力因素等种种问题,负责数据采集的人员往往肩负着既沉重又辛苦的任务,这也影响到了网优这一职业在广西的发展,而由于广西属于较贫瘠的西部地区,很难吸引专业素质较高的专业人才从事数据分析工作,这些都使广西移动网优的现状不容乐观。
4结语
对于不断更新的移动通信技术,移动网络优化的技术要求也将不断更新,这就要求从事移动网络优化的技术人员不断的增强自己的技术水平,积极学习并吸收不断进步的移动通信技术,才能适应时代前进的步伐,使移动网络优化行业发展壮大。
参考文献:
[1]孙立新,尤肖虎,张萍.第三代移动通信技术.北京:人民邮电出版社,2000.
[2].李永江,张晓博.无线通信网络优化分析[J].信息系统工程,2010(3).
[3].吴斌 .动通信网络优化现状及发展趋势.民营科技2012(9).
[4].武黎强.论移动通信网络优化及其流程.无线互联科技,2012(1).
吴乾升(1991—),男,汉族,广西昭平县,现就读于广西大学通信工程专业。
关键词:网络游戏 价值链
很长时间以来中国的网络游戏常被冠以“网络海洛因“的名称,受到舆论的广泛批评与谩骂,但是从世界范围来看,欧美的网络游戏产业的收入超过了电影业的收入;韩国的网络游戏产业超过了汽车产业成为韩国的第一大产业,而且已经成为韩国产业结构中的支柱产业。另外,根据2002年中国互联网中心CNNIC的网络调查报告显示,80%以上的人认为网络游戏并不会耽误正常的工作和生活,由此,笔者认为考虑到中国目前以扩大内需为主的经济方针及同行业的国际成熟经验,我们应该从经济的角度、客观的评价网络游戏业的发展及其对于宏观经济的作用,从而正确的加以规范和引导使其成为带动国民经济增长的一股重要力量。
网络游戏是利用TCP/IP协议,以Internet为依托,可以多人同时参与的游戏项目,所以,网络游戏用户一定是互联网用户。根据CNNIC的调查报告,中国2001年、2002年的互联网用户数分别为2988.5万和4411.8万,预测2003年可以达到6256.4万,以后几年持续增长预计在2006年可以达到12543.5万。而且调查报告指出互联网用户中网络游戏用户在2001年占总体互联网用户的7.7%,2002年达到9.2%,并且预测今后4年用户数量随着互连网的普及和互联网用户的增加而增加,在2006年可能达到18%。可以看出网络游戏用户的比例在整个互联网用户的还是相当高的,另外,根据CNNIC的《互联网调查报告》,中国网络游戏2001年的用户数为397.5万其中付费用户为168.1万,而2002年用户数量为807.4万,付费用户为401.3万,全部用户的增长速度为103.1%,付费用户数量增长为138.7%,远远高于国民经济各行业的平均增长速度。所以,按照产业的发展趋势来看,中国的网络游戏业属于朝阳产业,其产品需求量逐步上升,产业增长率高于国民经济各产业的平均增长且呈上升趋势,在国民经济和整个产业结构中的地位和作用将不断上升。
【关键词】网络游戏产业;理性上瘾理论;文化产业经济;生活质量
1.引言
本文研究意义体现在理论和实践两方面。通过问卷,对理性上瘾因素进行实证研究,为消费者理性上瘾理论提供实证依据。结合行为经济学消费理论、理性上瘾理论,从其使人有益上瘾的因素出发,进行实证分析,为网游产业发展提供可供参考的建议。
2.网络游戏概念、发展现状和理论解析
2.1 概念和发展现状
网络游戏,又称在线游戏,依托互联网,通过人与人之间互动达到交流娱乐的目的。最初在美国发展起来,之后韩国、日本将其作为支柱发展。中国的网游市场发展速度惊人。
作为发展迅猛的新生事物,吸引追求刺激、社交欲强烈的青少年网民。文化产业发展要肩负起传承文化的使命。因此,要使网游高速发展同时,对消费者和社会负责任,就必须重视网游的属性。
2.2 行为经济理论及理性上瘾
理性上瘾理论基于行为经济学和行为消费理论的发展,Becker和Murphy提出理性上瘾理论,来解释上瘾消费行为。
理性上瘾理论观点有:一,其他条件一样,年长者比较不关心当前消费未来影响,更容易上瘾。二,区分有害上瘾和有益上瘾,前者是当前消费导向型,后者是未来消费导向型。三,对上瘾物品未来价格增加的预期会减少当前消费量,是区分理性上瘾和短视行为的主要方法。四,开始对有害上瘾或者有益上瘾的消费,通常是受成长带来的焦虑、紧张等影响。
3.网游消费者上瘾行为的研究综述
网游作为一种休闲方式获得了快速成长,网游提供休闲娱乐的数字化方式,同时也由于其体验形态属性,吸引了自我约束力差的人不良上瘾。。究竟该如何对待网游的发展,急需理论和实证数据作参考。
。
但目前网游产业要赢得市场,罢黜社会对网游诟病急需要理论指导。本文对行为经济学和行为消费理论,理性上瘾理论,直到对理性上瘾理论进行修正的自我约束问题进行综述,通过区分有害和有益上瘾,来研究网游上瘾的实际影响。
4.网游消费者理性上瘾行为实证分析
运用已有上瘾测量问卷对调查对象上瘾情况做了调查,结果显示,大部分消费者是理性的,过度上瘾的消费者占少数;通常引起过度上瘾的是那些以低俗的内容为题材的游戏。
本次调查主要是在网上采取随机调查方式进行。。获得100份有效数据,其中男性玩家80个,占80%,女性玩家20个,占20%。
问卷含二块,一是网游理性上瘾程度量表。二是生活状况量表。
4.1 关于网游消费者上瘾行为的调查
运用网游成瘾量表,根据专家对网络游戏成瘾标准的设定,专家的平均分为65.75%,界定分数为6.575,即标准为7,就是说10个项目中,有7个做肯定回答者即为网游成瘾消费者。结果表明虽然75%以上消费者能够正确认识网游,使网游不影响工作学习和人际关系等。其他25%由网游占去很多自由支配时间,通过减少睡眠时间,减少和他人沟通交流的时间,影响身体健康。
4.2 理性上瘾程度影响因素及其与生活质量相关关系
本文采用SPSS对网游成瘾调查数据进行整理统计和分析。对网游消费者生活质量与理性上瘾程度变化的相关性分析。
观测每日游戏时间为自变量,生活质量各指标为因变量,来分析平均每天网游时间与消费者生活质量相关程度的相关性。
从数据结果得出,网游时间对生理、心理、教育生活质量有显著影响,但是网游时间与玩家社会关系方面生活质量相关性不明显。时间越长,现实生活幸福感越会下降。超4小时,总体生活质量明显下降。超6小时,生理明显出现不良反应,比如视力下降、肩背肌肉劳损等。超2小时,心理就会受到显著负面影响。4小时内,教育质量差别并不明显,超4小时,教育质量会明显下降。综上,理性程度降低的网游玩家,他们现实生活质量也会下降。网游消费者理性程度影响其生活质量。
5.网络游戏产业发展建议
文化产业具两重性,一是意识形态属性,一是经济产业属性。在其发展中,政府扶持推动,能更好地引领其发展方向,提升文化产业质量;市场运作,则能够更好配置资源,满足群众多样化需求。文化产业繁荣发展,政府与市场缺一不可。
从以上分析,看出网游产业发展势不可挡,为使我国游戏产业健康发展,需要培养出本土化综合素质高的游戏专才,开发出更多高质量,启迪智慧,寓教于乐的优秀国产游戏软件,同时要有政府和社会支持和监督,使网游产业肩负起传承文化使命,健康发展。社会各方面应对玩家进行理性教育;同时适度提高游戏成本和税收有利于控制消费者理性上瘾程度。
6.结束语
通过实证研究,通过对网游消费者理性上瘾情况调查发现,结论如下:平均每天网游时间超2小时,心理上就会出现明显的负面反应;平均每天网游时间超4小时,教育的质量、总体生活质量会明显下降;平均每天网游时间超6小时,生理和教育质量就会出现明显下降;平均每天网游时间与消费者社会的生活质量相关关系不明显。
本文在前人有关网游和消费者上瘾体验和生活质量研究的基础上,通过实证分析,提出通过对网游玩家进行理性消费教育和加强游戏中理性上瘾因素,来提高玩家生活质量,进而提出促进网游产业集娱乐和文化、教育于一体,可以使消费者能够从内而外的提高生活质量。
参考文献:
[1]刘凤良,周业安,陈彦斌,于泽.行为经济学-理论与扩展[M].北京:中国经济出版社,2008:168-176.
[2]李菁.中学生网络游戏消费行为的实证研究[J].上海教育科研,2009(4).
[3]中国网络游戏产业发展现状研究[D].河南:河南大学,2005.
[4]谢勇.网络游戏产业发展导向及服务管理研究[D].成都:西南交通大学,2004.
关键词:垃圾邮件; 中文分词; BP神经网; 遗传算法
中图分类号:TP18 文献标识码:A文章编号:1009-3044(2011)08-1875-03
Research on the System of Chinese Spam Filtering Based on Neural Net
YE Yan1, LI Pei-guo2
(1.Zengcheng College of South China Normal University, Guangzhou, 511363, China; 2.Department of mathematics, Jinan University, Guangzhou 510632, China)
Abstract: The flooding spams take up huge Internet resource and user time. Especially some virus-spams, they can disable some normal Internet service, or attack user’s computers. It introduces BP neural network as the filtering algorithm, optimized by the Genetic Algorithm. With Chinese word segmentation, it designs and implements a Chinese email filter. At last, it performs training and testing using sample emails, and analyses the testing result. The result indicates that the filtering algorithm has good recall and precision ratio.
Key words: Spam; Chinese word segmentation; BP Neural Networks; Genetic Algorithm
电子邮件是互联网最重要、最普及的应用,大大方便了人们的生活、工作和学习。然而,近些年来,垃圾邮件成泛滥的趋势。据中国互联网协会反垃圾邮件中心统计[1],截止2010年7月,中国互联网用户收到的垃圾邮件比例约为40%,这些垃圾邮件花费用户大量的时间和精力来处理,给正常的使用带来了诸多的麻烦;对于企业来说,垃圾邮件会造成巨大的经济损失,尤其是带有病毒的邮件,更是带来了巨大的危害。
。以上方法,分别在各种特定的情况下,能够达到一定的过滤效果。但是,随着垃圾邮件制造者的技术提高,以上的各种方法都存在各自的缺陷,不能达到很好的过滤效果。
本文采用基于邮件内容的过滤算法,无论任何伪装的情况下,邮件的内容是无法改变的,否则就无法达到发送者的目的,因此,基于内容的过滤算法能够在各种情况下,达到过滤效果。同时,引入BP神经网络作为过滤算法,利用BP神经网的自组织、自学习和联想存储等特点,设计并实现垃圾邮件过滤系统。同时,针对BP神经网在训练过程中,容易陷入局部最优解的问题[4],引入遗传算法来对BP神经网络进行优化,利用遗传算法的全局搜索能力,进一步提高BP神经网络的学习能力[5]。针对中文自身的特点,在过滤系统中,加入针对中文的自动分词模块,实现针对中文垃圾邮件的过滤。
1 过滤系统的设计
过滤系统的主要思想:通过分析邮件的正文内容,提取其中的特征词汇,通过过滤模块进行垃圾邮件的识别;同时,加入了针对中文邮件的自动分词模块,达到对中文垃圾邮件的过滤;系统架构如图1所示。
1.1 系统的流程
系统的流程主要包括两个过程:过滤系统的训练过程和未知邮件的过滤过程,分别如下:
1.1.1 过滤系统训练
首先对邮件样本集进行预处理,得到待处理的样本邮件;然后通过中文自动分词,得到整个样本集的词汇统计表;根据词汇出现的频率,以及相应的代表性,选取出特征词汇;根据特征词汇表,将样本邮件转化为BP神经网络过滤模块的输入向量,从而对网络进行训练,生成最终具备识别能力的过滤模块。流程图如图2。
1.1.2 未知邮件过滤
收到新邮件后,通过中文自动分词,得到邮件中的所有词汇;根据特征词汇表,生成该邮件对应的特征向量,输入到神经网络过滤模块中;根据过滤系统的输出结果,判定当前邮件是否为垃圾邮件;用户可以对过滤模块的判定结果进行反馈,系统会记录错判和误判的邮件数量,并根据对应的比例决定是否需要重新训练过滤模块。同时,根据当前邮件是否为垃圾邮件,将该邮件中出现的词汇更新到所有词汇的表中,并统计相应的“垃圾概率”,这样做的目的是为了定期的更新特征词汇,达到过滤系统能够不断学习的效果。
1.2 系统结构
整个过滤系统采用模块化设计,共分为四个主要的模块:自动分词模块,特征词提取模块,BP神经网过滤模块,以及用户反馈模块,整体的结构如图3所示。
1.2.1 自动分词模块
该模块主要实现的功能是将邮件的内容通过自动分词技术,得到对应的词的集合。需要完成操作包括:
1) 邮件的编码识别,对于不同的邮件可能使用不同的编码,所以要针对各种编码,采用对应的解码方法对邮件进行解码,才能保证正确的读取邮件内容;
2) 邮件内容的预处理,例如,去掉邮件的头信息;根据已知的一些拆/分词的特征,去除拆/分的标志,比如一些垃圾邮件发送者,会故意的在字与字之间加上空格,目的就是让自动分次技术不能够正确的进行分词,因此需要在预处理阶段去掉这些分隔符;
3) 对邮件内容进行自动分词,得到邮件中的词语集合;
该模块的输入为邮件训练集,或者用户收到的邮件,输出为经过分词得到的词语集合。
1.2.2 特征词提取模块
特征词提取模块的主要功能是在经过分词模块得到的词汇集合中,选出最有代表性的特征词,这些词汇最能够表明一封邮件是垃圾邮件,或者是正常邮件。
1) 词频的统计:在样本集邮件的分词结果中,统计出每个词在垃圾邮件中出现的次数,以及在正常邮件中出现的次数,从而计算出这个词汇的“垃圾概率”,即为:
2) 提取特征词汇,即根据词汇的“垃圾概率”,取出最具代表性的词语;;但是,同时也要考虑词汇出现的次数,比如某个词只在一封垃圾邮件中出现,那么它的“垃圾概率”为1,但是它并不是最有代表性的词,因此,在选取特征词汇时,需要综合考虑这两个方面;
3) 特征向量转换,将邮件按照特征词表,转换为代表该邮件的特征向量;
另外,在提取特征词时,可以结合使用禁用词表方法,该方法是通过对汉语的研究,总结出一些对于邮件内容没有很大的影响的词汇,比如“是”,“的”,各种数字,等等,这些词汇并没有实际的意义,因此,提取特征词时,应排除这些词汇。
1.2.3 过滤模块设计
该模块是整个过滤系统的核心部分,通过样本邮件对过滤模块训练后,完成对未知邮件的过滤功能。整个过滤模块使用BP神经网络作为文本分类的算法,同时使用遗传算法对BP神经网络的各个参数进行优化,模型的设计图如图4。
其中,引入GA(遗传算法)优化器的目的是为了克服BP神经网容易陷入局部最优解的缺点,提高其全局搜索的能力。首先,将BP神经网的各个权值进行编码,通过GA优化器随机的产生初始的种群;对种群中的每个个体,经过解码后,构造对应的BP神经网;将样本训练集输入BP神经网,计算所有输出的均方误差;GA优化器根据均方误差,得到对应的适应度值,然后进行遗传优化,最终得到最优化的BP网络权值。
2 过滤系统的实现
过滤系统的实现主要采用Java语言,使用SQL Server数据库来存放分词的结果,以及最终的关键词列表。过滤系统的实现包括两个关键的部分,自动分词模块和遗传优化的神经网络过滤模块。
2.1 自动分词模块
本文采用ICTCLAS[6]中文分词系统来实现对邮件内容的自动分词,从而得到邮件的关键词列表,为下一步的特征词提取提供词库。具体的实现方法是:在代码中,调用ICTCLAS系统提供的API,对输入的邮件内容进行分词,并返回分词结果。
2.2 过滤模块的实现
2.2.1 BP神经网的实现
本文采用实用性很强的三层的BP神经网结构,即包含一个隐含层的BP网络。根据一般邮件的长度大概为100-200字,输入层节点数目确定为50个,即对应50个特征词汇,应该足以反映大部分邮件的特征;输出层采用一个输出节点,输出节点的意义为当前邮件为垃圾邮件的概率:越大则越可能为垃圾邮件;隐层节点数目,按照参考文献[7]提供的方法,确定数目为10。
BP神经网的实现,采用开源工程JOONE (Java Object Oriented Neural Engine),作为BP神经网的实现框架,按照如上的网络结构,实现相应的BP网络结构。
2.2.2 遗传优化BP网络
利用遗传算法可以优化BP网络的结构和各个权值,为了简化问题,本文只使用遗传算法来优化BP网络的权值部分。
首先需要解决的是编码问题,根据权值的连续性、高精度等特点,选取实数编码方案,提高编码精度,增加搜索空间。对BP网络各个权值的编码方法是将权值分为四个部分:
1) 输入层到隐含层的权值:即由输入层到隐含层的连接的权值;2) 隐含层的各节点的阈值;3) 隐含层到输出层的权值:即由隐含层到输出层的连接的权值;4) 输出层的各节点的阈值。编码得到的个体如下:
通过编码,就将BP网络的权值转化为遗传算法可以处理的染色体了,从而可以进行遗传优化,找到最优的权值编码。最后,再根据编码的规则,逆向解码得到最终的BP网络结构。
3 系统测试与分析
本文采用中国教育和科研计算机网紧急响应组(CCERT),2005年搜集的邮件样本集,作为测试数据。在样本集中,选取一部分邮件作为训练数据,对BP网络过滤系统进行训练;另外一部分作为测试数据,对过滤系统的结果测试。具体测试数据如下:
练样本集大小:6113 ;垃圾邮件数:3110;正常邮件数:3003
测试样本集大小:200;垃圾邮件数:100;正常邮件数:100;判定阈值为:0.9
在以上的测试数据情况下,过滤系统在自动分词、特征词提取部分,表现出很好的性能;在采用遗传算法优化的BP网络训练过程中,能够快速的收敛,大大提高了训练能力。具体的测试结果如表1。
测试的结果表明,过滤系统具有较好的运行能力,在处理大量邮件时,运行速度相对较快,能够达到一般的性能要求。邮件过滤结果表明,过滤系统具有很高的准确率和查全率,在样本集相对完整和充足的情况下,能够起到很好的过滤效果。
4 结论
针对中文垃圾邮件的过滤问题,本文采用了基于遗传算法优化的BP网络作为过滤算法,并结合中文自动分词技术,设计并实现了针对中文垃圾邮件的过滤系统。引入ICTCLAS系统作为中文自动分词模块,基于JOONE框架,来实现遗传算法优化的BP网络过滤模块。最后,通过系统的测试,分析了系统的性能和垃圾邮件过滤的查全率和准确率。测试结果表明,该过滤系统具有一定的实际价值,可以为垃圾邮件处理领域提供一个新的参考。
参考文献:
[1] 中国互联网协会反垃圾邮件中心.2010年第二季度中国反垃圾邮件状况调查报告[R],2010.
[2] 郑可馨,姜守旭,罗志云.垃圾邮件过滤系统的设计与实现[D].哈尔滨:哈尔滨工业大学,2004.
[3] 潘文锋,王斌. 基于内容的垃圾邮件过滤研究[D].北京:中国科学院计算技术研究所,2004.
[4] 余本国.BP神经网络局限性问题的讨论[J].微计算机信息,2007(8).
[5] Sexton R S,Dorsey R E.Reliable classification using neural networks: a genetic algorithm and backpropagation comparison[J].Decision Support Systems,2000(30):11-22.
关键词:SDH;网络数据;日志控制;告警
中图分类号:TN914
针对许多外包服务商、厂商技术支持人员、项目集成商等在对内部核心服务器、网络基础设施进行现场调试或远程技术维护时,无法有效的记录其操作过程、维护内容,极容易泄露核心机密数据或遭到潜在的恶意破坏。
对SDH告警信息系统控制的过程中需要对网络运行维护进行全面的判断,对每个告警信息进行科学化划分,从而能够保证网络数据信息集中化控制与管理,保证数据信息审计能力提升。对SDH告警系统产生的方案进行会话管理,从而能够产生会话流,提升网络告警信息化管理水平。通过模型驱动等措施能够对网络行为进行检测,报警和记录,确保网络数据信息能够有效的控制,提升数据信息的控制与管理能力。
数据库运行维护是对数据进行有效告警和旁路侦听的重要方式,确保网络会话流能够符合网络数据信息管理的基本要求,提升网络数据接收能力,对网络数据传输活动的顺利实施产生积极的作用。通过对网络数据信息结构的优化,可以提升网络数据管理的性能要求,确保网络数据的安全性得到巩固,对可靠性管理产生重要的影响。网络数据信息管理过程中需要通过安全性和透明性控制,对日常告警维护进行处理,提高网络数据信息的控制和管理能力。支持日常维护人员针对AIX、Linux主机设备,主流网络设备、Windows服务器的进行的运行维护操作审计;日常维护人员操作Sybase数据库,通过运维审计系统可以审计到维护数据库的操作;可以支持针对外部厂商远程运行维护时,进行操作审计;审计协议支持Telnet、FTP、SSH、SFTP、RDP等;详细的权限分配功能,可以根据时间、登录IP、目标资源等进行详细授权;支持按时间、用户名、被审计设备、命令等进行的定制报表,并可以导出Excel或PDF等格式报表;设备支持硬件冗余方式,并支持HA(双机备份冗余)。
运维审计系统针对内部运维人员、厂商技术支持人员、外包服务商等对关键服务器、网络设备、安全设备操作进行安全审计,规避安全风险,减少安全事件;规范运维流程,加强安全管理,提高运维安全水平;对运维安全违规事件及时追踪,并提供可信、完整的技术依据;定时针对各类系统产生运行维护报告,审计运维内容,提交相关领导审核,并安全存档;协助完善内控机制,达到省公司的合格性要求。
1 SDH告警网络化模型设计
1.1 告警优化
网络数据信息管理需要从SDH告警优化角度出发,积极稳妥的利用网络数据信息管理的基本要求,提升网络数据信息的管理能力,对网络数据信息告警目标实现产生重要的影响。
数据访问框架要提供对快速开发处于业务逻辑层与后端的DBMS之间的数据存取层的支持。主要要求有:
(1)数据访问框架采用ORM技术提供业务对象到数据库的映射,对业务层屏蔽数据库的一切细节,使得DBMS的变迁不需要业务逻辑层做任何代码的变更。
(2)设计时也需考虑DBMS的变更对数据存取层的影响,变更时只需最少的代码变更。
(3)要实现代码和SDH语句的分离,以利于数据库管理员对数据库做配置优化。
(4)支持对批处理操作的优化。
(5)提供灵活方便的事务处理。
(6)支持大部分需求的通用实现,又能够方便扩展。
(7)要具有自成体系的异常机制。
当执行数据访问操作时,调用者以ObjectSignature对象(Entity和Entity-Container都是ObjectSignature的子类)和Properties对象作为参数,调用DAO的相应方法。
DAO对象根据ObjectSignature.toSignature()方法得到所要执行的SDHStatement的唯一标识,并根据此标识调用SDHCode单例对象的getSDHStatement()方法获得对应的SDHStatement实例对象。
DAO对象从SDHStatement中得到标识参数化SDH语句的ParameterizedSDH对象,然后将这个ParameterizedSDH对象和调用者传入的Properties对象一起作为参数调用DBWrapper对象的相应方法。
DBWrapper是数据库操作包装器类,它封装了所有的通过JDBC操作数据库的调用。DBWrapper类对象根据Properties对象将ParameterizedSDH对象转换成标准SDH语句,并通过一个JDBCStatement的实例执行该SDH语句,最后根据JDBC返回的ResultSet创建结果对象。
下面详细介绍数据访问对象类、数据库操作包装器类的设计,以及事务处理和对DBMS之间差异的屏蔽。
1.2 网络告警优化
运维审计系统针对内部运维人员、厂商技术支持人员、外包服务商等对关键服务器、网络设备、安全设备操作进行安全审计,规避安全风险,减少安全事件;规范运维流程,加强安全管理,提高运维安全水平;对运维安全违规事件及时追踪,并提供可信、完整的技术依据;定时针对各类系统产生运行维护报告,审计运维内容,提交相关领导审核,并安全存档;协助完善内控机制,达到省公司的合格性要求。
结合单位内部的参考资料和以往开发案例系统研究分析可行性方案、概念设计:分析需求,由粗到精、由模糊到清晰的概括总结出系统设计的概念模型使原型系统开发有一个概念的框架、逻辑设计、物理设计、空间属性数据库设计:原型系统中用到的数据通信空间数据库以及相关的属性数据库建库工作、系统实现:基于Adobe公司的Flex开发,Actionscript编写RIA的丰富前台功能、MyEclipse平台下Java语言开发服务器端的Servlet后台处理程序或者借助微软公司的Visualstudio2005开发后台、ESRI公司的ArcGISServer或者开源的GeoServer数据通信服务器数据通信的WMS服务处理的缓存交由自定义Servlet处理、数据通信的开发框架选用开源的Modestmaps或者ESRI的arcgisapiforflex进行实现数据通信浏览(放大、缩小、漫游、全图等)、查询(图查属性、属性定位查图)、鹰眼窗口、图层控制功能、数据通信标绘功能、数据通信渲染、专题图制作等、编码测试、到最后的性能分析和评价:通过在本单位研发中心不断的测试系统,分析预测结果,按软件工程学的流程进行分析,面对系统用户给出各种可行性的调查结果,分析最终结果比较得出最佳方案。以及对数据通信核心算法的优化整理研究。
2 总结
SDH网络系统告警处理过程中,需要对告警信息进行管理,确保告警信息能够符合网络数据查询的具体要求,提升网络数据信息的安全控制与管理水平,对网络数据信息的优化产生积极的影响。通过对网络数据信息流的访问,全面提升网络数据的综合管理能力,确保网络数据信息能够在查询的过程中进行异常处理,从多方面解决网络数据信息告警能力,为网络数据信息安全传输提供重要的支撑。
参考文献:
[1]贺艳芳,石坚.SDH告警显示预处理和告警关联分析[J].科学技术与工程,2006(04):12-13.
[2]吴蔚.利用告警关联分析技术实现网络故障定位[J].科技经济市场,2007(10):17-18.
[3]石永革,梅玉洁,石峰.通信网网管告警过滤机制的研究与应用[J].计算机工程与设计,2008(09):90-91.
[4]孙朝晖,张德运,李庆海.网络故障管理中的自动告警关联[J].计算机工程,2004(05):56-57.
[5]宋天蕖,何勇.SDH告警中的知识发现[J].西南民族大学学报(自然科学版),2004(06):78-79.
因篇幅问题不能全部显示,请点此查看更多更全内容