主管单位:黑龙江省科学技术协会
主办单位:黑龙江省科普事业中心
编辑出版:《科学技术创新》杂志社
国际标准刊号:ISSN:2096-4390
国内统一刊号:CN:23-1600/N
期刊级别:省级刊物
周 期: 旬刊
出 版 地:黑龙江省哈尔滨市
语 种: 中文;
开 本: 大16开
邮发代号 :14-269
投稿邮箱 :kxjscx@kxjscxzzs.com
在线编辑QQ :959914545
摘 要:相关研究表示,在社会经济不断发展的过程中,人们的饮食习惯及生活节奏也在不断的变化,因此提高了乳腺癌的发病几率。乳腺癌是否能够治愈的重点为早发现、早诊断和早治疗,现代医学无法治愈晚期乳腺癌,所以在对乳腺癌治疗过程中对预防重视。目前,一般都是使用超声波显像检查、X分析诊断、临床触诊、CT扫描及核磁共振成像对乳腺癌进行诊断,不同诊断方法都具有不同的优点和缺点。以此,该文就分析乳腺癌诊断中的支持向量机使用。
关键词:支持向量机 乳腺癌 精准诊断
中图分类号:TP391.4 文献标识码:A 文章編号:1672-3791(2019)03(b)-0169-02
该文对支持向量机在乳腺癌诊断中的使用进行分析。支持向量机的算法设计
假设具有训练样本数据集为:
其中的n指的是样本数,m指的是χn维数。可以使用超平面:
w指的是法向量,b指的是偏置。如果得到最优wo及bo,那么就能够得出支持向量机分类模型,使其作为线性判别函数通过以下公式表示:
以此预测未知样本分类值,sgn指的是符号函数。
算法详细步骤为:
其一,对样本数据进行归一化的处理,从而避免大数据覆盖小数值。
其二,实现标签数据值的规范化,两个分类一般为1和-1。
其三,创建新函数K及惩罚参数C。在实验过程中,先利用常用基本核函数训练模型对测试精准率及训练精度最优核函数的寻找。然后,通过核函数对最优新核函数进行寻找。以此,对基本核函数最好的性能充分考虑,最新创建的函数利用经验风险和泛化能力综合性能方面比较优,从而实现最佳分类效果,创建凸二次规划问题。
其四,通过五折参数寻优,实现支持向量机分类模型的创建,通过模型在训练集及测试集中对分类效果进行验证,求总体样本精准率。
其五,为了能够提高模型分类效果的直观性,将训练集和测试集作为基础绘制模型分类的效果图[1]。
2 使用分析
2.1 实验方案设计
该文实验过程中的数据均为某院病理部数据,此数据共有692个样本,恶性肿瘤有235个,作为正样本,良性肿瘤共有457个,作为负样本,利用活组织切片对全部样本进行检查并且确诊,所有样本中都有年龄和10个细胞病理特征。
在进行实验的过程中,利用5次交叉验证方法分组数据集并且对其测试,简单来说就是随机划分数据为5组,每组循环作为测试集,其他都是训练集。对每次分组利用的测试集及训练集分类器进行测试和实验。
2.2 分类结果和讨论
使用总精准率Q、灵敏度sen及特异度SPE对分类器性能进行评价,其计算公式为:
TP指的是测试集中判断准确正样本数量,FN指的是测试集中判断错误负样本数量,TN指的是测试集中精准判断负样本的数量,FP指的是测试集中判断错误的正样本数量。Sen指的是测试集中正样本灵敏度,Spe指的是负样本特异度。Sen越大,说明正样本识别具有较强的能力,能够良好判别负样本[2]。
对于SVM,在实验过程中使用多项式核函数等,并且通过5次交叉验证法进行测试和训练。表1为SVM使用不同核函数测试结果,通过表1可以看出来,使用以上核函数分类对于数据集具有良好的精准度,Sigmoid核函数精准度是最高的。所以,对一定分类样本来说,要想得到最优分类效果,优选核函数具有重要的作用,并且也表示SVM最佳核函数依赖样本数据分布的情况。另外,通过表1还可以看出来,使用Sigmoid核函数的过程中,具有较高的分类灵敏度,多项式核函数时候的特异度是最高的,表示Sigmoidhe函数对于正样本具有较高的识别率。
另外,对SVM和PNN、K-NN识别能力进行了对比,表示只有使用Sigmoid核函数的支持向量机精准度比较高,为96.24%。以此表示,使用Sigmoid核函数的支持向量机不急能够提高正样本识别率,还能够良好地对乳腺癌患者和非乳腺癌病例进行识别,使人为导致漏诊及误诊的几率得到降低。
3 结语
该文根据临床乳腺癌数据集,利用实验表示该文的诊断特异度、精准率及灵敏值都比较高,说明使用该文方法能够良好地诊断乳腺癌,从而提高乳腺癌的诊断效率,并且还能够为医生提供数据支持。
参考文献
[1] 吕萍丽.基于支持向量机的乳腺癌诊断模型的设计[J].福建电脑,2015(8):17-18.
[2] 章永来,史海波,尚文利,等.面向乳腺癌辅助诊断的改进支持向量机方法[J].计算机应用研究,2013,30(8):2373-2376.
①基金项目:2018年度湖北省教育厅科学技术研究项目“支持向量机分类在乳腺癌电阻抗特性诊断中的应用研究”(项目编号:B2018488;项目负责人:汪慧玲)。
本文由: 科学技术创新杂志社编辑部整理发布,如需转载,请注明来源。
2019-08-22