PNN类预测
构建和测试分类器使用概率神经网络(PNN)类预测方法:
- 第一个使用PNNXValidationOptimization模块,以确定最佳参数设置为PNN类预测方法.
- 然后使用概率神经网络模块生成概率神经网络分类器,测试以前生成的概率神经网络分类器,或使用以前生成的概率神经网络分类器的未知样本进行分类.
开始之前
通常,您使用一个数据集来训练分类器和其他对其进行测试。每个基因表达数据集包含两个文件:
步骤1: PreprocessDataset
基因表达训练数据进行预处理,以删除平台噪声和基因几乎没有变化。注意:如果预处理数据删除相关的生物信息,请跳过此步骤.
不表达基因测试的数据进行预处理。基因测试数据应包含所有目前在训练数据.
注意事项
- PreprocessDataset数据进行预处理可以在一个或多个方法(以此顺序):
- 设置阈值和上限值。 更低的/高的任何值超过阈值下限值重置为阈值/最大值.
- 每个表达式的值转换为日志基值的2.
- 如果一个给定的数字样品的值小于给定阈值,移除基因(行).
- 删除基因(行),它没有最低折变化或表达式的变化.
- 离散或规范化数据.
- 在使用比率比较样本之间的基因表达期间,值转换为日志基值的2,使上下调节基因相同的规模。例如,2的比率和。5表示两倍的变化,上下调节expression2.
- 如果未生成表达数据,请检查是否已经采取了预处理步骤之前运行PreprocessDataset模块.
步骤 2: PNNXValidationOptimization
PNNXValidationOptimization迭代运行PNN类预测对已知数据集。对于每次迭代,它只有一个样品,建立了利用剩余的样品分类器,然后测试排除对样本的分类器。在测试之后,各种参数设置,PNNXValidationOptimization创建一个分析结果文件(*.xvopt. odf),它包含参数的推荐值。结果文件是一个.
注意事项
- num 特性参数用于指定范围值尝试。该模块会自动选择最佳的参数设置。您不需要将它运行多次.
- 尝试替代参数的设置,使用概率神经网络模块,而不是PNNXValidationOptimization模块.
步骤 3: PNN
PNN模块建立/测试分类符通过运行PNN类预测方法:
- 要建立一个分类器,指定训练数据集。该模块创建一个分类器(.模型).
- 测试以前生成的分类器中,指定分类器(*.模型)和测试数据集。该模块将创建预测结果文件(*.pred.odf),它评估预测的准确性.
- 构建和测试分类器,指定培训和测试数据集。该模块创建一个分类器和预测结果文件.
步骤4:查看结果
要查看预测结果文件(*. pred. odf),使用PredictionResultsViewer模块。对于每个示例,该查看器列出了实际的类,预测类别,并预测错误率.
分类器(. 模型)是一个二进制(机器可读的)文件。无法查看,但可以作为输入PNN模块.
注意事项
- 该PredictionResultsViewer提供了一个绝对错误率(不正确的情况下/例)和ROC错误率(正确接受的分数相对分数假阳性)。使用ROC错误率比较结果的数据集.
步骤5:确定未知样本的类
使用PNN模块对未知样本进行分类:
- 使用保存的模型文件名参数指定先前生成的分类器(.模型文件).
- 测试文件 参数用于指定表达式的数据集,其中包含未知的样品.
- 测试类文件名 是必需的参数,指定类的每个样本中表达式的数据集。对于未知的样本中,创建一个类文件,将一些类 (例如,"未知") 分配给每个样本。
模块使用分类器来预测每个未知样本的类,并创建一个预测结果文件。使用PredictionResultsViewer模块,以查看预测结果(*.pred.odf)文件:
- 观众列出了每个样品其实际的和预测的类.
- 忽略实际的类,这是未知的.
- 忽略错误率,评价该类预测是反对"知道"数据.