一种半监督多视图学习的网页分类方法
¥23000
专利号:2019106528362
专利类型:发明专利
专利状态:已下证
专利领域:G06F16/958
更新日期:2026-04-10
摘要:本发明涉及互联网技术领域,更具体地,涉及一种半监督多视图学习的网页分类方法,包括:从网页中获取数据,建立训练集;通过已标记训练集训练分类器;通过训练好的分类器对已标记训练集和未标记训练集进行编码,获取样本特征;对样本特征进行密度聚类,获取聚类结果;根据聚类结果对未标记训练集的样本进行分类。本方案使用已标记训练集对分类器进行训练,在现有的多视图分类方法的基础上加入正交约束和对抗相似约束,再通过训练好的分类器对训练集里所有的数据进行密度聚类标记,最后对分类器进行准确率验证,多次迭代上述过程能使分类器的分类性能得到提升。