未来智讯 > 神经网络论文 > 基于神经网络的图书选择前瞻模型

基于神经网络的图书选择前瞻模型

发布时间:2019-04-26 03:32:44 文章来源:未来智讯    
基于模具展望主题的书籍神经网络:近年来未知,随着图书销售管理标准化数据,信息,图书馆工作人员计划书店面临的主题近期销售排行榜,销售和月度“书籍开卷调查讲座等众多报道 对于深入讨论和定量分析,所获得的局无疑是非常有价值的,也是图书市场未来研究的趋势。图书选择是图书出版的最初中心,本书一直倡导 - 发行单位。图书选择和规划的基本过程涉及信息筛选,主题设计,选择,论证,主题选择等。图书销售数据可以直观地反映市场纪律和用户积累趋势,对主题有重要影响。 然而,似乎书籍发送单元无法确定书籍选择的类型并确定原始数量 婷。 鉴于图书市场的短期坎坷和中期周期性,大量的销售和多种销售的并存,很难给出一本书的主题。 基于图书市场的短期和动荡特征,提出利用改进的神经网络模型预测图书印刷量,为图书制作单位确定图书印刷数量提供参考。 每个地区的精选书籍。 一,基于神经网络模型的销售前景分析人工神经网络的思想源于生物神经网络的模仿。 今天地球上所有生命体的大脑都是由神经网络组成的。 当代神经网络项目在工作日有数千到数百万个神经元和数百万个关节。 尽管这些数字不那么混乱,但它们与蠕虫的策略非常接近。 (1)神经网络算法简介反向传播BP(Back Propagation)训练算法的前馈型神经网络称为BP神经网络(BPNN)。 BP神经网络的主要特点是从输入层到隐藏层到输出层的信号保留了正向传输,然后隐藏层,隐藏层可能有多层,在逐层神经元之后 得到了解决。 最后,从输出层输入到魅力网络处理局。 其中,最后一层神经元只影响下一层神经元的运作。 如果输出层的输出值未达到预期指标,则神经网络转入偏差的反向传播过程,凭证偏差偏差调节神经网络的权重,然后将信号转发到正向 ,重复迭代,使神经网络的输出值不接近指标输出值。 神经网络的拓扑布局如图1-1所示:从图1-2可以看出,整个神经网络探测过程分为三个主要部分:第一部分是数据准备阶段; 第二部分是在训练集培训阶段,决定添加作者和内容热模型,以获得更好的热门交易前景效率。 当RMSE基本稳定时,预测模型最终确定; 第三部分是测试集outlook阶段,并加载测试集数据。 加载outlook模型并展望未来。 1.数据准备阶段从出售书籍和数据开始。书名实名申请系统数据解析ISBN代码联系,解决图书销售数据问题,作者信息破碎,然后按地区分组。 在分类项目的情况下,选择独特的热编码,并根据不可避免的映射标准将分离特征的值扩展到欧洲空间,并且欧洲空间中的分离特征的某个值对应于一个 点。 在机械训练算法中,力的战略特征与频率之间的距离或相似性是相似的。 特定过程中常用的距离或相似性策略基于欧洲空间。 完成上述过程以完成数据准备阶段。 2.确定展望模型。 解决模型重复的训练,直到RMSE趋于恒定。 通过选择微博热点搜索数据,提出改进作者的加权改进方案,决定对热门搜索信息进行爬行,引入作者的热因子,进而改进预期模型,从而解决前瞻性价值和现实价值。 解析改进模型的重复迭代,经过分析和分析,改进后的模型在热点事务的前景上有了显着的改进,最终确定了基于神经网络的图书选择的前瞻模型。 3.期待短期内的书籍销售。 预期的改进模式是按地区查看所选主题的印刷量,这有利于出版单位的工作人员确定每个地区的印刷量,最后进入局。 长期到数据库。 (3)数据清洗以“开卷销售演讲”(2013-2016)为例。 该数据涵盖全国2000多家实体书店,以及20多家自营网店和天猫。 预订城市,具有良好的连续性,代表性和完整性。 选择2012年至2013年未来两年图书零售市场的月度观测数据作为训练集,测试集为2014 - 2015年。 同时,根据书的真实姓名选择数据以申请数据。 书名实名制是中国图书出版的基本构成,涵盖了全国限量版书籍选编的所有数据,具有巨大的力量。 首先,本书销售数据与书号实名申请系统数据确定ISBN码联系,选择书号系统数据补偿等措施解决数据问题,如销售数据,作者信息破碎等 ; 手工清洗本地出书样式,地区等填写不规范或数据损坏; 维护标准和有用的数据,如标题,作者,价格,时间,销售,中国地图分类1,中间地图分类2,中间地图分类3级别,主题类型,语言类型,装订类型(平装,精装, 等),页数,单词数,内容介绍,内容类型(新书,转载,再版),版本,印刷,读者,地区,书籍田野模式(传统书籍,合作书籍,介绍书等) ,作者的输出频率,图书输出频率等; 然后逐个区域,选择独特的热码来处理分离特征。 (4)确定视觉模型并改进模型以解决8000次训练,RMSE基本趋于恒定,并展示测试集。预计该局有输出,如图1-3所示:观察样本的预期值和实际值,如图1-4所示,可以看出预测偏差的偏差基本上是 在收购范围内。 可以看出,上述模型可以应对“诺贝尔奖”的热点,无法正确预测热点事件。 原因是图书销售数据和图书真实姓名无法与流行的情况联系,也没有响亮的作者。 热门目标。 总之,模具的改进需要添加作者的热量的重量信息和所选内容的重量信息,以及比较是否包含热搜索和作者信息加权,并且确定所选内容的权重。 在内容分段之后,判断是否存在热搜索词来加权主题的内容。 为了处理新浪微博热门搜索词汇和热门搜索名人信息的收集,我们决定选择网络爬行风格,并决定使用Jsoup框架来攀登两个部分数据中的排名,关键词和搜索索引。 不可避免的频率。 在进行分析之后,将其保留在数据库中,并且支持销售数据的作者的权重和所选内容的权重作为数据。 添加作者热量和内容热量的两个维度,模仿热搜索数据并决定将一个数据修改为热搜索作者或将微博热搜索词信息添加到书籍主题选择中。 模具改进后,新浪微博热搜索数据以固定频率爬行,模仿对比数据的模式和数据模式的模式可用于提高前景的准确性。 如图1-5所示:随着“诺贝尔奖”的公布,虚拟名单中的“莫言热”逐渐冷却下来,但在2013年1月的名单中,莫言仍然是作者数量最多的 列表中的品种。 “青蛙”再一次位居榜首; 随后是在线剧集“坟墓之墓”的热播以及同一张名片“坟墓之墓”的发行。 文章和“隐藏的海花”都表明了强劲的销售高潮。 这一次,莫言的代表作“青蛙”和南派的三个叔叔的代表,“坟墓墓”被用作前景。 一开始,我们前三个月的数据是根本性的,期待下个月的销售数量,并与实际销售数量进行比较。 从上图可以看出,预测误差基本处于可控制的限制范围内,证明了作者热度和热点话题的神经网络前景,以及热点带来的图书印刷量激增的情景。 事务有良好的前景契合。 效力。 二,尝试局和申请的凭证展望数据,用户可以决定在预期公众号的主题中输入“地图”,每个主题的前景到各省,自治区,直辖市, 行政区的风格揭开了面纱。 这个前瞻性主题选择了中国分类中的儿童分类,包括二等动画/漫画/图画书,儿童英语,儿童民族经典,儿童艺术,儿童文学,儿童科学百科全书,低儿童头发,幼儿园教科书, 卡挂图,游戏益智,青少年生理自助11分类,三级分类儿童卡童,儿童英语,儿童民族经典,儿童艺术,儿童艺术综合,儿童游戏,儿童绘本,幼儿园西溪书籍,儿童卡片,儿童小说,儿童漫画,儿童科普百科,儿童挂图,漫画,儿童文学名着 ,幼儿有萌萌,芳华漫画,儿童文学,儿童手工艺,儿童音乐,儿童故事,儿童教科书,青少年生理学等23个子类别。 预期图书销售按照各省,自治区,直辖市和行政区的颜色深度划分。 颜色越深,销量越大; 左下角标尺可以调度打印单位值,外观更直观。 在不同地区印刷的书籍数量相当,可以减少不必要的人员,金钱和材料的损失。 它还具有降低运输成本和库存积累和销售的巨大优势。 通过双击省,自治区,直辖市和地图行政区,您可以进入主题选择前景页面,并显示该地区下个月的打印展望信息, 并指定下一个月为图书单位的工作人员。 出售计划和供应决议计划参考。 解决上述分析,从数据层面确保主题选择的可靠性,给出打印数量的视觉外观,并给予书单元在该区域内相对准确的打印量预测,为书单位打印量确定为 为区域交付提供科学依据。 因此,利用上述要点,可以建立一套将当前热点和流行信息与图书销售数据相结合的图书选择探矿应用系统,为图书出版业大规模数据分析应用奠定基础。 。 以上使用神经网络的方法,根据图书销售数据,图书名称实名申请系统数据和新浪微博热门搜索数据,选择数据挖掘分析要领,期待各地区图书的打印信息,以及 为书籍发送单位主题发行和分配的分配奠定了良好的基础,为发行单位收入的最大化提供了良好的保障。
转载请注明来源。原文地址:http://tangtes.cn/page/2019/0426/86621/
 与本篇相关的热门内容: