当前位置：首页 > 生活技术 > 运动娱乐> 用于计算预测数据的信息处理装置等独创技术19078字

用于计算预测数据的信息处理装置等

2021-03-20 22:26:38

用于计算预测数据的信息处理装置等

　　技术领域

　　本发明涉及一种根据显示一个用户的应用程序的使用记录的日志数据，以计算该一个用户在应用程序中未来的行动相关的预测数据的信息处理装置、信息处理方法、程序以及选择对于该一个用户最佳的广告的营销信息处理装置。

　　背景技术

　　在应用程序(application program)内某个特定的用户未来会采取怎样的行动，对于运营应用程序的公司而言是非常关注的事情。举例而言，在众多的用户当中，若有未来付费可能性高的用户，就可以对于该特定的用户有效地推送为该特定的用户专门设计的付费形式的广告。

　　过去以来，已知有根据显示过去的应用程序的使用记录的日志数据(log data)，而以多个用户集体为单位的未来行动预测。例如，对20多岁的男性用户的付费比率为多少等的预测。

　　然而，就这种以多个用户为单位的未来行动预测而言，所得概率的准确性不高。而且，根据准确性低的概率进行的广告，也有效率不佳的问题存在。

　　另外，注意某个特定的用户来进行未来的行动预测在过去也并非不可能，但面对庞大的日志数据会使分析的作业负担增大，而显得不现实。

　　例如专利文献1，是涉及一种能够妥当地预测店铺中的商品需求的需求预测系统。其中预测部103能预测人的通行路径、通行量、来店人数，并妥当地预测随之变动的商品需求。然而，专利文献1记载的发明是预测商品的需求，与本发明是不同的技术领域，且预测部103的预测是参考与目标事件具有相同或类似的类型、属性等的过去事件记录信息来进行预测，由此可知该发明也是以集体为单位的未来预测。

　　又例如专利文献2，是涉及一种能够容易且高精确度地预测消费者欲购买的个别商品相关的需求的需求预测系统。然而，专利文献2记载的发明也是预测商品的需求，与本发明是不同的技术领域，并且也不是使用机器学习的技术。

　　〔先前技术文献〕

　　〔专利文献〕

　　〔专利文献1〕日本特开2018-92267号公报

　　〔专利文献1〕日本特开2014-119971号公报

　　发明内容

　　〔发明所欲解决之课题〕

　　如上所述，过去在应用程序中，并没有预测针对一个用户在应用程序中的未来行动的已知技术。

　　此外，运营应用程序的公司虽持有大量的用户在应用程序内的行动相关的日志数据，但由于此日志数据中也含有庞大且关连性薄弱的数据，使持有日志数据的公司不容易分析日志数据来进行未来预测。

　　本发明的目的是使用庞大的日志数据进行机器学习以产生学习模型，通过将该学习模型套用至特定的用户(非多个用户单位)，以高精确度地预测特定的一个用户在应用程序内未来会采取怎样的行动。

　　此外，本发明进一步提供一种根据所预测的概率，对于该特定的一个用户选择合适的广告的信息处理装置。

　　〔解决课题之手段〕

　　本发明的信息处理装置，其特征在于，包括：日志数据取得部，其取得显示一个用户的应用程序的使用记录的日志数据；预测处理部，其通过使用机器学习所产生的学习模型解析所述日志数据，以计算关于所述一个用户的所述应用程序的使用的作为预测结果的预测数据；以及输出部，其输出所述预测处理部所产生的所述预测数据。

　　本发明的营销信息处理装置，其特征在于，包括：预测数据取得部，其取得本发明的信息处理装置所产生的所述预测数据；以及营销处理部，其使用所述预测数据以选择对于所述一个用户的广告。

　　本发明的信息处理方法，其特征在于，包括：取得显示一个用户的应用程序的使用记录的日志数据的第1步骤；通过使用机器学习所产生的学习模型解析所述日志数据，以计算关于所述一个用户的所述应用程序的使用的作为预测结果的预测数据的第2步骤；以及输出所述预测处理部所产生的所述预测数据的第3步骤。

　　本发明的程序，其特征在于，通过电脑执行：取得显示一个用户的应用程序的使用记录的日志数据的第1处理；通过使用机器学习所产生的学习模型解析所述日志数据，以计算关于所述一个用户的所述应用程序的使用的作为预测结果的预测数据的第2处理；以及输出所述预测处理部所产生的所述预测数据的第3处理。

　　〔发明的效果〕

　　通过本发明，可以提供能够在应用程序内高精确度地预测特定的用户在未来会采取怎样的行动的信息处理装置等。此外，通过本发明，可以提供能够根据预测数据对于该特定的一个用户选择合适的广告的信息处理装置。

　　附图说明

　　图1是显示本发明的一实施例的信息处理装置1的功能框图。

　　图2是显示本发明的另一实施例的信息处理装置1的功能框图。

　　图3是显示本发明的一实施例的营销信息处理装置2的功能框图。

　　图4是显示机器学习处理部22所执行的学习处理的一例的流程图。

　　图5是显示预测处理部12所执行的预测处理的一例的流程图。

　　具体实施方式

　　以下将参照图式详细说明本发明的实施例。

　　图1为显示本发明的一实施例的信息处理装置1的功能框图。信息处理装置1包括日志数据取得部11、预测处理部12以及输出部13。图示在信息处理装置1的外部的日志数据记录部21、机器学习处理部22以及学习模型记录部23是用于将学习模型提供至预测处理部12的构成，并非本发明所必须的构成要素。但是，也可以将这些构成设于信息处理装置1内。

　　日志数据取得部11取得显示应用程序的使用记录的日志数据，并发送至预测处理部12。所取得的日志数据也可以发送至日志数据记录部21。

　　日志数据通常是由运营应用程序的公司将其作为数据库保存。应用程序运营公司在使用本发明的信息处理装置等的情况下，可通过从公司内部的数据库读取日志数据以使日志数据取得部11取得日志数据。

　　另一种态样就是，应用程序运营公司也能将日志数据传递给第三方数据分析公司并请求预测。在这种情况下，是由数据分析公司来使用本发明的信息处理装置等。数据分析公司可从应用程序运营公司例如通过网络使日志数据取得部11取得日志数据。

　　作为应用程序的使用记录，一般而言，例如可列举用户ID、应用程序的使用开始日/使用结束日、使用频率、登入日期/时间、使用应用程序时进行了怎样的行动、通过应用程序购买商品时的购买金额等的细节相关的日志数据等。

　　当应用程序为处理电子商务的EC网站的情况下，特别可列举如页面的浏览次数/时间、搜索执行次数、搜索关键字、打开电子邮件杂志、图像浏览次数、添加到购物车的次数、添加到购物车前的页面迁移次数、优惠券获取数/到期数、推荐商品点击数/购买数、专栏页面浏览数/购买数、付款方式注册数、注册付款方式前的迁移数、相同商品购买数、首次购买商品、已购买商品浏览数等的日志数据。

　　当应用程序为社交网络服务(所谓SNS)的情况下，可列举如收送讯息数、收送贴图种类(正面贴图或负面贴图)、收到讯息至开启为止的时间、每日收送信数、每日首次收送信用户数、与往来最多的用户间的收送信数/期间、对他人/自己的贴文的回应数/留言数、贴文数、连结/广告的点击数/返回前的经过时间等的日志数据。

　　当应用程序为游戏的情况下，特别可列举如游戏内付费状况(付费日期、付费对象(道具/角色等的购买、游戏内货币的购买等)、付费金额、付费频率等)游戏的使用状况(游戏下载日、下载后经过日数、登入日期、登入时间、最后一次开启游戏后的经过日数等)、游戏内角色的强化状况(角色强化的日期、次数、角色的种类等)、游戏内的道具使用状况持有道具的种类、持有道具的数量、道具的使用日期、道具的使用数量等)、游戏的进行状况(游戏中任务的达成状况、任务的挑战次数等)、游戏内用户的状态(玩家等级)等相关的日志数据。

　　预测处理部12在从日志数据取得部11收到的日志数据中提取一个用户的日志数据、并通过执行学习模型记录部23所保存的学习模型(演算法)，来计算该一个用户的应用程序的使用相关的作为预测结果的预测数据。

　　作为预测数据，例如，该一个用户往后预定期间继续使用应用程序的概率(预定期间持续率)、往后预定期间内结束使用应用程序的概率(预定期间内脱离率)往后预定期间在应用程序购买商品等的概率(预定期间内付费比率)等。

　　当应用程序为游戏的情况下，作为预测数据，如该一个用户往后预定期间内付费的概率(付费比率)、往后持续游玩的概率(游戏持续率)、往后停止游玩游戏的概率(游戏脱离率)特别重要。

　　输出部13将输出预测处理部12产生的预测数据。此输出可为电子数据的输出、或是通过打印输出，不需限定输出的方式。

　　日志数据记录部21是保管以日志数据取得部11取得的显示应用程序的使用记录的庞大的日志数据。此日志数据是使用作为产生学习模型用的教导数据(训练数据)。此日志数据也可作为预测处理的目标日志数据而发送至预测处理部12。

　　机器学习处理部22是使用机器学习以产生在预测处理部12执行的学习模型。此时，日志数据记录部21所保管的庞大的日志数据则成为输入输出组合的教导数据。

　　作为机器学习处理的模型，可以使用任何已知的模型，例如决策树、归纳推理、神经网络、深度学习等。具体例包括CNN、RNN、SVM、逻辑回归、随机森林和Xgboost等。而为了建构更高精确度的学习模型，机器学习较佳为使用神经网络的深度学习。

　　学习模型所含的变数可以适当选择并设定与预测数据的产生有关连的变数。为了计算高精确度的预测数据，通常会使用许多的变数。

　　作为应用程序的变数的例子，例如可举出应用程序的使用状况、行动内容、付费状况相关的数值。

　　当应用程序为游戏的情况下，作为变数的例子，可列举如下。

　　·购买游戏内货币的行动相关的数值(例如：付费金额)

　　·消费游戏内货币取得道具或角色等的抽奖(一般称为「转蛋」)相关的数值(例如：转蛋次数)

　　·消费游戏内道具相关的数值(例如：特定道具的消费数量)

　　·游戏内角色的状态提升的行动相关的数值(例如：受训次数)

　　·游戏内角色的强化相关的数值(例如：角色间合成次数)

　　·用户的游戏内状态相关的数值(例如：用户的等级)

　　·游戏内用户的任务相关的数值(例如：任务的挑战次数)

　　作为教导数据，可依据以何者为输入输出组合进行机器学习、以及预测什么而改变。例如，作为预测数据，在欲算出应用程序安装后3日间持续使用的一个用户，在往后7日间继续使用的概率(7日间持续率)时，作为教导数据的输入数据，使用从显示应用程序安装后3日间持续使用的用户的使用记录的日志数据中提取的数据，而作为组合的输出数据，则使用7日间是否持续的数据。通过将此教导数据作为输入输出组合大量地读取到机器学习处理部22，就能建构学习模型。

　　作为预测目录，除了上述以外，可列举如下。

　　·安装应用程序的一个用户在往后14日间继续使用的概率(14日间持续率)

　　·预定期间未使用应用程序，久后再度开始使用的一个用户在往后7日间继续使用的概率(回归后7日间持续率)

　　·现正使用应用程序的一个用户，在次周以后完全不使用的概率(脱离率)

　　·现正于应用程序中付费的一个用户，在次月以后完全不付费的概率(付费脱离率)

　　·安装应用程序的一个用户在往后30日以内付费的概率(付费比率)

　　·预定期间未使用应用程序，久后再度开始使用的一个用户在往后30日以内付费的概率(回归后付费比率)

　　学习模型记录部23是保管由机器学习处理部22产生的学习模型。接着回应预测处理部12的要求，将算出预测数据所需的学习模型提供至预测处理部12。

　　图2为显示本发明的另一实施例的信息处理装置1的功能框图。在此，信息处理装置1除了日志数据取得部11、预测处理部12、输出部13之外，还包括记录部14以及营销处理部15。进一步地，信息处理装置1还包括了图1中图示在信息处理装置1的外部的日志数据记录部21、机器学习处理部22以及学习模型记录部23。

　　记录部14是从输出部13取得预测数据并进行记录。此外，记录部14也可成为对用户广告的数据库而记录多个广告。进一步地，记录部14也可记录营销处理部15进行处理时执行的程序。

　　营销处理部15是从记录部14取得预测数据，并选择认为最适合该一个用户的广告，或选择不对该一个用户推送广告。

　　当应用程序为游戏的情况下，预测数据为例如该一个用户在往后预定期间内付费的概率(付费比率)、或者该一个用户下次购买的道具为A的概率(各道具购买率)。

　　当该一个用户的付费比率为95％，道具A的购买率相较于别的道具的购买率为最高的情况下，可以认为该一个用户购买道具A的概率非常高，因此营销处理部15就从记录部14所记录的多个广告中，选择道具A相关的广告。应用程序运营公司若依据营销处理部15的这个判断对该一个用户推送广告，就能进行高效的营销。

　　当该一个用户的付费比率为5％的情况下，可以认为该一个用户购买任何道具的概率都很少，因此营销处理部15就判断不对该一个用户推送广告。应用程序运营公司可依据营销处理部15的这个判断而决定不对该一个用户推送广告，就能节省不必要的费用。

　　此外，作为营销处理部15的另一个类似的处理，从记录部14取得预测数据后，在对象广告已经决定的情况下，能够选定该广告应该推送的用户。例如，对象广告为道具的广告时，营销处理部15能够选出预测数据中付费比率达预定值以上的用户，而选定为广告应该推送的用户。

　　图3为显示本发明的一实施例的营销信息处理装置2的功能框图。营销信息处理装置2包括预测数据取得部16、记录部14以及营销处理部15。营销信息处理装置2是设置在信息处理装置1的外部。

　　预测数据取得部16是从信息处理装置1(图3除一部分外皆予以省略)的输出部13取得预测数据。预测数据取得部16将取得的预测数据发送至记录部14，营销处理部15则选择广告，其处理就如上所述。

　　图4为显示机器学习处理部22所执行的学习处理的一例的流程图。

　　在步骤S20中，机器学习处理部22取得日志数据，也就是输入输出组合的教导数据。

　　取得的数据若处于不适合作为机器学习的教导数据的状态，则需要进行删除不要的数据、整理数据等为了机器学习的预处理。此预处理可以使用电子表格软件的宏功能等自动的进行处理。由于教导数据很庞大，这种自动处理对提高作业效率是必不可少的。

　　在步骤S30中，机器学习处理部22使用取得的教导数据，对学习模型进行优化(也称为参数调整或调校(tuning))。具体而言，机器学习处理部22从学习模型记录部23读取学习模型，通过输入作为教导数据的输入输出组合来重建学习模型。例如，本发明中在使用神经网络的深度学习的情况下，调整组成神经网络的节点之间的参数。

　　在步骤S40中，机器学习处理部22判断是否有未学习的日志数据(教导数据)。有未学习的日志数据(教导数据)时(步骤S40为“是”)，则进入步骤S20的处理。因此，学习模型的学习会反复进行，提高算出预测数据的精确度。另一方面，没有未学习的日志数据(教导数据)时(步骤S40为“否”)，则进入步骤S50的处理。

　　在步骤S50中，机器学习处理部22判定学习是否充分进行。例如，作为判定测验，机器学习处理部22随机抽出几个教导数据(输入数据与输出数据的组合)，对输入数据执行学习模型，就能确认能否正确预测输出数据。当此正确解答率达预设阈值以上时，判定已经进行了充分的学习。当判定为学习充分时(步骤S50为“是”)，则进入步骤S60的处理。另一方面，当判定为学习不足时(步骤S50为“否”)，则重复进行步骤S20之后的处理。

　　在步骤S60中，机器学习处理部22根据学习结果，更新学习模型记录部23所保管的学习模型。

　　图5为显示预测处理部12所执行的预测处理的一例的流程图。

　　在步骤S102中，预测处理部12从日志数据取得部11取得一个用户的日志数据。

　　在步骤S103中，预测处理部12输入一个用户的日志数据，并执行学习模型。

　　在步骤S104中，预测处理部12输出作为学习模型执行的结果的预测数据。

　　以上虽参照图式对实施例进行说明，但此仅为本发明的例示，本发明也可采用上述以外的各种构成。

　　附图符号说明

　　1：信息处理装置

　　11：日志数据取得部

　　12：预测处理部

　　13：输出部

　　14：记录部