逻辑回归算法及其应用
日期:2024-06-03 作者:小天
来源:www.txunda.com
人气:495
一、什么是逻辑回归(logistic recovery)?
logistic回归(logistic regression)是一种基于 sigmoid (光滑函数)的机器学习算法,通过对一维数据的处理,对其进行分类。虽然有“回归”的名称,但其实质是一种分类的方法,其主要应用于对二类问题的求解,也适用于求解多重分类的问题。Logistic回归模型的结果是一个概率值,一般情况下,我们会设置一个阀值,如果超过该阀值,就判断为正类别,反之,判断为负。
二、逻辑回归法的基本理论
逻辑回归的基本原则是用光滑函数(Sigmoid函数)将其转化为0-1之间的一个概率。此机率值是积极类别的机率。上文所述的逻辑回归必然以线性回归为基础。一般情况下,当样本数据非常不规则时, Y值仍然是二项分布。(你可以自己理解双项分配的概念)在二项分配问题中,若某一事件出现的可能性是 P,则其不发生的可能性是1+ P,其发生的概率就是发生的概率和不发生的概率之比。我们将概率的自然对数(其数值可以是正负的,也可以是正数)对应于 y的线性分布。
天津天迅达科技有限公司
如果您需要相关服务,可以找天津天迅达科技有限公司,我们的业务有Web开发、iOS APP、Android APP、微信开发、HTML5开发等,天迅达——您身边的App个性化定制专家!
三、逻辑回归法在实际中的运用
1.数据预处理技术
2.线性回归模型中的参数和 Y值的确定,通过建立一种线性回归模型,利用梯度下降(GD)(或利用最小二乘法)求出线性回归方程的参数,再求出 Y值。
3.利用光滑函数求正类别的概率
4.确定或限值,设置一个基于商业需要的可能性门槛。
5.预期成果
四、逻辑回归法的应用范围与利弊
1. 可适用的界限,对于只有两类数据的二元分类问题,逻辑回归算法适合应用。针对多重类别问题,提出了一种多重 Logistic回归模型。另外,该方法还需要满足一些假定条件,例如:特征间可分离性、伯努利分布等。
2.优势
这是一种很容易实施的方法。该算法具有较高的计算效率,适用于大容量的数据分析。结果表明,该方法具有较好的解释性。对数回归的结果,可转换成可能的数值,以便于理解与分析。
3.不利之处
线性可分离性:传统的逻辑回归方法仅适用于可分离的线性问题,而不适用于可分离的非线性数据。
解决多重类别问题的难度:传统的 Logistic回归方法仅适用于二类问题,而在多类别的情况下,还需进一步的处理。
易于过拟合:当样本容量太小或者特性太复杂时, Logistic回归很可能会出现过拟合。
对离群点的敏感性: logistic回归对离群点非常敏感,尤其是当特征空间很小时,它会严重影响模型的表现。
五、适用情形
线性回归模型以预测分析为主,逻辑回归模型是基于线性回归,所以也以预测为主,但对二分类的预测,对特定的数值则不适用。例如,房价上涨的预测,用户的性别的预测,产品(网页)的点击,以及用户是否会购买特定的产品等等。下面是更多的情景:
信用评价:对个人或公司的信贷风险进行预测,为银行及其他金融机构提供信贷决策支持。
病情预报:利用病人的临床特点及医疗检查结果,对病人是否存在糖尿病、高血压等病症进行预测。
市场预测:对未来的市场走势、销量进行预测,以协助公司作出市场战略及经营决策。
诈骗侦测:辨识信用卡诈骗、网路欺诈等诈骗手法,协助金融机构及电子商务平台提升安全保障。
用户行为分析:通过对用户购买意愿、流失风险等行为进行预测,从而实现对用户的个性化推荐,从而提高用户体验。
市场研究:通过对市场调查资料的分析,来预测顾客对商品或服务的喜好及购买意向。
网页点击预测:通过对广告或促销内容的点击量进行预测,从而为广告商提供最佳的投放方案。
人口统计:对人口统计资料进行分析,并对人群的行为与倾向进行预测。
以上所有设计图和部分文字均来自网络,如有侵权,请call我删除,感谢~
天津天迅达科技有限公司经过多年来对APP、小程序、以及网站建设的探索,已经帮助每一个客户快速开发出属于自己的APP、小程序、网站,是万千企业之选。
标签:天迅达科技 天津APP开发 天津网站建设 网站建设
logistic回归(logistic regression)是一种基于 sigmoid (光滑函数)的机器学习算法,通过对一维数据的处理,对其进行分类。虽然有“回归”的名称,但其实质是一种分类的方法,其主要应用于对二类问题的求解,也适用于求解多重分类的问题。Logistic回归模型的结果是一个概率值,一般情况下,我们会设置一个阀值,如果超过该阀值,就判断为正类别,反之,判断为负。
二、逻辑回归法的基本理论
逻辑回归的基本原则是用光滑函数(Sigmoid函数)将其转化为0-1之间的一个概率。此机率值是积极类别的机率。上文所述的逻辑回归必然以线性回归为基础。一般情况下,当样本数据非常不规则时, Y值仍然是二项分布。(你可以自己理解双项分配的概念)在二项分配问题中,若某一事件出现的可能性是 P,则其不发生的可能性是1+ P,其发生的概率就是发生的概率和不发生的概率之比。我们将概率的自然对数(其数值可以是正负的,也可以是正数)对应于 y的线性分布。
天津天迅达科技有限公司
如果您需要相关服务,可以找天津天迅达科技有限公司,我们的业务有Web开发、iOS APP、Android APP、微信开发、HTML5开发等,天迅达——您身边的App个性化定制专家!
三、逻辑回归法在实际中的运用
1.数据预处理技术
2.线性回归模型中的参数和 Y值的确定,通过建立一种线性回归模型,利用梯度下降(GD)(或利用最小二乘法)求出线性回归方程的参数,再求出 Y值。
3.利用光滑函数求正类别的概率
4.确定或限值,设置一个基于商业需要的可能性门槛。
5.预期成果
四、逻辑回归法的应用范围与利弊
1. 可适用的界限,对于只有两类数据的二元分类问题,逻辑回归算法适合应用。针对多重类别问题,提出了一种多重 Logistic回归模型。另外,该方法还需要满足一些假定条件,例如:特征间可分离性、伯努利分布等。
2.优势
这是一种很容易实施的方法。该算法具有较高的计算效率,适用于大容量的数据分析。结果表明,该方法具有较好的解释性。对数回归的结果,可转换成可能的数值,以便于理解与分析。
3.不利之处
线性可分离性:传统的逻辑回归方法仅适用于可分离的线性问题,而不适用于可分离的非线性数据。
解决多重类别问题的难度:传统的 Logistic回归方法仅适用于二类问题,而在多类别的情况下,还需进一步的处理。
易于过拟合:当样本容量太小或者特性太复杂时, Logistic回归很可能会出现过拟合。
对离群点的敏感性: logistic回归对离群点非常敏感,尤其是当特征空间很小时,它会严重影响模型的表现。
五、适用情形
线性回归模型以预测分析为主,逻辑回归模型是基于线性回归,所以也以预测为主,但对二分类的预测,对特定的数值则不适用。例如,房价上涨的预测,用户的性别的预测,产品(网页)的点击,以及用户是否会购买特定的产品等等。下面是更多的情景:
信用评价:对个人或公司的信贷风险进行预测,为银行及其他金融机构提供信贷决策支持。
病情预报:利用病人的临床特点及医疗检查结果,对病人是否存在糖尿病、高血压等病症进行预测。
市场预测:对未来的市场走势、销量进行预测,以协助公司作出市场战略及经营决策。
诈骗侦测:辨识信用卡诈骗、网路欺诈等诈骗手法,协助金融机构及电子商务平台提升安全保障。
用户行为分析:通过对用户购买意愿、流失风险等行为进行预测,从而实现对用户的个性化推荐,从而提高用户体验。
市场研究:通过对市场调查资料的分析,来预测顾客对商品或服务的喜好及购买意向。
网页点击预测:通过对广告或促销内容的点击量进行预测,从而为广告商提供最佳的投放方案。
人口统计:对人口统计资料进行分析,并对人群的行为与倾向进行预测。
以上所有设计图和部分文字均来自网络,如有侵权,请call我删除,感谢~
天津天迅达科技有限公司经过多年来对APP、小程序、以及网站建设的探索,已经帮助每一个客户快速开发出属于自己的APP、小程序、网站,是万千企业之选。
标签:天迅达科技 天津APP开发 天津网站建设 网站建设
相关资讯
- 数字孪生:现实世界的身外化身 2024-12-06
- 微信公众号全面“今日头条化”,自媒体将迎来“第二春”? 2024-12-04
- 优质长视频的破圈效应 2024-12-05
- 奶茶行业的裂变营销 2024-12-03
- 浅浅分享下支付产品经理如何写全局性的需求文档以及工作流程 2024-12-02
- “麦学”爆红:一场精心策划的营销盛宴 2024-11-29
- 如果遇到麦琳式的领导,怎么办? 2024-11-28