编辑“
邏輯斯諦迴歸
”
跳转到导航
跳转到搜索
警告:
您没有登录。如果您做出任意编辑,您的IP地址将会公开可见。如果您
登录
或
创建
一个账户,您的编辑将归属于您的用户名,且将享受其他好处。
反垃圾检查。
不要
加入这个!
{{expert|time=2016-09-17T10:19:57+00:00}} {{noteTA |G1 = Math |T = zh-cn:逻辑斯谛回归; zh-tw:邏輯迴歸; |1 = zh-cn:逻辑斯谛; zh-tw:邏輯; }} '''邏輯迴歸'''({{lang-en|Logistic regression}},又譯作'''邏輯斯迴歸'''、'''羅吉斯迴歸'''、'''邏輯斯諦迴歸'''、'''对数几率迴归'''),在[[统计学]]中是一種对数几率模型({{lang-en|Logit model}},又译作逻辑斯谛模型、评定模型、分类评定模型),是[[离散选择法]]模型之一,属于[[多元变量分析]]范畴,是[[社会学]]、[[生物统计学]]、[[臨床研究|临床]]、[[数量心理学]]、[[计量经济学]]、[[市场营销]]等[[统计]]实证分析的常用方法。 通过使事件的对数发生率(log-odd)成为一个或多个自变量的线性组合,对事件发生的概率进行建模。形式上,在二元逻辑回归中,有一个二元因变量,由指示变量编码,其中两个值标记为“0”和“1”,而自变量每个都可以是二元变量(两个类,由指示变量)或连续变量(任何实值)。标记为“1”的值的相应概率可以在0和1之间变化;将对数发生率转换为概率的函数就是逻辑斯諦函数,因此得名。对数发生率单位称为''logit'',来自'''''logistic unit'''''。<ref>{{Cite book|edition=2. ed., [Nachdr.]|chapter=Applied logistic regression|series=Wiley series in probability and statistics|publisher=Wiley|date=200|location=New York|isbn=978-0-471-35632-5|first=David W.|last=Hosmer|first2=Stanley|last2=Lemeshow}}</ref> 二元变量在统计学中广泛用于对某一类别或事件发生概率的建模,例如团队获胜概率、患者健康概率等,而其中,逻辑模型则自大约 1970年以来最常用的二元回归模型。<ref>{{Cite journal |last=Cramer |first=J.S. |date=2003 |title=The Origins of Logistic Regression |url=http://www.ssrn.com/abstract=360300 |journal=SSRN Electronic Journal |language=en |doi=10.2139/ssrn.360300 |issn=1556-5068}}</ref>当存在两个以上可能值(例如图像是否是猫、狗、狮子等)时,二元变量可以推广为分类变量,并且二元逻辑回归推广为多项逻辑回归。如果多个类别是有序的,则可以使用序数逻辑回归。逻辑回归模型本身只是简单地根据输入对输出概率进行建模,并不执行统计分类。<ref>{{Cite journal |last=Walker |first=Strother H. |last2=Duncan |first2=David B. |date=1967-06 |title=Estimation of the Probability of an Event as a Function of Several Independent Variables |url=https://www.jstor.org/stable/2333860?origin=crossref |journal=Biometrika |volume=54 |issue=1/2 |doi=10.2307/2333860}}</ref> == 例子 == 以一个例子说明逻辑回归如何解决实际问题: <blockquote> 一个小组20名学生,各自花费0~6小时准备考试,他们不同的学习时数如何影响通过考试的概率? </blockquote> 问题中的因变量是考试“通过”或者“挂科”,这是用逻辑回归的原因,虽然分别用“1”和“0”表示,但这两个数字不代表[[基数 (数学)|基数]]。如果问题发生变化,用0-100的成绩(基数)代替通过、挂科,则可以使用回归分析。 下表显示每个学生花费在学习上的小时数,以及他们通过(1)或挂科(0)。 {| class="wikitable" |- !小时(''x<sub>k</sub>'') | 0.50|| 0.75|| 1.00|| 1.25|| 1.50|| 1.75|| 1.75|| 2.00|| 2.25|| 2.50|| 2.75|| 3.00|| 3.25|| 3.50|| 4.00|| 4.25|| 4.50|| 4.75|| 5.00 || 5.50 |- !通过(''y<sub>k</sub>'') | 0|| 0|| 0|| 0|| 0|| 0|| 1|| 0|| 1|| 0|| 1|| 0|| 1|| 0|| 1|| 1|| 1|| 1|| 1|| 1 |} 对学习时间(''x<sub>k</sub>'')和测试结果(''y<sub>k</sub>'' = 1 表示通过,0 表示挂科)组成的数据进行拟合。数据点由下标k索引,该下标从1到20。x变量称为“[[自变量和因变量|自变量]]”,y变量称为“[[分类变量]]”,由“通过”或“失败”两个类别组成,分别对应于分类值1和0。 === 模型 === [[File:Exam pass logistic curve.svg|thumb|400px|拟合''x<sub>m</sub>'',''y<sub>m</sub>''数据的逻辑回归曲线图。该曲线显示了通过考试的概率与学习时间的关系]]{{回归侧栏}}逻辑函数形式为: :<math>p(x)=\frac{1}{1+e^{-(x-\mu)/s}}</math> 其中''μ''是位置参数(曲线的中点,其中<math>p(\mu)=1/2</math>),''s''是尺度参数。该式可重写为: :<math>p(x)=\frac{1}{1+e^{-(\beta_0+\beta_1 x)}}</math> <math>\beta_0 = -\mu/s</math>称为截距,是直线<math>y = \beta_0+\beta_1 x</math>的''y''截距。<math>\beta_1= 1/s</math>是反比例参数或速率参数,是作为"x"函数的对数发生率的"y"截距和斜率。反之,<math>\mu=-\beta_0/\beta_1</math>,并且<math>s=1/\beta_1</math>。 == 逻辑斯谛分布公式 == [[File:Logistisch.svg|thumb|right|300px|逻辑斯谛分布函数图像]] :<math> P(Y=1 | X=x) = \frac{ e^{x'\beta} }{1+ e^{x'\beta}}.</math> 其中参数<math>\beta</math>常用[[最大似然估計]]。 == IIA假设 == 全名為'''Independent and irrelevant alternatives'''假设,也称作'''IIA效应''',指Logit模型中的各个可选项是独立的。 === IIA假设示例 === 市场上有A,B,C三个商品相互竞争,分别占有市场份额:60%,30%和10%,三者比例为:6:3:1 一个新产品D引入市场,有能力占有20%的市场—— 如果满足IIA假设,各个产品独立作用,互不关联:新产品D占有20%的市场份额,剩下的80%在A、B、C之间按照6:3:1的比例瓜分,分别占有48%,24%和8%。 如果不满足IIA假设,比如新产品D跟产品B相似度高,则新产品D的[[CP值]]高而夺去产品B的部分市场(总份额的20%),則产品B剩余10%,而产品A和C的市场份额保持60%和10%不变。 === 满足IIA假设的优点 === * 可以获得每个个性化的选择集合的一致的[[参数估计]] * 各个类别的[[子集]]的一般化的[[估计]] * 大大节省时间 * 可选项数目很多的时候尤其如此 === IIA假设的检验 === ==== Hausman检验 ==== [[傑里·A·奧斯曼]]和[[丹尼爾·麥克法登]]提出的。 ==== 一般化模型的检验 ==== === IIA问题的解决方法 === {{机器学习导航栏}} ==== [[多项式Probit模型]] ==== ==== [[一般化极值模型]] ==== 可以将可选项间的[[相关性]]建模 ===== 巢式Logit模型 ===== 巢式(Nested)表示可选项被分作不同的组,组与组之间不相关,组内的可选项相关,相关程度用1-λ<sub>g</sub>来表示(1-λ<sub>g</sub>越大,相关程度越高) ===== 对偶组合Logit模型 ===== ===== 一般化分簇Logit模型 ===== ==== 混合Logit模型 ==== == 应用 == === 配體結合分析 === 配體結合分析的典型校准曲线是S形的,下边界(渐近线)靠近背景信号(非特异性结合),而上渐近线靠近最大的饱和响应。 四参数逻辑模型通常是拟合这种形状校准曲线的首选,可以准确描述测量信号值与分析物浓度之间的S形关系。当不对称性明显时会添加第五个参数,但可能会导致拟合算法变得不稳定。<ref>{{Cite journal |last=Findlay |first=John W. A. |last2=Dillard |first2=Robert F. |date=2007-06 |title=Appropriate calibration curve fitting in ligand binding assays |url=http://dx.doi.org/10.1208/aapsj0902029 |journal=The AAPS Journal |volume=9 |issue=2 |doi=10.1208/aapsj0902029 |issn=1550-7416}}</ref> == 二类评定模型(Binary Logit Model) == * 仅有两个可选项:V<sub>1n</sub>,V<sub>2n</sub> {| class="wikitable" !变量类型 !统计量 !组别比较 !回归模型 |- |numerical |mean |t-test/ANOVA |线性回归 |- |categorical |percentage |Chi-square test |逻辑斯谛回归 |- |persontime |KM estimates<br />(survival curves) |Log-rank test |比例风险回归 |} == 参考书目 == {{refbegin}} * Agresti, Alan: Categorical Data Analysis. New York: Wiley, 1990. * Amemiya, T., 1985, Advanced [[Econometrics]],Harvard University Press. * Hosmer, D. W. and S. Lemeshow: Applied logistic regression. New York; Chichester, Wiley, 2000. {{refend}} == 参见 == * [[多重变量分析]] == 外部链接 == * [http://ufldl.stanford.edu/tutorial/supervised/LogisticRegression/ UFLDL:Logistic回归] {{Wayback|url=http://ufldl.stanford.edu/tutorial/supervised/LogisticRegression/ |date=20200915155206 }} * [https://web.archive.org/web/20060914155939/http://luna.cas.usf.edu/~mbrannic/files/regression/Logistic.html 南佛羅里達大學Logistic回归課程] * [http://statpages.org/logistic.html 線上計算Logistic回归] {{Wayback|url=http://statpages.org/logistic.html |date=20160120181422 }} {{统计学}} == 参考 == [[Category:统计学]] [[Category:市场营销]] [[Category:社会学]] [[Category:心理学]] [[Category:生物学]] [[Category:回归分析]]
摘要:
请注意,您对Positive WiKi的所有贡献都可能被其他贡献者编辑,修改或删除。如果您不希望您的文字被任意修改和再散布,请不要提交。
您同时也要向我们保证您所提交的内容是您自己所作,或得自一个不受版权保护或相似自由的来源(参阅
Positive WiKi:版权
的细节)。
未经许可,请勿提交受版权保护的作品!
取消
编辑帮助
(在新窗口中打开)
本页使用的模板:
Template:.w
(
编辑
)
Template:Ambox
(
编辑
)
Template:Basepage subpage
(
编辑
)
Template:Category handler
(
编辑
)
Template:Category handler/blacklist
(
编辑
)
Template:Category handler/numbered
(
编辑
)
Template:Cite book
(
编辑
)
Template:Cite journal
(
编辑
)
Template:Column-count
(
编辑
)
Template:Column-width
(
编辑
)
Template:Error
(
编辑
)
Template:Expert
(
编辑
)
Template:Expert needed
(
编辑
)
Template:Hlist/styles.css
(
编辑
)
Template:Icon
(
编辑
)
Template:If pagename
(
编辑
)
Template:Internal link helper/en
(
编辑
)
Template:Lang-en
(
编辑
)
Template:Le
(
编辑
)
Template:Link-en
(
编辑
)
Template:Longitem
(
编辑
)
Template:Min
(
编辑
)
Template:Namespace detect
(
编辑
)
Template:Navbox
(
编辑
)
Template:Navbox subgroup
(
编辑
)
Template:Nobold
(
编辑
)
Template:NoteTA
(
编辑
)
Template:Portal-inline
(
编辑
)
Template:Refbegin
(
编辑
)
Template:Refend
(
编辑
)
Template:ReflistF
(
编辑
)
Template:ReflistH
(
编辑
)
Template:ReflistH/styles.css
(
编辑
)
Template:Sidebar
(
编辑
)
Template:Sidebar with collapsible lists
(
编辑
)
Template:Small
(
编辑
)
Template:Str find
(
编辑
)
Template:Str mid
(
编辑
)
Template:Str mid/core
(
编辑
)
Template:Tl
(
编辑
)
Template:Transclude
(
编辑
)
Template:Translink
(
编辑
)
Template:Trim
(
编辑
)
Template:Tsl
(
编辑
)
Template:Wayback
(
编辑
)
Template:When on basepage
(
编辑
)
Template:When pagename is
(
编辑
)
Template:WikidataLink
(
编辑
)
Template:Yesno
(
编辑
)
Template:•
(
编辑
)
Template:回归侧栏
(
编辑
)
Template:机器学习导航栏
(
编辑
)
Template:統計學
(
编辑
)
Module:Arguments
(
编辑
)
Module:CGroup/Math
(
编辑
)
Module:CGroup/core
(
编辑
)
Module:Category handler
(
编辑
)
Module:Category handler/blacklist
(
编辑
)
Module:Category handler/config
(
编辑
)
Module:Category handler/data
(
编辑
)
Module:Category handler/shared
(
编辑
)
Module:Citation/CS1
(
编辑
)
Module:Citation/CS1/COinS
(
编辑
)
Module:Citation/CS1/Configuration
(
编辑
)
Module:Citation/CS1/Date validation
(
编辑
)
Module:Citation/CS1/Error
(
编辑
)
Module:Citation/CS1/Identifiers
(
编辑
)
Module:Citation/CS1/Language
(
编辑
)
Module:Citation/CS1/Links
(
编辑
)
Module:Citation/CS1/People
(
编辑
)
Module:Citation/CS1/Utilities
(
编辑
)
Module:Citation/CS1/Whitelist
(
编辑
)
Module:Crc32lua
(
编辑
)
Module:Icon
(
编辑
)
Module:Icon/data
(
编辑
)
Module:Ilh
(
编辑
)
Module:Ilh/data
(
编辑
)
Module:Lan
(
编辑
)
Module:Lang
(
编辑
)
Module:Lang/ISO 639 synonyms
(
编辑
)
Module:Lang/data
(
编辑
)
Module:Language/data/iana languages
(
编辑
)
Module:Language/data/iana regions
(
编辑
)
Module:Language/data/iana scripts
(
编辑
)
Module:Language/data/iana suppressed scripts
(
编辑
)
Module:Language/data/iana variants
(
编辑
)
Module:Message box
(
编辑
)
Module:Message box/configuration
(
编辑
)
Module:Namespace detect/config
(
编辑
)
Module:Namespace detect/data
(
编辑
)
Module:Navbar
(
编辑
)
Module:Navbar/configuration
(
编辑
)
Module:Navbar/styles.css
(
编辑
)
Module:Navbox
(
编辑
)
Module:No globals
(
编辑
)
Module:NoteTA
(
编辑
)
Module:Portal
(
编辑
)
Module:Portal/images/aliases
(
编辑
)
Module:Portal/images/chinese
(
编辑
)
Module:Portal/images/other
(
编辑
)
Module:Sidebar
(
编辑
)
Module:Sidebar/configuration
(
编辑
)
Module:Sidebar/styles.css
(
编辑
)
Module:String
(
编辑
)
Module:Unicode data
(
编辑
)
Module:WikidataLink
(
编辑
)
Module:WikitextLC
(
编辑
)
Module:Yesno
(
编辑
)
导航菜单
个人工具
未登录
讨论
贡献
创建账号
登录
命名空间
页面
讨论
不转换
不转换
简体
繁體
大陆简体
香港繁體
澳門繁體
大马简体
新加坡简体
臺灣正體
查看
阅读
编辑
编辑源代码
查看历史
更多
搜索
导航
首页
最近更改
随机页面
MediaWiki帮助
工具
链入页面
相关更改
特殊页面
页面信息