臉上的痣圖解1.本站不該用戶上傳的文檔完整性,不預(yù)覽、不比對(duì)內(nèi)容而直接下載產(chǎn)生的問題本站不予受理。 第二章 相關(guān)分析; 社會(huì)上,許多現(xiàn)象之間也都有相互聯(lián)系,例如:身高與體重、教育程度和收入、學(xué)業(yè)成就和家庭、智商與父母智力等。在這些有關(guān)系的現(xiàn)象中,它們之間聯(lián)系的程度和性質(zhì)也各不相同。 本書第十章提出了兩總體的檢驗(yàn)及估計(jì)的問題,這意味著我們開始與雙變量統(tǒng)計(jì)方法打交道了。雙變量統(tǒng)計(jì)與單變量統(tǒng)計(jì)最大的不同之處是,客觀事物間的關(guān)聯(lián)性開始披露出來。這一章我們將把相關(guān)關(guān)系的討論深入下去,不僅要對(duì)相關(guān)關(guān)系的存在給出判斷,更要對(duì)相關(guān)關(guān)系的強(qiáng)度給出測量,同時(shí)要披露兩變量間的聯(lián)系,其內(nèi)容分為相關(guān)分析和回歸分析這兩個(gè)大的方面。 ;第一節(jié) 變量之間的相互關(guān)系; 2. 相關(guān)方向:正相關(guān)和負(fù)相關(guān) 所謂正相關(guān)關(guān)系是指一個(gè)變量的值增加時(shí),另一變 量的值也增加。例如,受教育水平越高找到高薪水工作的 機(jī)會(huì)也越大。而負(fù)相關(guān)關(guān)系是指一個(gè)變量的值增加時(shí),另 一變量的值卻減少。例如,受教育水平越高,理想子女?dāng)?shù) 目越少。要強(qiáng)調(diào)的是,只有定序以上測量層次的變量才分 析相關(guān)方向,因?yàn)橹挥羞@些變量的值有高低或多少之分。 至于定類變量,由于變量的值并無大小、高低之分,故定 類變量與其他變量相關(guān)時(shí)就沒有正負(fù)方向了。; 3. 關(guān)系與對(duì)稱關(guān)系 關(guān)系中兩個(gè)變量有自變量(independent Variable)和因變量(dependent Variable)之分: (1)兩個(gè)變量有共變關(guān)系; (2)因變量的變化是由自變量的變化引起的; (3)兩個(gè)變量的產(chǎn)生和變化有明確的時(shí)間順序,前者 稱為自變量,后者稱為因變量。 表現(xiàn)為對(duì)稱關(guān)系的相關(guān)關(guān)系,互為根據(jù),不能區(qū)分自 變量和因變量,或者說自變量和因變量可以根據(jù)研究目的 任意選定,例如身高和體重之間的關(guān)系。 ;4. 單相關(guān)和復(fù)相關(guān) 從變量的多少上看,單相關(guān)只涉及兩個(gè)變量,亦稱二元 相關(guān);三個(gè)或三個(gè)以上變量之間的關(guān)系稱為復(fù)相關(guān),亦稱多 元相關(guān)。 五、直線相關(guān)和曲線相關(guān) 從變量變化的形式上看,如果關(guān)系近似地表現(xiàn)為一條直 線,稱為直線相關(guān)或線性相關(guān);如果關(guān)系近似地表現(xiàn)為一條 曲線,則稱為曲線相關(guān)或稱為非線性相關(guān)。 由于數(shù)學(xué)手段的局限性,我們以學(xué)習(xí)線性相關(guān)為主。在 統(tǒng)計(jì)學(xué)中,通過分段處理線性相關(guān)也可以用于處理曲線相 關(guān)。;第二節(jié) 定類變量的相關(guān)分析;1. 列聯(lián)表 列聯(lián)表,是按品質(zhì)標(biāo)志把兩個(gè)變量的頻數(shù)分布進(jìn) 行交互分類,由于表內(nèi)的每一個(gè)頻數(shù)都需同時(shí)滿足兩個(gè) 變量的要求,所以列聯(lián)表又稱條件頻數(shù)表。 例如,某區(qū)調(diào)查了357名選民,考察受教育程度與投 票行為之間的關(guān)系,將所得資料作成下表,便是一種關(guān) 于頻數(shù)的列聯(lián)表。;2×2頻數(shù)分布列聯(lián)表的一般形式; r×c頻數(shù)分布列聯(lián)表的一般形式;自己志愿;兩個(gè)邊際分布: ; 條件頻數(shù)表中各頻數(shù)因基數(shù)不同不便作直接比較,因此有必要將頻數(shù)化成相對(duì)頻數(shù),使基數(shù)標(biāo)準(zhǔn)化。這樣,我們就從頻數(shù)分布的列聯(lián)表得到了相對(duì)頻數(shù)分布的列聯(lián)表(或稱頻率分布的列聯(lián)表)。下表是r×c相對(duì)頻數(shù)分布列聯(lián)表的一般形式。; r×c相對(duì)頻數(shù)分布列聯(lián)表的一般形式; 在相對(duì)頻數(shù)分布列聯(lián)表中,各數(shù)據(jù)為各分類 出現(xiàn)的相對(duì)頻數(shù)(或者頻率)。將頻數(shù) 化成相對(duì) 頻數(shù) 有兩種做法: ①相對(duì)頻數(shù)聯(lián)合分布 兩個(gè)邊際分布 或 ②相對(duì)頻數(shù)條件分布 或 ; r×c相對(duì)頻數(shù)聯(lián)合分布列聯(lián)表;控制X,Y相對(duì)頻數(shù)條件分布列聯(lián)表;控制Y,X相對(duì)頻數(shù)條件分布列聯(lián)表; [例A1]試把下表所示的頻數(shù)分布列聯(lián)表,轉(zhuǎn) 化為自變量受到控制的相對(duì)頻數(shù)條件分布列聯(lián) 表,并加以相關(guān)分析。 ; 從上表可知,受過大學(xué)以上教育的被調(diào)查者絕大多 數(shù)(占95.8%)是投票的,受教育程度在大學(xué)以下的被調(diào) 查者雖多數(shù)也參與投票(占67.9%),但后者參與投票的百 分比遠(yuǎn)小于前者;前者只有4.2%棄權(quán),而后者則有32.1% 棄權(quán)。兩相比較可知,受教育程度不同,參與投票的行 為不同,因此兩個(gè)變量是相關(guān)的。; [例A2]試把下表所示的頻數(shù)分布列聯(lián)表,轉(zhuǎn) 化為相對(duì)頻數(shù)條件分布列聯(lián)表和自變量受到控制 的相對(duì)頻數(shù)條件分布列聯(lián)表,并加以相關(guān)分析。 ; 上表顯示,大學(xué)以上文化程度和大學(xué)以下文化程度同樣 各有60%的人參與投票,40%的人棄權(quán),并沒有因?yàn)槭芙逃?程度不同,而使參與投票的行為有所不同。因此,此時(shí)的兩 個(gè)變量是不相關(guān)的,或者說是的。我們不難發(fā)現(xiàn),此時(shí) 反映全體投票情況的相對(duì)頻數(shù)的邊際分布( )也各有60% 的人參與投票,40%的人棄權(quán)。; 上表顯示,當(dāng)兩個(gè)變量不相關(guān)時(shí)有 。 如0.532× 0.40=0.213。; [例B]某社區(qū)調(diào)查了120名市民,考察性別與 對(duì)吸煙態(tài)度之間的關(guān)系,試將所得資料作成相對(duì) 頻數(shù)的聯(lián)合分布、邊際分布和條件分布列聯(lián)表, 并進(jìn)行相關(guān)分析。 性別與對(duì)吸煙的態(tài)度 ;相對(duì)頻數(shù)聯(lián)合分布列聯(lián)表 ;相對(duì)頻數(shù)條件分布列聯(lián)表 ;2675名雙親和他們10071個(gè)子女 的智力的關(guān)系(%)(相對(duì)頻數(shù)條件分布列聯(lián)表); 通過列聯(lián)表研究定類變量之間的關(guān)聯(lián)性,這 實(shí)際上是通過相對(duì)頻數(shù)條件分布的比較進(jìn)行的。 如果對(duì)不同的X,Y的相對(duì)頻數(shù)條件分布不同,且 和Y的相對(duì)頻數(shù)邊際分布不同,則兩變量之間是 相關(guān)的。而如果變量間是相互的話,必然存 在著Y的相對(duì)頻數(shù)條件分布相同,且和它的相對(duì) 頻數(shù)邊際分布相同。后者用數(shù)學(xué)式表示就是 或者 ;2. 削減誤差比例 PRE (Proportionate Reduction in Error) 通過相對(duì)頻數(shù)條件分布列聯(lián)表的討論,可以就自變量 X和因變量Y的關(guān)聯(lián)性給出一個(gè)初步的判斷。但是對(duì)關(guān)聯(lián) 性給出判斷,肯定沒有用量化指標(biāo)表達(dá)來得好。所以,下 面我們將關(guān)注于如何用統(tǒng)計(jì)方法,使相關(guān)關(guān)系的強(qiáng)弱可以 通過某些簡單的系數(shù)明確地表達(dá)出來。 在社會(huì)統(tǒng)計(jì)中,表達(dá)相關(guān)關(guān)系的強(qiáng)弱,削減誤差比 例的概念常有價(jià)值的。削減誤差比例的原理是,如果 兩變量間存在著一定的關(guān)聯(lián)性,那么知道這種關(guān)聯(lián)性,必 然有助于我們通過一個(gè)變量去預(yù)測另一變量。其中關(guān)系密 切者,在由一變量預(yù)測另一變量時(shí),盲目性必然較關(guān)系不 密切者為小。; PRE:用不知道Y與X有關(guān)系時(shí)預(yù)測Y的全部誤差E1,減去知道Y與X有關(guān)系時(shí)預(yù)測Y的聯(lián)系誤差E2,再將其化為比例來度量 PRE的取值范圍是 0≤PRE≤l 削減誤差比例PRE適用于各測量層次的變量,λ系數(shù)和τ系數(shù)便是在定類測量的層次上以削減誤差比例PRE為基礎(chǔ)所設(shè)計(jì)的兩種相關(guān)系數(shù)。 ; PRE=(56-28)/56=0.5;3. λ系數(shù) 在定類尺度上測量集中趨勢(shì)只能用眾數(shù)。 λ系數(shù)就是利用此性質(zhì)來構(gòu)造相關(guān)系數(shù)的。 (1)不對(duì)稱的λ系數(shù); [例] 對(duì)下表所示資料,用λ系數(shù)反映性別與收 入高低的相關(guān)關(guān)系。;鄧齊都耐酒斧滴疊削龍匹叫涪浚敗晤帚退緩茫乳坊蜂段澈師嘯蜘觸漂油駱統(tǒng)計(jì)學(xué) 相關(guān)分析課件統(tǒng)計(jì)學(xué) 相關(guān)分析課件;(2)對(duì)稱的λ系數(shù) ; [例] 研究工作類別與工作價(jià)值的關(guān)系,工 作類別可分為三類:工人、技術(shù)人員、管理/行 政人員;工作價(jià)值也可分為三類:以收入/福利 為最重要的職業(yè)選擇標(biāo)準(zhǔn)的稱為經(jīng)濟(jì)取向型,以 工作的創(chuàng)造性、挑戰(zhàn)性為最重要的職業(yè)選擇標(biāo)準(zhǔn) 的稱為成就取向型,以工作中的人際關(guān)系為最重 要的職業(yè)選擇標(biāo)準(zhǔn)的稱為人際關(guān)系取向型。對(duì)下 表所示資料,用λ系數(shù)反映工作類別與工作價(jià)值 的相關(guān)關(guān)系 。; 職工的工作種類與工作價(jià)值 ; ; 性質(zhì): (1)0≤λ≤1 (2)具有PRE意義。 (3)對(duì)稱與不對(duì)稱情況下,有不同的公式。 (4)以眾數(shù)作為預(yù)測的準(zhǔn)則,對(duì)條件頻數(shù)分 布列聯(lián)表中眾數(shù)頻數(shù)以外的條件頻數(shù)不予理會(huì)。 (5)如果眾數(shù)頻數(shù)集中在條件頻數(shù)分布列聯(lián) 表的同一行時(shí),λ=0,從而無法顯示兩變量之間 的相關(guān)性。 ;4.τ系數(shù) τ系數(shù)的統(tǒng)計(jì)值域是[0,1],其特點(diǎn)是在計(jì) 算時(shí)考慮所有的邊際頻數(shù)和條件頻數(shù) 。 注意:當(dāng)眾數(shù)很突出且眾數(shù)分布不在同一行,同一 列時(shí),用λ系數(shù)較好;但當(dāng)眾數(shù)不突出時(shí),用τ系數(shù)更 好;若眾數(shù)集中在某一行或某一列,一定用τ系數(shù)。; [例] 對(duì)下表所示資料,用τ系數(shù)反映性別與 收入高低的相關(guān)關(guān)系,并對(duì)系數(shù)的PRE意義加以 解釋。 ; ;: 調(diào)查100名青年人與其知心朋友的志愿,條 件次數(shù)分布如下:計(jì)算知心朋友的志愿與自己志 愿之間的相關(guān)關(guān)系,并提出研究結(jié)論。;第三節(jié) 定序變量的相關(guān)分析;1. 同序?qū)Α愋驅(qū)Α⑼謱?duì) 社會(huì)學(xué)研究常用的兩定序變量的相關(guān)測量 法,有一類是以同序?qū)Α愋驅(qū)Α⑼謱?duì)的概念 為基礎(chǔ)的,如Gamma系數(shù)、肯德爾系數(shù)、d系數(shù) 等。所以我們?cè)谟懻撨@幾種相關(guān)系數(shù)之前,先來 了解這三個(gè)概念。; 在定序相關(guān)測量中,首先要搞清楚“次序?qū)Γ╬air)”的概念。例如,假設(shè) 研究員工的工作滿足感與歸屬感的關(guān)系,將工作滿足感從低到高,分為低 (1)、中(2)和高(3)三個(gè)級(jí)別,歸屬感也從低到高分為低(1)、中 (2)和高(3)三個(gè)級(jí)別。下表列示的是5名被訪者A、B、C、D、E的情況。;同序?qū)?參見上表(注意,為了容易識(shí)別各種次序?qū)Γ摫硪?先將被訪者按定序變量X由低到高作了排列),在觀察X 序列時(shí)如果我們看到Xi< Xj ,在Y序列中看到的是Yi< Yj,則稱這一配對(duì)是同序?qū)ΑM驅(qū)χ灰骕變化方向和Y 變化方向相同,并不要求X變化大小和Y變化大小相等。 同序?qū)Φ目倲?shù)用符號(hào)ns表示。 異序?qū)?見上表,在觀察X序列時(shí)如果我們看到Xi< Xj ,在Y 序列中看到的是Yi > Yj,則稱這一配對(duì)是異序?qū)ΑM瑯樱?異序?qū)χ灰骕變化方向和Y變化方向相同,并不要求X變 化大小和Y變化大小相等。同序?qū)Φ目倲?shù)用符號(hào)nd表示。;同分對(duì) 如果在X序列中,我們觀察到Xi= Xj (此時(shí)在Y序列中 無Yi = Yj),則這個(gè)配對(duì)僅是X方向上而非Y 方向上的同分 對(duì);X 的這種同分對(duì)用符號(hào)nx表示。如果在Y 序列中,我 們觀察到Y(jié)i = Yj(此時(shí)在X序列中無Xi= Xj ),則這個(gè)配對(duì) 僅是Y 方向上而非X方向上的同分對(duì);Y 的這種同分對(duì)用符 號(hào)ny表示。如果我們觀察到 Xi= Xj時(shí),也觀察到Y(jié)i = Yj , 則稱這兩個(gè)配對(duì)為X與Y 同分對(duì),以符號(hào)nxy表示。X 同分對(duì) 的總數(shù)用符號(hào)Tx表示, Tx = nx + nxy ;Y 同分對(duì)的總數(shù)用 符號(hào)Ty表示, Ty = ny + nxy 。 n個(gè)單位兩兩配對(duì),總對(duì)數(shù)= ns + nd + nx + ny + nxy ; 計(jì)算Gamma系數(shù),肯得爾系數(shù)、 d系 數(shù)等,我們面對(duì)的經(jīng)常是兩定序變量已形 成列聯(lián)表的資料,所以對(duì)我們來說很重要 的是要學(xué)會(huì)定序變量列聯(lián)表中這五種“次序 對(duì)”的計(jì)算和識(shí)別。 同序?qū)Γ骸坝蚁掠嘧邮健狈?異序?qū)Γ骸白笙掠嘧邮健狈?;;2. Gamma系數(shù) 性質(zhì): (1)取值范圍[-1,1] (2)具有PRE意義 (3)屬對(duì)稱相關(guān)測量。 (4)不考慮同分對(duì)。; 例:在某市200戶中調(diào)查,看住戶人口密 度與婆媳沖突是否有關(guān),交互分類后分布如 下,計(jì)算G相關(guān)系數(shù)并提出研究結(jié)論。 ;3. 肯德爾等級(jí)相關(guān)系數(shù) (1)Tau-a 系數(shù) 適用于不存在任何同分對(duì)的情況。 ; 某市有12 所大專院校,現(xiàn)組織一個(gè)評(píng)審委員會(huì) 對(duì)各院校校園及學(xué)生體質(zhì)進(jìn)行評(píng)價(jià),評(píng)價(jià)結(jié)果 如表(表中已先將學(xué)校按X作了次序排列)所示, 試計(jì)算校園和學(xué)生體質(zhì)關(guān)系的肯德爾相關(guān)系 數(shù)。 ;(2)Tau-b系數(shù) 當(dāng)出現(xiàn)同分對(duì)時(shí),對(duì)分母進(jìn)行修正。與G系 數(shù)一樣, Tau-b系數(shù)也具有消減誤差比例的意 義。 Tau-b系數(shù)的特殊性在于,只有在列聯(lián)表的 行數(shù)與列數(shù)相同(r=c)的情況下,其系數(shù)值才 可能是-1或+1,否則便不確定。 ;(3)Tau-c系數(shù) 當(dāng)同分對(duì)很多時(shí),且r≠c ,可以用 Tau-c系數(shù)來測量。 m取r×c列聯(lián)表 中r和 c值較小者。 Tau-c系數(shù)沒有消減誤差比例的意義。 ;4. 薩默斯 (d系數(shù)) 薩默爾斯提出的,對(duì)G系數(shù)進(jìn)行修正。 d系數(shù)具有PRE意義,取值[-1,1],為不對(duì)稱測量。 ;5. Spearman等級(jí)相關(guān)系數(shù) 運(yùn)用上式計(jì)算等級(jí)相關(guān)系數(shù)很簡便:首先將定序變 量X和Y的數(shù)值形成對(duì)應(yīng)的兩個(gè)序數(shù)數(shù)列(其中先將X由小 到大排)。如遇有相等的數(shù)值時(shí),則應(yīng)將原有的等級(jí)求其 平均數(shù),讓它們以這平均等級(jí)并列。然后求出等級(jí)差, 經(jīng)平方后求和,運(yùn)用上式即可求得斯皮爾曼等級(jí)相關(guān)系 數(shù)。 例:為了解活動(dòng)能力與智商是否有關(guān),作了10名 同學(xué)的抽樣調(diào)查,資料如表,問這10名同學(xué)的智商與活 動(dòng)能力是否有關(guān)。;學(xué)生;6. 肯德爾和諧系數(shù) 前面我們談的都是對(duì)雙變量求等級(jí)相關(guān)系 數(shù)。對(duì)于多變量求等級(jí)相關(guān)系數(shù),如多個(gè)專家 對(duì)同一事物評(píng)價(jià)的一致性或相關(guān)程度的衡量, 肯德爾運(yùn)用數(shù)理分析方法,提出了一個(gè)計(jì)算公 式 ; 假設(shè)四位專家對(duì)10所大專院校質(zhì)量進(jìn)行排序, 有關(guān)評(píng)價(jià)結(jié)果列于下表中,試通過計(jì)算肯德爾和諧系 數(shù),檢驗(yàn)專家意見的一致性和相關(guān)程度。 ; 例:通過對(duì)1500多名青年作社會(huì)調(diào)查, 探討當(dāng)代青年擇業(yè)傾向與對(duì)社會(huì)經(jīng)濟(jì)生活 的基本態(tài)度,得資料如表,求等級(jí)相關(guān)系 數(shù)(當(dāng)代青年擇業(yè)傾向與他們對(duì)職業(yè)社會(huì) 地位的等級(jí)認(rèn)定的關(guān)系;擇業(yè)傾向與他們 對(duì)職業(yè)的富裕程度認(rèn)定的關(guān)系)。;職業(yè); 試就以下單元數(shù)據(jù),列舉其中的同序 對(duì)、異序?qū)Α⑼謱?duì)。 ; 根據(jù)交互分類表計(jì)算:ns、nd、 nx 、 ny 、 nxy 、 Tx 、 Ty 、 T(總對(duì)數(shù)) ; :1.在某地抽選469名已婚男人,研究他們對(duì)父 親的感情是否會(huì)影響他們對(duì)婚姻的適應(yīng)。試計(jì)算G系數(shù)并 提出研究結(jié)論。 丈夫與父親的感情對(duì)其婚姻適度之影響 ; 2. 以下是兩位評(píng)判員對(duì)10名參賽人員的打分 排序:試用一系數(shù)描述兩評(píng)判員打分相近程度。;第四節(jié) 定距變量的相關(guān)分析;1. 相關(guān)表和散點(diǎn)圖 相關(guān)表:經(jīng)整理后反映兩變量之間對(duì)應(yīng)關(guān)系的數(shù)據(jù)表。 散點(diǎn)圖:將相關(guān)表中各個(gè)有對(duì)應(yīng)關(guān)系的數(shù)據(jù)在直角坐標(biāo) 系上標(biāo)出來,就得到散點(diǎn)圖。散點(diǎn)圖可以直觀地觀察兩變 量之間對(duì)應(yīng)關(guān)系。;散點(diǎn)圖表示的相關(guān)的類型;2.積差系數(shù)的導(dǎo)出和計(jì)算 ; r是協(xié)方差與X和Y的標(biāo)準(zhǔn)差的乘積之比; 試就下表所示資料,計(jì)算關(guān)于員工的工齡 和技術(shù)考核分的皮爾遜相關(guān)系數(shù)。 ; N0;解:計(jì)算過程見上表 r= ;3 .積差系數(shù)的性質(zhì) (1) r 是線)適用于定距/定比變量。 (3)取值[-1,1],絕對(duì)值越大,相關(guān)程度越高。r 的 絕對(duì)值在0.3以下表示不相關(guān);0.3~0.5表示低度相關(guān); 0.5~0.8表示中等相關(guān);0.8以上表示高度相關(guān)。 (4)X與Y是對(duì)稱關(guān)系。 (5)相關(guān)系數(shù)的數(shù)值不受坐標(biāo)點(diǎn)變化的影響。 (6)r2具有PRE意義。 (7)r 公式中的兩個(gè)變量都是隨機(jī)的,因而改變兩者的并不影響r的數(shù)值。 ;注意事項(xiàng): (1)注意實(shí)際意義 進(jìn)行相關(guān)回歸分析要有實(shí)際意義,不可把毫無關(guān)系 的兩個(gè)事物或現(xiàn)象用來作相關(guān)回歸分析。例如,有人 說,孩子長,公園里的小樹也在長。求孩子和小樹之間 的相關(guān)關(guān)系就毫無意義,用孩子的身高推測小樹的高度 則更加。 (2)注意虛關(guān) 兩個(gè)事物間能計(jì)算出相關(guān)系數(shù),并不一定能證明事 物間有內(nèi)在聯(lián)系,例如,有人發(fā)現(xiàn),對(duì)于在校兒童,鞋 的大小與閱讀技能有很強(qiáng)的相關(guān)關(guān)系。然而,學(xué)會(huì)新詞 并不能使腳變大,而是涉及到第三個(gè)因素?? 年齡。當(dāng)兒 童長大一些,他們的閱讀能力會(huì)提高而且由于長大也穿 不下原來的鞋。; (3)利用散點(diǎn)圖 對(duì)于性質(zhì)不明確的兩組數(shù)據(jù),可先做散點(diǎn)圖,在圖 上看它們有無關(guān)系、關(guān)系的密切程度、是正相關(guān)還是負(fù) 相關(guān),是直線相關(guān)還是曲線相關(guān),然后再進(jìn)行相關(guān)分 析。 (4)注意變量范圍 相關(guān)分析和回歸方程僅適用于產(chǎn)生樣本的原始數(shù)據(jù) 范圍之內(nèi),出了這個(gè)范圍,兩變量的相關(guān)關(guān)系和回歸關(guān) 系不能就此得到說明。;第五節(jié) 回歸分析; 1. 線性回歸 線性回歸分析,一般是先依據(jù)相關(guān)表做出 散點(diǎn)圖,直觀地估計(jì)X和Y關(guān)聯(lián)性。如果兩變量 的確呈現(xiàn)出一定的線性相關(guān)趨勢(shì),便可以設(shè)所 要求的回歸直線方程為 是因變量Y的預(yù)測值或稱估計(jì)值。 回歸方程的建立: ① 先做散點(diǎn)圖;②利 用最小二乘法。; 運(yùn)用最小平方法可以在所有可能的直線中找到使 Q達(dá)到最小的回歸直線。 分別對(duì)a、b求偏導(dǎo)并令其為零,求得兩個(gè)標(biāo)準(zhǔn)方程:; 在回歸方程中,b有十分重要的意 義,被稱為回歸系數(shù)。b值的大小, 反映了X對(duì)Y有多大的影響,即b值就 是當(dāng)X增加一個(gè)單位時(shí)Y值的增量。 ; 例:為了研究受教育年限和職業(yè)聲望之間的關(guān)系,設(shè) 以下是8名社會(huì)抽樣調(diào)查的結(jié)果,求直線回歸方程。 解:;調(diào)查對(duì)象;X; 是r2而非r 具有PRE意義; 相關(guān)指數(shù)R,對(duì)于直線相關(guān)來說,等同于r, 即R=r。但對(duì)于非線性相關(guān)來說,就只能用相關(guān) 指數(shù)R來加以測量了。;總變差:不知回歸方程時(shí), 剩余變差:Y值對(duì)于回歸直線的偏差,。 回歸變差:回歸已知時(shí)誤差減少的量。 總變差 = 剩余變差 + 回歸變差 總平方和 = 未解釋的平方和 + 已解釋的平方和 SST = SSe + SSA r 2=(總變差 - 剩余變差)/總變差 =回歸變差/總變差 是r2而非r 具有PRE意義,所以r≤0.3時(shí)判定無相關(guān)。;第六節(jié) 曲線相關(guān)與回歸;估計(jì)標(biāo)準(zhǔn)誤差 為了測定回歸線的代表性,引入 用來反 映圍???回歸線的Y值分布的離散程度。又稱回歸 標(biāo)準(zhǔn)差。 ;估計(jì)標(biāo)準(zhǔn)誤差的解釋 (1)Y的實(shí)際觀測值在對(duì)應(yīng)的每個(gè)估計(jì)值YP 周圍呈正態(tài)分布,越靠近YP的地方Y(jié)值出現(xiàn)的機(jī) 會(huì)越多。 (2)所有的正態(tài)分布都具有相同的標(biāo)準(zhǔn)差: 同方差性。據(jù)此,可以對(duì)Y進(jìn)行估計(jì)和推斷。; :以下是生活期望值與個(gè)人成就的 抽樣調(diào)查。 求:相關(guān)系數(shù)和回歸直線。 請(qǐng)自覺遵守互聯(lián)網(wǎng)相關(guān)的政策法規(guī),嚴(yán)禁發(fā)布、、的言論。用戶名:驗(yàn)證碼:匿名?發(fā)表評(píng)論
|