You are on page 1of 282

ᒿ 䀰

ᵪಘᆖҐ䘉䰘ᆖ、ᡰ‫Ⲵ⌘ޣ‬䰞仈ᱟ˖䇑㇇ᵪ〻ᒿྲօ䲿⵰㓿傼〟㍟㠚ࣘᨀ儈ᙗ㜭˛䘁ᒤ
ᶕˈᵪಘᆖҐ㻛ᡀ࣏ൠᓄ⭘Ҿᖸཊ亶ฏˈӾỰ⍻ؑ⭘঑Ӕ᱃Ⅺ䇸Ⲵᮠᦞ᥆ᧈ〻ᒿˈࡠ㧧ਆ⭘
ᡧ䰵䈫‫ޤ‬䏓Ⲵؑ᚟䗷└㌫㔏ˈ޽ࡠ㜭൘儈䙏‫ޜ‬䐟к㠚ࣘ㹼傦Ⲵ⊭䖖DŽ਼ᰦˈ䘉њᆖ、Ⲵส⹰
⨶䇪઼㇇⌅ҏᴹҶ䟽བྷⲴ䘋ኅDŽ

䘉ᵜᮉᶀⲴⴞḷᱟኅ⧠ᵪಘᆖҐѝṨᗳⲴ㇇⌅઼⨶䇪DŽᵪಘᆖҐӾᖸཊᆖ、੨᭦Ҷᡀ᷌
઼ᾲᘥˈवᤜ㔏䇑ᆖǃӪᐕᲪ㜭ǃଢᆖǃؑ᚟䇪ǃ⭏⢙ᆖǃ䇔⸕、ᆖǃ䇑㇇༽ᵲᙗ઼᧗ࡦ䇪
ㅹDŽᡁ⴨ؑˈ⹄ウᵪಘᆖҐⲴᴰ֣䙄ᖴᱟӾ䘉Ӌᆖ、Ⲵ㿲⛩ⴻᖵᵪಘᆖҐˈᒦфԕ↔ᶕ⨶䀓
䰞仈Ⲵ㛼Ჟǃ㇇⌅ԕ৺ަѝ䳀ਜ਼Ⲵ‫ٷ‬ᇊDŽ䘉Ӌ൘ԕᖰᖸ䳮‫ˈࡠڊ‬ഐѪ൘䘉а亶ฏ㕪ቁवᇩᒯ
⌋Ⲵ৏࿻䍴ᯉDŽ䘉ᵜҖⲴѫ㾱ⴞⲴቡᱟᨀ‫׋‬䘉ṧⲴаԭ䍴ᯉDŽ

⭡Ҿ㍐ᶀⲴཊᆖ、ᙗˈ䘉ᵜҖн㾱≲䈫㘵ާᴹ⴨ᓄⲴ⸕䇶㛼Ჟˈ㘼ᱟ൘ᗵ㾱ᰦӻ㓽ަԆ
аӋᆖ、Ⲵสᵜᾲᘥˈྲ㔏䇑ᆖǃӪᐕᲪ㜭ǃؑ᚟䇪ㅹDŽӻ㓽Ⲵ䟽⛩ᱟоᵪಘᆖҐ‫ޣ‬㌫ᴰᇶ
࠷Ⲵ䛓ӋᾲᘥDŽᵜҖਟԕ֌Ѫ䇑㇇ᵪ、ᆖоᐕ〻ǃ㔏䇑ᆖ઼⽮Պ、ᆖㅹуъⲴབྷᆖ⭏ᡆ⹄ウ
⭏Ⲵᮉᶀˈҏਟ֌Ѫ䖟Ԧ⹄ウӪઈᡆӾъӪઈⲴ৲㘳DŽᤷሬ䘉ᵜҖ߉֌Ⲵєᶑ৏ࡉѪ˖1.
ᆳᱟ൘ṑབྷᆖ⭏ਟԕ⨶䀓Ⲵ˗2.ᆳᓄ䈕वਜ਼ঊ༛⭏൘ᔰ࿻⹄ウᵪಘᆖҐࡽ㾱ᦼᨑⲴ޵ᇩDŽ

ᤷሬ䘉ᵜҖ߉֌Ⲵㅜйᶑ৏ࡉᱟ˖ᆳᓄ䈕փ⧠⨶䇪઼ᇎ䐥є㘵Ⲵᒣ㺑DŽᵪಘᆖҐ⨶䇪㠤
࣋Ҿഎㆄ䘉ṧⲴ䰞仈ĀᆖҐᙗ㜭ᱟᘾṧ䲿⵰㔉ᇊⲴ䇝㓳ṧֻⲴᮠ䟿ਈॆⲴ˛ā઼ĀሩҾн਼
㊫රⲴᆖҐԫ࣑ˈଚњᆖҐ㇇⌅ᴰ䘲ਸ˛ā࡙⭘ᶕ㠚㔏䇑ᆖǃ䇑㇇༽ᵲᙗ઼䍍ਦᯟ࠶᷀Ⲵ⨶
䇪ᡀ᷌ˈ䘉ᵜҖ䇘䇪Ҷ䘉а㊫⨶䇪䰞仈DŽ਼ᰦᵜҖҏ㾶ⴆҶᖸཊᇎ䐥ᯩ䶒Ⲵ޵ᇩ˖ӻ㓽Ҷ䘉
а亶ฏⲴѫ㾱㇇⌅ˈᒦ䱀᰾Ҷ㇇⌅Ⲵ䘀㹼䗷〻DŽаӋ㇇⌅Ⲵᇎ⧠઼ᮠᦞਟԕ൘ӂ㚄㖁к䙊䗷
㖁൰ http://www.cs.cmu.edu/~tom/mlbook.html ᗇࡠDŽަѝवᤜ⭘ҾӪ㝨䇶࡛Ⲵ⾎㓿㖁㔌ǃ⭘
Ҿؑ䍧࠶᷀ⲴߣㆆṁᆖҐǃ৺࠶᷀᮷ᵜ᮷ẓⲴ䍍ਦᯟ࠶㊫ಘ਴㠚ⲴⓀԓ⸱઼ᡰ䴰ᮠᦞDŽᡁᖸ
ᝏ䉒䛓Ӌᑞࣙᡁࡋᔪ䘉Ӌ൘㓯䍴ⓀⲴ਼һˈवᤜ Jason RennieǃPaul HsiungǃJeff Shufeltǃ
Matt GlickmanǃScott DaviesǃJoseph O’SullivanǃKen LangǃAndrew McCallum ઼ Thorsten
JoachimsDŽ

㠤䉒

൘߉֌䘉ᵜҖⲴ䗷〻ѝˈᡁᒨ䘀ൠᗇࡠҶᵪಘᆖҐ亶ฏᖸཊᆖ、࠶᭟ⲴᢰᵟуᇦⲴᑞ
ࣙDŽ⋑ᴹԆԜⲴᑞࣙ䘉ᵜҖᱟнਟ㜭ᆼᡀⲴDŽᡁ␡␡ൠᝏ◰л䶒Ⲵ、ᆖᇦԜˈԆԜ㣡ᰦ䰤Ự
䰵ᵜҖⲴ㥹はˈᒦфԕԆԜ਴㠚亶ฏⲴу䮯ሩᡁ䘋㹼ҶᤷሬDŽ

˄ĂĂ˅

ᡁҏᖸᝏ䉒਴ᡰབྷᆖⲴᖸཊ䇢ᐸ઼ᆖ⭏ˈԆԜᇎൠ⍻䈅ҶᵜҖⲴᖸཊ㥹はᒦᨀࠪҶԆԜ
Ⲵᔪ䇞DŽቭ㇑⋑ᴹ䏣ཏⲴ⡸䶒ᶕᝏ䉒кⲮ਽Ⲵᆖ⭏ǃ䇢ᐸ઼ަԆ⍻䈅Ҷ㥹はⲴӪˈᡁ㾱ᝏ䉒
л䶒਴սˈᝏ䉒ԆԜ⢩࡛ᴹᑞࣙⲴᔪ䇞઼䇘䇪DŽ

˄ĂĂ˅
ᡁᝏ䉒 Joan Mitchell ᔪ・ҶᵜҖⲴ㍒ᕅDŽᡁҏᝏ䉒 Jean Harpley ᑞࣙ㕆䗁ҶᖸཊᨂമDŽ
ETP Harrison Ⲵ Jane Loftus ᑞࣙᮤ⨶ҶᵜҖⲴ᡻はDŽᡁⲴ㕆䗁ˈMcGraw Hill ࠪ⡸⽮Ⲵ Eric
Munson ൘亩ⴞⲴᮤњ䗷〻ѝᨀ‫׋‬Ҷ啃઼࣡᜿㿱DŽ

䙊ᑨˈањӪᴰ䈕ᝏ䉒ⲴᱟԆⲴ਼һǃᴻ৻઼ᇦᓝDŽሩҾᡁˈቔަ㾱㺘䗮㠚ᐡⲴᝏ◰DŽ
ᡁᖸ䳮ᜣ䊑ᴹӪ∄ᡁ൘ Carnegie Mellon ᤕᴹᴤྭⲴᲪ㘵Ӂ䳶Ⲵ⧟ຳ઼ᴤཊⲴ唾࣋⴨ࣙⲴᴻ
৻DŽ൘䘉Ӌᖸཊᑞࣙ䗷ᡁⲴӪᖃѝˈᡁ⢩࡛ᝏ䉒 Sebastian Thrunˈ൘䘉њ亩ⴞⲴ㠚࿻㠣㓸ˈ
Ԇаⴤሩᡁ䘋㹼⵰㋮⾎啃࣡ǃᢰᵟᤷሬㅹ਴⿽᭟ᤱDŽᡁⲴ⡦⇽ˈоԕᖰаṧⲴ啃࣡ᡁᒦ൘ᴰ
ᚠᖃⲴᰦ‫ى‬䰞Āᐢ㓿ᆼᡀҶੇ˛āᴰਾˈᡁаᇊ㾱ᝏ䉒ᡁⲴᇦӪ˖MeghanˈShannon ઼ JoanDŽ
ԆԜ൘н⸕н㿹ѝԕ਴⿽ᯩᔿሩ↔Җ֌ࠪҶ䍑⥞DŽ䘉ᵜҖᱟ⥞㔉ԆԜⲴDŽ

Tom M. Mitchell
ㅢ1ㄖ  㔠䇰

㠚Ӿ䇑㇇ᵪ㻛ਁ᰾ԕᶕˈӪԜቡᜣ⸕䚃ᆳԜ㜭н㜭ᆖҐDŽྲ᷌ᡁԜ⨶䀓Ҷ䇑㇇ᵪᆖҐⲴ
޵൘ᵪࡦˈণᘾṧ֯ᆳԜṩᦞ㓿傼ᶕ㠚ࣘᨀ儈ˈ䛓Ѹᖡ૽ሶᱟオࡽⲴDŽᜣ䊑алˈ൘ᵚᶕˈ
䇑㇇ᵪ㜭Ӿ५⯇䇠ᖅѝᆖҐˈ㧧ਆ⋫⯇ᯠ⯮⯵Ⲵᴰᴹ᭸ᯩ⌅˗տᆵ㇑⨶㌫㔏࠶᷀տᡧⲴ⭘⭥
⁑ᔿˈԕ䱽վ㜭Ⓚ⎸㙇˗њӪ䖟Ԧࣙ⨶䐏䑚⭘ᡧⲴ‫ޤ‬䏓ˈᒦѪަ䘹ᤙᴰᝏ‫ޤ‬䏓Ⲵ൘㓯ᯠ
䰫ĂĂDŽሩ䇑㇇ᵪᆖҐⲴᡀ࣏⨶䀓ሶᔰ䗏ࠪ‫ޘ‬ᯠⲴᓄ⭘亶ฏˈᒦ֯ަ䇑㇇㜭઼࣋ਟᇊࡦᙗк
ॷࡠᯠⲴቲ⅑DŽ਼ᰦˈ䘿ᖫൠ⨶䀓ᵪಘᆖҐⲴؑ᚟༴⨶㇇⌅ˈҏՊᴹࣙҾᴤྭൠ⨶䀓Ӫ㊫Ⲵ
ᆖҐ㜭࣋DŽ

ⴞࡽˈᡁԜ䘈н⸕䚃ᘾṧ֯䇑㇇ᵪⲴᆖҐ㜭઼࣋Ӫ㊫⴨ტ㖾DŽ❦㘼аӋ䪸ሩ⢩ᇊᆖҐԫ
࣑Ⲵ㇇⌅ᐢ㓿ӗ⭏DŽ‫ޣ‬ҾᆖҐⲴ⨶䇪䇔䇶ᐢᔰ࿻䙀↕ᖒᡀDŽӪԜᔰਁࠪҶᖸཊᇎ䐥ᙗⲴ䇑㇇
ᵪ〻ᒿᶕᇎ⧠н਼㊫රⲴᆖҐˈаӋ୶ъॆⲴᓄ⭘ҏᐢ㓿ࠪ⧠DŽֻྲሩҾ䈝丣䇶࡛䘉ṧⲴ䈮
仈ˈ㠣ӺѪ→ˈสҾᵪಘᆖҐⲴ㇇⌅᰾ᱮ㜌䗷ަԆⲴᯩ⌅DŽ൘ᮠᦞ᥆ᧈ亶ฏˈᵪಘᆖҐ㇇⌅
⨶ᡰᖃ❦ൠᗇࡠᓄ⭘ˈӾवਜ਼䇮༷㔤ᣔ䇠ᖅǃُ䍧⭣䈧ǃ䠁㶽Ӕ᱃ǃ५⯇䇠ᖅㅹ㊫լؑ᚟Ⲵ
བྷරᮠᦞᓃѝਁ⧠ᴹԧ٬Ⲵؑ᚟DŽ䲿⵰ሩ䇑㇇ᵪⲴ⨶䀓Ⲵᰕ⳺ᡀ⟏ˈᵪಘᆖҐᗵሶ൘䇑㇇ᵪ
、ᆖ઼ᢰᵟѝᢞ╄䎺ᶕ䎺䟽㾱Ⲵ䀂㢢ʽ

䙊䗷аӋ⢩ᇊⲴᡀቡᡁԜਟԕⴻࡠ䘉䰘ᢰᵟⲴ⧠⣦˖䇑㇇ᵪᐢ㓿㜭ཏᡀ࣏ൠ䇶࡛Ӫ㊫Ⲵ
䇢䈍˄Waibel 1989˗Lee 1989˅˗亴⍻㛪⚾ᛓ㘵Ⲵᓧ༽⦷˄Cooper et al. 1997˅˗Ự⍻ؑ⭘঑
Ⅺ䇸˗൘儈䙏‫ޜ‬䐟к傮傦˄Pomerleau 1989˅˗ԕ᧕䘁Ӫ㊫ц⭼ߐߋⲴ≤ᒣሩᔸ㾯⌻ৼ䱶ỻķ䘉
ṧⲴ⑨ᠿ˄Tesauro 1992, 1995˅DŽᐢᴹҶᖸཊ⨶䇪ᡀ᷌㜭ཏሩ䇝㓳ṧֻᮠ䟿ǃ‫ٷ‬䇮オ䰤བྷሿǃ
઼ᆖᗇ‫ٷ‬䇮䭉䈟⦷䘉й㘵䰤Ⲵสᵜ‫ޣ‬㌫䘋㹼࡫⭫DŽᡁԜ↓൘ᔰ࿻㧧ਆӪ㊫઼ࣘ⢙ᆖҐⲴ৏࿻
⁑රˈ⭘ԕ⨶䀓ᆳԜ઼䇑㇇ᵪⲴᆖҐ㇇⌅䰤Ⲵ‫ޣ‬㌫˄ֻྲˈLaird et al. 1986˗Anderson 1991˗
Qin et al. 1992˗Chi & Bassock 1989˗Ahn & Brewer 1993˅DŽ൘䗷৫Ⲵॱᒤѝᰐ䇪ᱟᓄ⭘ǃ㇇
⌅ǃ⨶䇪ˈ䘈ᱟ⭏⢙㌫㔏Ⲵ⹄ウ䜭ਆᗇҶ٬ᗇ⌘ⴞⲴ䘋↕DŽᵪಘᆖҐᴰ䘁Ⲵࠐ⿽ᓄ⭘㻛ᖂ㓣
൘㺘 1-1 ѝDŽLangley & Simon˄1995˅ԕ৺Rumelhart et al.˄1994˅䈳ḕҶᵪಘᆖҐⲴаӋ
ަԆᓄ⭘DŽ

㺘 1-1 ᵪಘᆖҐⲴаӋᡀ࣏ᓄ⭘

x ᆖҐ䇶࡛Ӫ㊫Ⲵ䇢䈍
ᡰᴹᴰᡀ࣏Ⲵ䈝丣䇶࡛㌫㔏䜭֯⭘ҶḀ⿽ᖒᔿⲴᵪಘᆖҐᢰᵟDŽֻྲˈSphinx ㌫㔏˄৲㿱
Lee 1989˅ਟᆖҐ⢩ᇊ䇢䈍㘵Ⲵ䈝丣䇶࡛ㆆ⮕ˈӾỰ⍻ࡠⲴ䈝丣ؑਧѝ䇶࡛ࠪสᵜⲴ丣㍐
˄phoneme˅઼অ䇽DŽ⾎㓿㖁㔌ᆖҐᯩ⌅ ˄ֻྲ Waibel et al. 1989˅઼䳀ᔿ傜ቄਟཛ⁑ර˄hidden
Markov model˅ⲴᆖҐᯩ⌅˄ֻྲ Lee 1989˅൘䈝丣䇶࡛㌫㔏ѝҏ䶎ᑨᴹ᭸ˈᆳԜਟԕ䇙㌫
㔏㠚ࣘ䘲ᓄн਼Ⲵ䇢䈍㘵ǃ䇽≷ǃ哖‫ݻ‬仾⢩ᙗ઼㛼Ჟಚ丣ㅹㅹDŽ㊫լⲴᢰᵟ൘ᖸཊؑਧ䀓
䟺䈮仈ѝᴹᓄ⭘▌࣋DŽ
x ᆖҐ傮傦䖖䖶

ķ
䈁⌘˖а⿽㊫լ伎㹼ỻⲴ⑨ᠿˈৼᯩ਴ᤱॱӄᆀˈ䙊䗷᧧僠ᆀᶕߣᇊỻᆀ〫ࣘⲴ↕ᮠDŽ
ᵪಘᆖҐᯩ⌅ᐢ㻛⭘Ҿ䇝㓳䇑㇇ᵪ᧗ࡦⲴ䖖䖶ˈ֯ަ൘਴⿽㊫රⲴ䚃䐟к↓⺞㹼傦DŽֻྲ
ALVINN ㌫㔏˄Pomerleau 1989˅ᐢ㓿࡙⭘ᆳᆖՊⲴㆆ⮕⤜㠚൘儈䙏‫ޜ‬䐟ⲴަԆ䖖䖶ѻ䰤྄
傠ˈԕ 70 㤡䟼Ⲵᰦ䙏‫ޡ‬㹼傦Ҷ 90 㤡䟼DŽ㊫լⲴᢰᵟਟ㜭൘ᖸཊสҾՐᝏಘⲴ᧗ࡦ䰞仈ѝ
ᗇࡠᓄ⭘DŽ
x ᆖҐ࠶㊫ᯠⲴཙ᮷㔃ᶴ
ᵪಘᆖҐᯩ⌅ᐢ㓿㻛⭘ҾӾ਴⿽བྷ㿴⁑Ⲵᮠᦞᓃѝਁ⧠䳀㯿Ⲵа㡜㿴ᖻDŽֻྲˈߣㆆṁᆖ
Ґ㇇⌅ᐢ㓿㻛㖾ഭഭᇦ㡚オ઼㡚ཙተ˄NASA˅⭘ᶕ࠶㊫ཙփˈᮠᦞᶕ㠚ㅜҼᑅ⍋傜ཙ᮷ਠ
ཚオ䈳ḕ˄Fayyad et al. 1995˅DŽ䘉а㌫㔏⧠൘㻛⭘Ҿ㠚ࣘ࠶㊫ཚオ䈳ḕѝⲴᡰᴹཙփˈަ
ѝवਜ਼Ҷ 3T ᆇ㢲Ⲵമ‫ۿ‬ᮠᦞDŽ
x ᆖҐԕц⭼㓗Ⲵ≤ᒣሩᔸ㾯⌻ৼ䱶ỻ
ᴰᡀ࣏Ⲵঊᔸ㊫˄ྲ㾯⌻ৼ䱶ỻ˅䇑㇇ᵪ〻ᒿᱟสҾᵪಘᆖҐ㇇⌅ⲴDŽֻྲˈц⭼ᴰྭⲴ
㾯⌻ৼ䱶ỻ〻ᒿ TD-Gammon˄Tesauro 1992, 1995˅ᱟ䙊䗷аⲮз⅑ԕкⲴ઼㠚ᐡሩᔸᶕᆖ
Ґަㆆ⮕ⲴDŽ⧠൘ᆳⲴ≤ᒣ㜭оӪ㊫Ⲵц⭼ߐߋ⴨ᖃDŽ㊫լⲴᢰᵟ㻛ᓄ⭘Ҿ䇨ཊᇎ䱵䰞仈ˈ
ަѝ䴰㾱儈᭸ൠᩌ㍒ᓎབྷⲴᩌ㍒オ䰤DŽ

ᵜҖ䪸ሩᵪಘᆖҐ䘉њ亶ฏˈ᧿䘠Ҷཊ⿽ᆖҐ㤳රǃ㇇⌅ǃ⨶䇪ԕ৺ᓄ⭘DŽᵪಘᆖҐӾ
ᵜ䍘кᱟањཊᆖ、Ⲵ亶ฏDŽᆳ੨ਆҶӪᐕᲪ㜭ǃᾲ⦷㔏䇑ǃ䇑㇇༽ᵲᙗ⨶䇪ǃ᧗ࡦ䇪ǃؑ
᚟䇪ǃଢᆖǃ⭏⨶ᆖǃ⾎㓿⭏⢙ᆖㅹᆖ、Ⲵᡀ᷌DŽ㺘 1-2 ᖂ㓣Ҷ䘉Ӌᆖ、ѝᖡ૽ᵪಘᆖҐⲴ
‫ޣ‬䭞ᙍᜣDŽᵜҖⲴ㍐ᶀสҾн਼ᆖ、Ⲵᡀ᷌ˈ❦㘼䈫㘵нᗵ㋮䙊⇿ањᆖ、DŽᶕ㠚䘉Ӌᆖ、
Ⲵ‫ޣ‬䭞⨶䇪ሶ֯⭘䶎уъⲴ䇽≷䇢䀓ˈަѝн⟏ᚹⲴᵟ䈝઼ᾲᘥՊ൘䴰㾱ᰦ࣐ԕӻ㓽DŽ

㺘 1-2 аӋᆖ、઼ᆳԜሩᵪಘᆖҐⲴᖡ૽

x ӪᐕᲪ㜭
ᆖҐᾲᘥⲴㅖਧ㺘⽪DŽ֌Ѫᩌ㍒䰞仈ⲴᵪಘᆖҐDŽ֌Ѫᨀ儈䰞仈≲䀓㜭࣋䙄ᖴⲴᆖҐDŽ֯
⭘‫ݸ‬傼Ⲵ⸕䇶઼䇝㓳ᮠᦞа䎧ᕅሬᆖҐDŽ
x 䍍ਦᯟᯩ⌅
֌Ѫ䇑㇇‫ٷ‬䇮ᾲ⦷Ⲵส⹰Ⲵ䍍ਦᯟ⌅ࡉDŽᵤ㍐䍍ਦᯟ࠶㊫ಘDŽՠ䇑ᵚ㿲⍻ࡠਈ䟿Ⲵ٬Ⲵ㇇
⌅DŽ
x 䇑㇇༽ᵲᙗ⨶䇪
н਼ᆖҐԫ࣑ѝപᴹⲴ༽ᵲᙗⲴ⨶䇪䗩⭼ˈԕ䇑㇇䟿ǃ䇝㓳ṧֻᮠ䟿ǃࠪ䭉ᮠ䟿ㅹ㺑䟿DŽ
x ᧗ࡦ䇪
ѪҶՈॆ亴ᇊⴞḷˈᆖҐሩ਴⿽༴⨶䗷〻䘋㹼᧗ࡦˈᆖҐ亴⍻㻛᧗ࡦⲴ䗷〻Ⲵлањ⣦ᘱDŽ
x ؑ᚟䇪
⟥઼ؑ᚟޵ᇩⲴᓖ䟿DŽᆖҐⲴᴰሿ᧿䘠䮯ᓖᯩ⌅DŽ㕆⸱‫ٷ‬䇮ᰦˈᆳⲴᴰ֣㕆⸱઼оᴰ֣䇝
㓳ᒿࡇⲴ‫ޣ‬㌫DŽ
x ଢᆖ
Āྕൾ࿶Ⲵࡳ࠰ā˄Occam’s razor˅ķ˖ᴰㆰঅⲴ‫ٷ‬䇮ᱟᴰྭⲴDŽӾ㿲ሏࡠⲴᮠᦞ⌋ॆⲴ⨶
⭡࠶᷀DŽ
x ᗳ⨶ᆖ઼⾎㓿⭏⢙ᆖ
ᇎ䐥Ⲵᑲᇊᖻ˄power law of practice˅ˈ䈕ᇊᖻᤷࠪሩҾᖸབྷ㤳ത޵ⲴᆖҐ䰞仈ˈӪԜⲴ৽
ᓄ䙏ᓖ䲿⵰ᇎ䐥⅑ᮠⲴᑲ㓗ᨀ儈DŽ◰ਁӪᐕ⾎㓿㖁㔌ⲴᆖҐ⁑ᔿⲴ⾎㓿⭏⢙ᆖ⹄ウDŽ
x 㔏䇑ᆖ

ķ
䈁⌘˖ҏ〠Ā੍ஜᖻ˄Law of Parsimony’āᡆĀ㢲㓖ᖻ˄Law of Economy˅āˈѫ㾱ᙍᜣѪㆰঅⲴ⨶䇪
˄ᡆ‫ٷ‬䇮˅ՈҾ༽ᵲⲴˈഐ㤡ഭଢᆖᇦྕൾ࿶˄1285~1349˅仁㑱֯⭘䘉а৏ࡉˈ᭵〠ѪĀྕൾ࿶ࡳ࠰āDŽ
൘ՠ䇑ᴹ䲀ᮠᦞṧᵜкⲴ‫ٷ‬䇮㋮ᓖᰦࠪ⧠Ⲵ䈟ᐞ˄ֻྲ‫ٿ‬ᐞ઼ᯩᐞ˅Ⲵ࡫⭫DŽ㖞ؑ४䰤ˈ
㔏䇑Ự傼DŽ

1.1 ᆜҖ䰤从Ⲻḽ߼ᨅ䘦

䇙ᡁԜӾࠐњᇎ䱵ⲴᆖҐԫ࣑ᔰ࿻⹄ウᵪಘᆖҐDŽṩᦞᵜҖⲴⴞⲴˈᡁԜ㔉ᆖҐањᇭ
ᒯⲴᇊѹˈԕ֯ަवᤜԫօ䇑㇇ᵪ〻ᒿ䙊䗷㓿傼ᶕᨀ儈Ḁԫ࣑༴⨶ᙗ㜭Ⲵ㹼ѪDŽᴤ߶⺞ൠ䇢ˈ

//࡙⭘㓿傼᭩ழ㌫㔏㠚䓛Ⲵᙗ㜭//

ᇐѿφ 对于某类任务 T 和性能度量 P,如果一个计算机程序在 T(任务)上以 P(性


能标准)衡量的性能随着经验 E 而自我完善,那么我们称这个计算机程序在从经验 E
学习。

ֻྲˈሩҾᆖҐл㾯⌻䐣ỻķⲴ䇑㇇ᵪ〻ᒿˈᆳਟԕ䙊䗷઼㠚ᐡлỻ㧧ਆ㓿傼ˈᆳᣵ䍏
Ⲵԫ࣑ᱟ৲о㾯⌻䐣ỻሩᔸˈᆳⲴᙗ㜭⭘ᆳ䎒ỻⲴ㜭࣋ᶕ㺑䟿DŽ䙊ᑨˈѪҶᖸྭൠᇊѹањ
ᆖҐ䰞仈ˈᡁԜᗵ享᰾⺞䘉ṧйњ⢩ᖱ˖ԫ࣑Ⲵ⿽㊫˗㺑䟿ԫ࣑ᨀ儈Ⲵḷ߶˗㓿傼ⲴᶕⓀDŽ

㾯⌻䐣ỻᆖҐ䰞仈˖
x ԫ࣑ T˖л㾯⌻䐣ỻ
x ᙗ㜭ḷ߶ P˖∄䎋ѝࠫ䍕ሩ᡻ⲴⲮ࠶∄
x 䇝㓳㓿傼 E˖઼㠚ᐡ䘋㹼ሩᔸ

ᡁԜਟԕ⭘ԕкᯩ⌅ᇊѹᖸཊᆖҐ䰞仈ˈֻྲᆖҐ᡻߉䇶࡛ǃᆖҐ㠚ࣘ傮傦ᵪಘӪ⊭䖖DŽ

᡻߉䇶࡛ᆖҐ䰞仈˖
x ԫ࣑ T˖䇶઼࡛࠶㊫മ‫ۿ‬ѝⲴ᡻߉᮷ᆇ
x ᙗ㜭ḷ߶ P˖࠶㊫Ⲵ↓⺞⦷
x 䇝㓳㓿傼 E˖ᐢ⸕࠶㊫Ⲵ᡻߉᮷ᆇᮠᦞᓃ

ᵪಘӪ傮傦ᆖҐ䰞仈˖
x ԫ࣑ T˖䙊䗷㿶㿹Րᝏಘ൘ഋ䖖䚃儈䙏‫ޜ‬䐟к傮傦

ķ
䈁⌘˖ѪҶᴤྭ⨶䀓ᵜֻˈл䶒ㆰ㾱ӻ㓽ал䘉⿽䐣ỻDŽỻⴈѪ 8h8 ᯩṬˈ␡㢢ỻṬнਟ⵰ᆀDŽਟঅ
↕㹼䎠ˈӖਟ⇿↕䐘ሩᯩаᆀঅ䐣ᡆ䘎䐣ˈ㻛䐘䎺Ⲵᆀ㻛ᵰࠪተDŽࡠ䗮ሩᯩᓅ㓯ⲴᆀᡀѪ⦻ˈਟഎੁ㹼䎠
˄ᡀѪ⦻ࡽਚਟࡽ㹼˅ˈ৸ਟ䳄オṬ伎㹼DŽлമѪ㾯⌻䐣ỻỻⴈ⽪ֻ˄䎧࿻⣦ᘱ˅DŽ
x ᙗ㜭ḷ߶ P˖ᒣ൷ᰐᐞ䭉㹼傦䟼〻˄ᐞ䭉⭡Ӫ㊫Ⲵⴁⶓ㻱ᇊ˅
x 䇝㓳㓿傼 E˖⌘㿶Ӫ㊫傮傦ᰦᖅࡦⲴа㌫ࡇമ‫઼ۿ‬傮傦ᤷԔ

䘉䟼ሩᆖҐⲴᇊѹᖸᇭᒯˈ䏣ԕवᤜབྷཊᮠᜟҾ㻛〠ѪĀᆖҐāⲴԫ࣑ˈቡ‫ۿ‬ᡁԜᰕᑨ
֯⭘Ⲵ䘉њ䇽аṧDŽ਼ᰦˈᆳҏवᤜҶԕ䶎ᑨㆰ᰾Ⲵᯩᔿ䙊䗷㓿傼㠚ᡁᨀ儈Ⲵ䇑㇇ᵪ〻ᒿDŽ
ֻྲˈањ‫ݱ‬䇨⭘ᡧᴤᯠᮠᦞᶑⴞⲴᮠᦞᓃ㌫㔏ˈҏㅖਸᡁԜሩᆖҐ㌫㔏Ⲵᇊѹ˖ᆳṩᦞӾ
ᮠᦞᓃᴤᯠᗇࡠⲴ㓿傼ᨀ儈ᆳഎㆄᮠᦞḕ䈒Ⲵ㜭࣋DŽоަᣵᗳ䘉⿽㹼ѪоĀᆖҐā䘉њ䇽ᰕ
ᑨ䈸䇪Ⲵ䶎↓ᔿਜ਼ѹ⴨␧⏶ˈᡁԜ㍒ᙗㆰঅൠ䟷⭘ᡁԜⲴ、ᢰරᇊѹüüа㊫䇑㇇ᵪ〻ᒿ䙊
䗷㓿傼ᨀ儈Ⲵ䗷〻DŽ൘䘉њ㤳⮤޵ˈᡁԜՊਁ⧠ᖸཊ䰞仈ᡆཊᡆቁ䴰㾱䖳༽ᵲⲴ䀓ߣ࣎⌅DŽ
䘉䟼ᡁԜᒦ䶎㾱࠶᷀ĀᆖҐā䘉њঅ䇽Ⲵᰕᑨਜ਼ѹDŽ㘼ᱟ㾱㋮⺞ൠᇊѹа㊫೺ᤜᡁԜᝏ‫ޤ‬䏓
ⲴᆖҐᖒᔿⲴ䰞仈ˈ᧒㍒䀓ߣ䘉㊫䰞仈Ⲵᯩ⌅ˈᒦ⨶䀓ᆖҐ䰞仈Ⲵส⹰㔃ᶴ઼䗷〻DŽ

1.2 䇴䇗жѠᆜҖ㌱㔕

ѪҶ╄⽪аӋᵪಘᆖҐⲴสᵜ䇮䇑ᯩ⌅઼䙄ᖴˈ㘳㲁䇮䇑ањᆖҐл㾯⌻䐣ỻⲴ〻ᒿDŽ
ᡁԜⲴⴞḷᱟ䇙ᆳ䘋‫ޕ‬㾯⌻䐣ỻц⭼䭖ḷ䎋DŽᡁԜ䟷⭘ᴰᱮ㘼᱃㿱Ⲵḷ߶㺑䟿ᆳⲴᙗ㜭˖൘
ц⭼䭖ḷ䎋кᢃ䎒Ⲵ∄䎋ঐᙫ৲䎋⅑ᮠⲴⲮ࠶∄DŽ

1.2.1 䘿᤟䇣㓹ᯯᕅ

ᡁԜ䶒ѤⲴㅜањ䇮䇑䰞仈ᱟ䘹ਆ䇝㓳㓿傼Ⲵ㊫රˈ֯㌫㔏Ӿѝ䘋㹼ᆖҐDŽ㔉ᆖҐಘᨀ
‫Ⲵ׋‬䇝㓳㓿傼ሩᆳⲴᡀ䍕ᴹ䟽བྷⲴᖡ૽DŽањ‫ޣ‬䭞኎ᙗᱟ䇝㓳㓿傼㜭੖Ѫ㌫㔏Ⲵߣㆆᨀ‫ⴤ׋‬
᧕ᡆ䰤᧕Ⲵ৽侸DŽֻྲˈሩҾᆖҐл㾯⌻䐣ỻˈ㌫㔏ਟԕӾⴤ᧕Ⲵ˄direct˅䇝㓳ṧֻˈণ
਴⿽ỻⴈ⣦ᘱ઼⴨ᓄⲴ↓⺞䎠ᆀѝᆖҐDŽਖа⿽ᛵߥˈᆳਟ㜭ӵᴹ䰤᧕˄indirect˅Ⲵؑ᚟ˈ
वਜ਼ᖸཊ䗷৫Ⲵሩᔸᒿࡇ઼ᴰ㓸㔃ተDŽሩҾਾа⿽ᛵߥˈ‫ޣ‬Ҿঊᔸѝ䖳ᰙ䎠ᆀⲴ↓⺞ᙗᗵ享
Ӿሩᔸᴰ㓸Ⲵ䗃䎒ᶕ᧘ᯝDŽ䘉ᰦᆖҐಘ৸仍ཆ䶒Ѥањؑ⭘࠶䝽˄credit assignment˅䰞仈ˈ
ҏቡᱟ㘳㲁⇿а⅑䎠ᆀሩᴰ㓸㔃᷌Ⲵ䍑⥞〻ᓖDŽؑ⭘࠶䝽ਟ㜭ᱟањ䶎ᑨ䳮ԕ䀓ߣⲴ䰞仈ˈ
ഐѪྲ᷌ਾ䶒лᗇᖸᐞˈ䛓Ѹণ֯䎧ࡍⲴ䎠ᆀᱟᴰ֣Ⲵˈ䘉ⴈỻҏՊ䗃ᦹDŽᡰԕ䙊ᑨӾⴤ᧕
Ⲵ䇝㓳৽侸ᶕᆖҐ∄䰤᧕ⲴㆰঅDŽ

䇝㓳㓿傼ⲴㅜҼњ䟽㾱኎ᙗᱟᆖҐಘਟԕ൘ཊབྷ〻ᓖк᧗ࡦ䇝㓳ṧֻᒿࡇDŽֻྲˈᆖҐ
ಘਟ㜭‫׍‬䎆ᯭᮉ㘵䘹ਆỻⴈ⣦ᘱˈ઼ᨀ‫⇿׋‬а⅑Ⲵ↓⺞〫ࣘDŽᡆ㘵ˈᆖҐಘਟ㜭㠚ᐡᨀࠪᆳ
䇔Ѫ⢩࡛ഠᜁⲴỻተᒦੁᯭᮉ㘵䈒䰞↓⺞Ⲵ䎠ᆀDŽᡆ㘵ˈᆖҐಘਟԕᆼ‫ࡦ᧗ޘ‬ỻተ઼˄䰤᧕
Ⲵ˅䇝㓳࠶㊫ˈቡ‫⋑ۿ‬ᴹᯭᮉ㘵ᰦᆳ઼㠚ᐡሩᔸ䘋㹼ᆖҐаṧDŽ⌘᜿ሩҾᴰਾа⿽ᛵߥᆖҐ
ಘਟ㜭䘹ᤙԕлє⿽ᛵߥѝⲴа⿽˖ㅜаˈ䈅傼ᆳ䘈ᵚ㘳㲁䗷Ⲵ‫ޘ‬ᯠỻተ˗ㅜҼˈ൘ᆳⴞࡽ
ਁ⧠Ⲵᴰཿ᭸Ⲵ䐟㓯Ⲵᗞሿਈॆкሩᔸˈԕ⼘⹪ᆳⲴᢰ㜭DŽਾ㔝Ⲵㄐ㢲㘳㲁аӋᆖҐṶᷦˈ
वᤜҶԕлࠐ⿽ᛵߥ˖䇝㓳㓿傼ᱟԕ䎵ѾᆖҐಘ᧗ࡦⲴ䲿ᵪ䗷〻ᨀ‫˗Ⲵ׋‬ᆖҐಘਟੁᯭᮉ㘵
ᨀࠪн਼㊫රⲴḕ䈒˗ԕ৺ᆖҐಘ䙊䗷㠚ࣘ᧒㍒⧟ຳᶕᩌ䳶䇝㓳ṧֻDŽ

䇝㓳㓿傼Ⲵㅜйњ䟽㾱኎ᙗᱟˈ䇝㓳ṧֻⲴ࠶ᐳ㜭ཊྭൠ㺘⽪ᇎֻ࠶ᐳˈ㘼ᴰ㓸㌫㔏Ⲵ
ᙗ㜭 P ᱟ䙊䗷ਾ㘵ᶕ㺑䟿ⲴDŽа㡜㘼䀰ˈᖃ䇝㓳ṧֻⲴ࠶ᐳ઼ሶᶕⲴ⍻䈅ṧֻⲴ࠶ᐳ⴨լ
ᰦˈᆖҐާᴹᴰབྷⲴਟؑᓖDŽሩҾᡁԜⲴ㾯⌻䐣ỻᆖҐˈᙗ㜭ᤷḷ P ᱟ䈕㌫㔏൘ц⭼䭖ḷ
䎋к䎒ỻⲴⲮ࠶∄DŽྲ᷌ᆳⲴ䇝㓳㓿傼 E ӵ⭡઼ᆳ㠚ᐡሩᔸⲴ䇝㓳㓴ᡀˈ‫ׯ‬ᆈ൘ањ᰾ᱮ
Ⲵড䲙˖䘉њ䇝㓳ਟ㜭н㜭‫࠶ݵ‬ൠ㺘⽪䈕㌫㔏ԕਾ㻛⍻䈅ᰦⲴᛵᖒDŽֻྲˈᆖҐಘਟ㜭൘䇝
㓳ѝӾᶕᵚ䙷ࡠ䗷ḀӋ䶎ᑨ‫ޣ‬䭞ᙗⲴỻተˈ㘼ᆳԜ৸䶎ᑨਟ㜭㻛Ӫ㊫ц⭼ߐߋ䟷⭘DŽᇎ䱵кˈ
ᆖҐⲴṧֻ䙊ᑨоᴰ㓸㌫㔏㻛䇴ՠᰦⲴṧֻᴹаᇊᐞᔲˈᆖҐಘᗵ享㜭Ӿѝ䘋㹼ᆖҐ˄Ѯֻ
ᶕ䈤ˈц⭼㓗Ⲵ㾯⌻䐣ỻߐߋਟ㜭нՊᴹ‫ޤ‬䏓ᮉањ〻ᒿлỻ˅DŽ䘉Ⲵ⺞ᱟањ䰞仈ˈഐѪ
ᦼᨑҶṧֻⲴа⿽࠶ᐳˈнаᇊՊሬ㠤ሩަԆⲴ࠶ᐳҏᴹྭⲴᙗ㜭DŽਟԕⴻࡠˈⴞࡽཊᮠᵪ
ಘᆖҐ⨶䇪䜭ᱟสҾ䇝㓳ṧֻо⍻䈅ṧֻ࠶ᐳа㠤䘉аࡽᨀDŽቭ㇑ᡁԜ䴰㾱䘉ṧⲴࡽᨀԕ‫ׯ‬
ᗇࡠ⨶䇪Ⲵ㔃᷌ˈն਼ṧᗵ享䇠տ൘ᇎ䐥ѝ䘉њ‫ٷ‬䇮㓿ᑨᱟнѕṬᡀ・ⲴDŽ

л䶒㔗㔝䘋㹼㇇⌅䇮䇑ˈᡁԜߣᇊ㌫㔏ሶ䙊䗷઼㠚ᐡሩᔸᶕ䇝㓳DŽ䘉ṧⲴྭ༴ᱟн䴰㾱
ཆ⭼Ⲵ䇝㓳㘵ˈᡰԕਟԕ䇙㌫㔏ӗ⭏ᰐ䲀ཊⲴ䇝㓳ᮠᦞˈਚ㾱ᰦ䰤‫ݱ‬䇨DŽ⧠൘ᴹҶањᆼᮤ
ⲴᆖҐԫ࣑DŽ

㾯⌻䐣ỻᆖҐ䰞仈˖
x ԫ࣑ T˖л㾯⌻䐣ỻ
x ᙗ㜭ḷ߶ P˖ц⭼䭖ḷ䎋кࠫ䍕ሩ᡻ⲴⲮ࠶∄
x 䇝㓳㓿傼 E˖઼㠚ᐡ䘋㹼ሩᔸ

ѪҶᆼᡀ䘉њᆖҐ㌫㔏Ⲵ䇮䇑ˈ⧠൘䴰㾱䘹ᤙ˖
1. 㾱ᆖҐⲴ⸕䇶Ⲵ⺞࠷㊫ර
2. ሩҾ䘉њⴞḷ⸕䇶Ⲵ㺘⽪
3. а⿽ᆖҐᵪࡦ

1.2.2 䘿᤟ⴤḽ࠳ᮦ

лањ䇮䇑䘹ᤙᱟߣᇊ㾱ᆖҐⲴ⸕䇶Ⲵ⺞࠷㊫රˈԕ৺ᢗ㹼〻ᒿᘾṧ֯⭘䘉Ӌ⸕䇶DŽᡁ
ԜӾањሩҾԫօỻተ䜭㜭ӗ⭏ਸ⌅˄legal˅䎠ᆀⲴ㾯⌻䐣ỻঊᔸ〻ᒿᔰ࿻DŽ䛓Ѹˈᴰ㓸Ⲵ
〻ᒿӵ享ᆖՊӾ䘉Ӌਸ⌅Ⲵ䎠ᆀѝ䘹ᤙᴰ֣ⲴDŽ䘉њᆖҐԫ࣑ԓ㺘Ҷаབྷ㊫ԫ࣑˖ਸ⌅䎠ᆀ
ᇊѹҶḀњ‫ݸ‬傼ᐢ⸕Ⲵᐘབྷᩌ㍒オ䰤ˈնᴰ֣Ⲵᩌ㍒ㆆ⮕ᵚ⸕DŽᖸཊᴰՈॆ䰞仈䜭ਟᖂҾ↔
㊫ˈֻྲሩҾ⭏ӗ䗷〻Ⲵ䈳ᓖ઼᧗ࡦ䰞仈ˈ⭏ӗѝⲴ⇿а↕䜭ᖸ␵ᾊˈն䈳ᓖ䘉Ӌ↕僔Ⲵᴰ
֣ㆆ⮕ᵚ⸕DŽ

ѪҶᆖҐӾਸ⌅䎠ᆀѝ֌ࠪ䘹ᤙˈᖸ᰾ᱮˈ㾱ᆖҐⲴؑ᚟㊫රቡᱟањ〻ᒿᡆ࠭ᮠˈᆳ
ሩ ԫ օ 㔉 ᇊ Ⲵ ỻ ተ 㜭 䘹 ࠪ ᴰ ྭ Ⲵ 䎠 ⌅ DŽ ਟ 〠 ↔ ࠭ ᮠ Ѫ ChooseMove ˈ ᒦ ⭘ 䇠 ⌅
ChooseMove:BM ᶕ㺘⽪䘉њ࠭ᮠԕਸ⌅ỻተ䳶ਸѝⲴỻⴈ⣦ᘱ֌Ѫ䗃‫ˈޕ‬ᒦӾਸ⌅䎠ᆀ
䳶ਸѝӗ⭏Ḁњ䎠ᆀ֌Ѫ䗃ࠪDŽ൘‫ޣ‬ҾᵪಘᆖҐⲴᡰᴹ䇘䇪ѝˈᡁԜਁ⧠ਟԕᢺሩԫ࣑ T
ᨀ儈ᙗ㜭 P Ⲵ䰞仈ㆰॆѪᆖҐ䊑 ChooseMove 䘉ṧḀњ⢩ᇊⲴⴞ ⴞḷ࠭ᮠ˄target function˅
Ⲵ䰞仈DŽᡰԕⴞḷ࠭ᮠⲴ䘹ᤙᱟањ‫ޣ‬䭞Ⲵ䇮䇑䰞仈DŽ

ቭ㇑൘ֻᆀѝᖸ᰾ᱮᓄᢺ ChooseMove ֌Ѫⴞḷ࠭ᮠˈնᡁԜՊਁ⧠ᆖҐ䘉њⴞḷ࠭ᮠ


ᱟ䶎ᑨഠ䳮Ⲵˈ৏ഐᱟᨀ‫׋‬㔉㌫㔏Ⲵᱟ䰤᧕Ⲵ䇝㓳㓿傼DŽਖཆањਟ‫׋‬䘹ᤙⲴⴞḷ࠭ᮠᱟа
њ䇴ՠ࠭ᮠˈᆳѪԫօ㔉ᇊỻተ䍻ҸањᮠᆇⲴ䇴࠶DŽਟԕਁ⧠ˈሩҾᵜֻˈᆖҐ䘉њⴞḷ
࠭ᮠᴤㆰঅDŽԔ䘉њⴞḷ࠭ᮠѪ Vˈᒦ⭘ V˖Bƒ ᶕ㺘⽪ V ᢺԫօਸ⌅Ⲵỻተ᱐ሴࡠḀа
њᇎᮠ٬˄⭘ƒᶕ㺘⽪ᇎᮠ䳶ਸ˅DŽᡁԜᢃ㇇䇙䘉њⴞḷ࠭ᮠ V 㔉ྭⲴỻተ䍻Ҹ䖳儈Ⲵ䇴࠶DŽ
ྲ᷌㌫㔏㜭ཏᡀ࣏ൠᆖՊ䘉њⴞḷ࠭ᮠ Vˈ䛓Ѹᆳ‫ׯ‬㜭֯⭘↔࠭ᮠ䖫ᶮൠ᢮ࡠᖃࡽỻተⲴᴰ
֣䎠⌅DŽᇎ⧠Ⲵᯩ⌅ᱟˈ‫ݸ‬ӗ⭏⇿ањਸ⌅䎠ᆀሩᓄⲴᡰᴹਾ㔝ỻተˈ❦ਾ֯⭘ V ᶕ䘹ਆ
ަѝᴰ֣Ⲵਾ㔗ỻተˈӾ㘼䘹ᤙᴰྭⲴ䎠ᆀDŽ

ሩҾԫ᜿ỻተˈⴞḷ࠭ᮠ V Ⲵ߶⺞٬ᓄ䈕ᱟཊቁ઒˛ᖃ❦ԫօሩ䖳ྭⲴỻተ䍻Ҹ䖳儈
Ⲵ࠶ᮠⲴ䇴ՠ࠭ᮠ䜭䘲⭘DŽ❦㘼ˈᴰྭ൘䛓Ӌӗ⭏ᴰ֣ሩᔸⲴՇཊᯩ⌅ѝᇊѹањ⢩ᇊⲴⴞ
ḷ࠭ᮠ VDŽਟԕⴻࡠˈ䘉ሶ֯ᗇ䇮䇑ањ䇝㓳㇇⌅ਈᗇㆰঅDŽഐ↔ˈሩҾ䳶ਸ B ѝⲴԫ᜿Ⲵ
ỻተ⣦ᘱ bˈᡁԜྲлᇊѹⴞḷ࠭ᮠ V(b)˖

1. ྲ᷌ b ᱟаᴰ㓸Ⲵ㜌ተˈ䛓Ѹ V(b)=100

2. ྲ᷌ b ᱟаᴰ㓸Ⲵ䍏ተˈ䛓Ѹ V(b)=-100

3. ྲ᷌ b ᱟаᴰ㓸Ⲵ઼ተˈ䛓Ѹ V(b)=0

4. ྲ᷌ b нᱟᴰ㓸ỻተˈ䛓Ѹ V(b)=V(b)ˈަѝ bᱟӾ b ᔰ࿻ৼᯩ䜭䟷ਆᴰՈሩ


ᔸਾਟ䗮ࡠⲴ㓸ተDŽ

❦㘼ˈ⭡Ҿ䘉њᇊѹⲴ䙂ᖂᙗˈᆳⲴ䘀㇇᭸⦷н儈ˈᡰԕ䘉њᇊѹሩҾ㾯⌻䐣ỻ∄䎋㘵
нਟ⭘DŽ䲔Ҷᰐ‫ޣ‬㍗㾱Ⲵࡽй⿽㓸ተⲴᛵߥˈሩҾḀањỻⴈ⣦ᘱ˄ᛵߥ 4˅b㾱ߣᇊᆳⲴ
٬V˄b˅䴰㾱ੁࡽᩌ㍒ࡠ䗮㓸ተⲴᡰᴹ䐟㓯ʽ⭡Ҿ䘉њᇊѹн㜭⭡㾯⌻䐣ỻ〻ᒿ儈᭸ൠ䘀
㇇ˈ䘉њᇊѹ㻛〠Ѫнਟ᫽֌ⲴᇊѹDŽDŽᖃࡽⲴⴞḷᱟਁ⧠ањਟ᫽֌ⲴᇊѹVˈᆳ㜭ཏ㻛㾯
⌻䐣ỻ〻ᒿ⭘ᶕ൘ਸ⨶Ⲵᰦ䰤޵䇴ՠỻተᒦ䘹ਆ䎠⌅DŽ

䘉ṧˈ䘉⿽ᛵߥⲴᆖҐԫ࣑㻛ㆰॆᡀਁ⧠ањ⨶ᜣⴞḷ࠭ᮠ V Ⲵਟ᫽֌᧿䘠DŽ䙊ᑨ㾱
ᆼ㖾ൠᆖҐ䘉ṧањ V Ⲵਟ᫽֌Ⲵᖒᔿᱟ䶎ᑨഠ䳮ⲴDŽһᇎкˈᡁԜ㓿ᑨᐼᵋᆖҐ㇇⌅ӵ
ᗇࡠⴞḷ࠭ᮠⲴḀњ䘁
䘁լ˄approximation˅ˈ⭡Ҿ䘉њ৏ഐᆖҐⴞḷ࠭ᮠⲴ䗷〻ᑨ㻛〠Ѫ࠭
ᮠ䙬䘁˄function approximation˅DŽ൘ᖃࡽⲴ䇘䇪ѝˈ⭘ Vˆ ᶕ㺘⽪〻ᒿѝᇎ䱵ᆖҐࡠⲴ࠭ᮠˈ
ԕ४࡛⨶ᜣⴞḷ࠭ᮠ VDŽ

1.2.3 䘿᤟ⴤḽ࠳ᮦⲺ㺞⽰

㠣↔ˈᡁԜᐢ㓿⺞ᇊҶⴞḷ࠭ᮠ Vˈ᧕лᶕᗵ享䘹ᤙањ㺘⽪ˈ㻛ᆖҐ〻ᒿ⭘ᶕ᧿䘠㾱
ᆖҐⲴ࠭ᮠ Vˆ DŽሩ↔ҏᴹᖸཊ䇮䇑䘹ᤙDŽֻྲˈਟԕሶ Vˆ 㺘⽪Ѫаᕐབྷ㺘ˈሩҾ⇿њᜏа
Ⲵỻⴈ⣦ᘱ bˈ㺘ѝᴹᜏаⲴ㺘亩ᶕ⺞ᇊᆳⲴ⣦ᘱ٬ Vˆ (b)DŽᡆ㘵ˈਟԕ䇙〻ᒿ⭘ањ㿴ࡉ䳶
ਸᶕ३䝽ỻተⲴ⢩ᖱԕ㺘⽪ Vˆ ˈᡆ䟷⭘ањо亴ᇊѹỻⴈ⢩ᖱᴹ‫Ⲵޣ‬Ҽ⅑ཊ亩ᔿ࠭ᮠˈᡆ
㘵⭘Ӫᐕ⾎㓿‫ݳ‬㖁㔌DŽ䙊ᑨˈ䘹ᤙ䘉њ᧿䘠वਜ਼ањ䟽㾱Ⲵᵳ㺑䗷〻DŽаᯩ䶒ˈᡁԜᙫᐼᵋ
䘹ਆањ䶎ᑨᴹ㺘ᖱ࣋Ⲵ᧿䘠ˈԕᴰབྷਟ㜭ൠ䙬䘁⨶ᜣⲴⴞḷ࠭ᮠ VDŽਖаᯩ䶒ˈ䎺ᴹ㺘ᖱ
࣋Ⲵ᧿䘠䴰㾱䎺ཊⲴ䇝㓳ᮠᦞˈ֯〻ᒿ㜭Ӿᆳ㺘⽪Ⲵཊ⿽‫ٷ‬䇮ѝ‫ࠪڊ‬䘹ᤙDŽѪҶㆰॆ䇘䇪ˈ
⧠൘䘹ᤙањㆰঅⲴ㺘⽪⌅˖ሩҾԫօ㔉ᇊⲴỻⴈ⣦ᘱˈ࠭ᮠ Vˆ ਟԕ䙊䗷ԕлỻⴈ৲ᮠⲴ
㓯ᙗ㓴ਸᶕ䇑㇇˖

z x1˖ỻⴈк唁ᆀⲴᮠ䟿

z x2˖ỻⴈк㓒ᆀⲴᮠ䟿

z x3˖ỻⴈк唁⦻Ⲵᮠ䟿

z x4˖ỻⴈк㓒⦻Ⲵᮠ䟿

z x5˖㻛㓒ᆀေ㛱Ⲵ唁ᆀᮠ䟿˄ণՊ൘ла⅑㻛㓒ਲ਼ᦹⲴᆀ˅

z x6˖㻛唁ᆀေ㛱Ⲵ㓒ᆀᮠ䟿
ҾᱟˈᆖҐ〻ᒿᢺ Vˆ (b)㺘⽪Ѫањ㓯ᙗ࠭ᮠ

Vˆ (b)=w0+w1x1+w2x2+w3x3+w4x4+w5x5+w6x6

ަѝw0ࡠw6Ѫᮠᆇ㌫ᮠˈᡆਛᵳˈ⭡ᆖҐ㇇⌅ᶕ䘹ᤙDŽ൘ߣᇊḀањỻⴈ⣦ᘱⲴ࠶٬ᰦˈ
w1 ࡠ w6ߣᇊҶн਼Ⲵỻⴈ⢩ᖱⲴ⴨ሩ䟽㾱ᙗˈ㘼ᵳw0Ѫањ䱴࣐Ⲵᑨ䟿DŽ

ᾲᤜалⴞࡽѪ→Ⲵ䇮䇑DŽᡁԜᐢ㓿䈖㓶䱀䘠Ҷ䘉њᆖҐ䰞仈Ⲵ৏රˈণѪᆳ䘹ᤙа⿽
㊫රⲴ䇝㓳㓿傼ǃањ㾱ᆖҐⲴⴞḷ࠭ᮠ઼䘉њⴞḷ࠭ᮠⲴа⿽㺘⽪⌅DŽ⧠൘ⲴᆖҐԫ࣑ᱟ˖

㾯⌻䐣ỻ〻ᒿⲴ䜘࠶䇮䇑
x ԫ࣑ T˖л㾯⌻䐣ỻ
x ᙗ㜭ḷ߶ P˖ц⭼䭖ḷ䎋кࠫ䍕ሩ᡻ⲴⲮ࠶∄
x 䇝㓳㓿傼 E˖઼㠚ᐡ䘋㹼䇝㓳ሩᔸ
x ⴞḷ࠭ᮠ˖V˖Bƒ
x ⴞḷ࠭ᮠⲴ㺘⽪˖ Vˆ (b)=w0+w1x1+w2x2+w3x3+w4x4+w5x5+w6x6

ࡽйᶑᱟሩᆖҐԫ࣑Ⲵ䈤᰾ˈਾєᶑࡦᇊҶѪᇎ⧠䘉њᆖҐ〻ᒿⲴ䇮䇑ᯩṸDŽ⌘᜿䘉њ
䇮䇑Ⲵ‫ޣ‬䭞֌⭘ᱟᢺᆖҐ㾯⌻䐣ỻᡈ⮕Ⲵ䰞仈ㆰॆѪᆖҐⴞḷ࠭ᮠ᧿䘠ѝ㌫ᮠw0ࡠw6٬Ⲵ
䰞仈DŽ

1.2.4 䘿᤟࠳ᮦ䙲䘇㇍⌋

ѪҶᆖҐⴞḷ࠭ᮠ Vˆ ˈ䴰㾱а㌫ࡇ䇝㓳ṧֻˈ⇿ањṧֻ᧿䘠Ҷ⢩ᇊⲴỻⴈ⣦ᘱb઼
ᆳⲴ䇝㓳٬Vtrain(b)DŽᦒ䀰ѻˈ⇿ањ䇝㓳ṧֻᱟᖒᔿѪ<bˈVtrain(b)>Ⲵᒿ‫ڦ‬DŽѮֻᶕ䈤ˈл
䶒Ⲵ䇝㓳ᇎֻ᧿䘠Ҷањ唁ỻ㜌࡙˄⌘᜿x2=0 㺘⽪㓒ỻᐢ㓿⋑ᴹᆀҶ˅Ⲵỻⴈ⣦ᘱbˈᆳⲴ
ⴞḷ࠭ᮠ٬Vtrain(b)Ѫ 100DŽ

<<x1=3ˈx2=0ˈx3=1ˈx4=0ˈx5=0ˈx6=0>ˈ+100>

л᮷᧿䘠Ҷањ䗷〻ˈᆳ‫ݸ‬ӾᆖҐಘਟᗇⲴ䰤᧕䇝㓳㓿傼ѝሬࠪк䶒Ⲵ䇝㓳ṧֻˈ❦ਾ
䈳ᮤᵳ٬wiԕᴰ֣ᤏਸ䘉Ӌ䇝㓳ṧֻDŽ

1.2.4.1 զ䇗䇣㓹‫ٲ‬

ṩᦞԕкⲴᆖҐ⁑රˈᆖҐಘਟԕᗇࡠⲴ䇝㓳ؑ᚟ӵᱟሩᔸᴰਾⲴ㜌䍏DŽ ਖаᯩ䶒ˈ
ᡁԜ䴰㾱䇝㓳ṧֻѪ⇿њỻⴈ⣦ᘱ䍻Ҹањ࠶٬DŽ㔉ሩᔸ㔃ᶏᰦⲴỻⴈ⣦ᘱ䇴࠶ᱟᇩ᱃Ⲵˈ
㘼㾱㔉ሩᔸ㔃ᶏࡽⲴབྷ䟿ѝ䰤ỻተ䇴࠶ቡн䛓Ѹᇩ᱃ҶDŽഐѪˈаⴈỻⲴᴰ㓸䗃䎒ᵚᗵ㜭䈤
᰾䘉ⴈỻᖃѝⲴ⇿ањỻⴈ⣦ᘱⲴྭᡆൿDŽֻྲˈণ֯Ḁњ〻ᒿ䗃ҶаⴈỻˈӽՊᴹ䘉ṧⲴ
ᛵߥˈ䘉ⴈỻࡽ䶒Ⲵỻተᓄ䈕㔉Ҹᖸ儈Ⲵ䇴ԧˈཡ䍕Ⲵ৏ഐ൘Ҿਾᶕ㌏㌅Ⲵ䎠⌅DŽ

ቭ㇑ՠ䇑ѝ䰤ỻተ䇝㓳٬ާᴹ޵൘Ⲵ⁑㋺ᙗˈնԔӪ᛺䇦ⲴᱟᴹањㆰঅⲴᯩ⌅তਆᗇ
Ҷ㢟ྭ㔃᷌DŽ䘉⿽ᯩ⌅ሩҾԫօѝ䰤ỻተbⲴ䇝㓳٬Vtrain(b)ㅹҾ Vˆ (Successor(b))ˈަѝ Vˆ ᱟ
ᆖҐಘ䟷⭘ⲴሩVⲴ䘁լˈSuccessor(b) 㺘⽪bѻਾ޽䖞ࡠ〻ᒿ䎠ỻᰦⲴỻⴈ⣦ᘱ˄ҏቡᱟ〻
ᒿ䎠Ҷа↕઼ሩ᡻എᓄа↕ਾⲴỻተ˅DŽ
䘉⿽ՠ䇑䇝㓳٬Ⲵᯩ⌅ਟ㻛ᖂ㓣Ѫ˖

䇝㓳٬ՠ䇑⌅ࡉ

Vtrain(b) Vˆ (Successor(b)) ˄1.1˅

ᡆ䇨䘉ⴻ䎧ᶕᴹ⛩⿫ཷˈਚ֯⭘ᖃࡽⲴ Vˆ ᶕՠ䇑䇝㓳٬ˈ䘉а䇝㓳٬৸㻛⭘ᶕᴤᯠ Vˆ DŽ
ն䈧⌘᜿ˈᡁԜᱟ൘⭘ਾ㔝ỻተSuccessor(b)Ⲵՠ䇑٬ᶕՠ䇑ỻተbⲴ٬DŽࠝⴤ㿹ˈᡁԜਟԕ
ⴻࡠ䎺᧕䘁⑨ᠿ㔃ᶏⲴỻተⲴ Vˆ 䎺䎻ੁ㋮⺞DŽһᇎкˈ൘⢩ᇊᶑԦл˄ሶ൘ㅜ 13 ㄐ䇘䇪˅
䘉⿽สҾሩਾ㔗ỻተ䘋㹼ՠ䇑Ⲵ䘝ԓՠ䇑䇝㓳٬Ⲵᯩ⌅ˈᐢ㻛䇱᰾ਟԕ䘁Ѿᆼ㖾ൠ᭦ᮋࡠ
Vtrainՠ䇑٬DŽ

1.2.4.2 ᵹ‫ٲ‬䈹᮪

࢙лⲴһᛵቡᱟѪ䘉њᆖҐ㇇⌅䘹ᤙᴰ䘲ਸ䇝㓳ṧֻ{<b, Vtrain(b)>}ⲴᵳwiDŽㅜа↕ᗵ享
ᇊѹᴰ֣ᤏਸ˄best fit˅䇝㓳ᮠᦞⲴਜ਼ѹDŽа⿽ᑨ⭘Ⲵᯩ⌅ᱟᢺᴰ֣Ⲵ‫ٷ‬䇮˄ᡆᵳੁ䟿䳶ਸ˅
ᇊѹѪ֯䇝㓳٬઼‫ٷ‬䇮 Vˆ 亴⍻ࠪⲴ٬䰤Ⲵ䈟ᐞᒣᯩEᴰሿDŽ

E{ ¦
 b ,V train ( b ) ! 䇝㓳ṧֻ
(Vtrain ( b )  Vˆ ( b )) 2

㠣↔ˈᡁԜⲴⴞḷቡᱟራ᢮ᵳ٬˄ㅹԧൠˈራ᢮ Vˆ ˅ˈ֯ሩҾ㿲⍻ࡠⲴ䇝㓳ᮠᦞ E ٬ᴰ
ሿॆDŽㅜ 6 ㄐሶ䇘䇪൘ӰѸᶑԦлˈᴰሿॆ䈟ᐞᒣᯩ઼ㅹԧҾራ᢮㔉ᇊ㿲⍻䇝㓳ᮠᦞлⲴᴰ
ਟ㜭‫ٷ‬䇮DŽ

ᐢ㓿⸕䚃аӋ㇇⌅ਟԕᗇࡠ㓯ᙗ࠭ᮠⲴᵳ֯↔ᇊѹⲴ E ᴰሿॆDŽ൘䘉䟼䴰㾱ањ㇇⌅ˈ
ᆳਟԕ൘ᴹҶᯠⲴ䇝㓳ṧֻᰦ䘋а↕᭩䘋ᵳ٬ˈᒦфᆳሩՠ䇑Ⲵ䇝㓳ᮠᦞѝⲴᐞ䭉ᴹྭⲴ‫ڕ‬
༞ᙗDŽањ䘉ṧⲴ㇇⌅㻛〠֌ᴰሿ൷ᯩ⌅˄least mean squares˅ˈᡆਛ LMS 䇝㓳⌅ࡉDŽሩҾ
⇿а䇝㓳ṧֻˈᆳᢺᵳ٬ੁ߿ሿ䘉њ䇝㓳ᮠᦞ䈟ᐞⲴᯩੁ⮕ᗞ䈳ᮤDŽྲㅜ 4 ㄐ䇘䇪Ⲵ䛓ṧˈ
䘉њ㇇⌅ਟ㻛ⴻ֌ሩਟ㜭Ⲵ‫ٷ‬䇮˄ᵳ٬˅オ䰤䘋㹼䲿ᵪⲴởᓖл䱽ᩌ㍒ˈԕ֯䈟ᐞᒣᯩ઼ E
ᴰሿॆDŽLMS ㇇⌅ᱟ䘉ṧᇊѹⲴ˖

LMS ᵳ٬ᴤᯠ⌅ࡉ

ሩҾ⇿ањ䇝㓳ṧֻ<bˈVtrain(b)>

x ֯⭘ᖃࡽⲴᵳ䇑㇇ Vˆ (b)
x ሩ⇿ањᵳ٬wi䘋㹼ྲлᴤᯠ

wiĕwi+(Vtrain(b)- Vˆ (b)) xi

䘉䟼¨ᱟањሿⲴᑨᮠ˄∄ྲ 0.1˅⭘ᶕ䈳ᮤᵳ٬ᴤᯠⲴᑵᓖDŽѪҶⴤ㿲ൠ⨶䀓䘉њᵳ
٬ᴤᯠ⌅ࡉⲴᐕ֌৏⨶ˈ䈧⌘᜿ᖃ䈟ᐞ˄Vtrain(b)- Vˆ (b)˅Ѫ 0 ᰦˈᵳнՊ㻛᭩ਈDŽᖃ
(Vtrain(b)- Vˆ (b))Ѫ↓ᰦ˄ֻྲˈᖃ Vˆ (b)ཚվᰦ˅⇿ањᵳ٬Պṩᦞަሩᓄ⢩ᖱ٬໎࣐аᇊⲴ
∄ֻDŽ䘉Պᨀॷ Vˆ (b)Ⲵ٬㘼߿ሿ䈟ᐞDŽ⌘᜿ྲ᷌Ḁњ৲ᮠxiѪ 0ˈ䛓ѸᆳⲴ٬нՊഐ䘉њ䈟
ᐞ㘼᭩ਈˈ䘉ṧ‫֯ׯ‬ਚᴹ䛓Ӌ൘䇝㓳ṧֻⲴỻተѝ⺞ᇎࠪ⧠Ⲵ⢩ᖱⲴᵳ٬᡽㻛ᴤᯠDŽԔӪਲ਼
᛺Ⲵᱟˈ൘аᇊⲴᶑԦлˈ䘉⿽ㆰঅⲴᵳ٬䈳ᮤᯩ⌅㻛䇱᰾ਟԕ᭦ᮋࡠVtrain ٬Ⲵᴰሿ䈟ᐞ
ᒣᯩ䙬䘁˄ቡ‫ۿ‬ㅜ 4 ㄐᡰ䇘䇪Ⲵ˅DŽ
1.2.5 ᴶ㓾Ⲻ䇴䇗

㾯⌻䐣ỻᆖҐ㌫㔏Ⲵᴰ㓸䇮䇑ਟԕ㠚❦ൠ⭘ഋњ␵ᾊⲴ〻ᒿ⁑ඇᶕ᧿䘠ˈ䘉Ӌ⁑ඇ൘ᖸ
ཊᆖҐ㌫㔏ѝᱟṨᗳ㓴ԦDŽ䘉ഋњ⁑ඇ㻛ᖂ㓣൘മ 1-1 ѝˈᆳԜᱟ˖

ᢗ㹼㌫㔏˄Performance system˅ˈ䘉њ⁑ඇᱟ⭘ᆖՊⲴⴞḷ࠭ᮠᶕ䀓ߣ㔉ᇊⲴԫ࣑ˈ
൘↔ቡᱟሩᔸ㾯⌻䐣ỻDŽᆳᢺᯠ䰞仈˄ᯠаⴈỻ˅Ⲵᇎֻ֌Ѫ䗃‫ˈޕ‬ӗ⭏а㓴䀓ㆄ䐟㓯˄ሩ
ᔸশਢ䇠ᖅ˅֌Ѫ䗃ࠪDŽ൘䘉䟼ˈᢗ㹼㌫㔏䟷⭘Ⲵ䘹ᤙла↕䎠⌅Ⲵㆆ⮕ᱟ⭡ᆖࡠⲴ䇴ՠ࠭
ᮠ Vˆ ᶕߣᇊⲴDŽᡰԕᡁԜᵏᖵᆳⲴᙗ㜭Պ䲿⵰䇴ՠ࠭ᮠⲴᰕ⳺߶⺞㘼ᨀ儈DŽ

插图——原书页码: 12

Experiment Generator-䈅傼⭏ᡀಘ

New Problem(initial game board)-ᯠ䰞仈˄ࡍ࿻ỻተ˅

Performance System-ᢗ㹼㌫㔏

Solution trace(game history)-䀓ㆄ䐟㓯˄ሩᔸশਢ˅

Critic-䢤ᇊಘ

Training examples-䇝㓳ṧֻ

Generalizer-⌋ॆಘ

Hypothesis-‫ٷ‬䇮

മ 1-1 㾯⌻䐣ỻᆖҐ〻ᒿⲴᴰ㓸䇮䇑

䢤ᇊಘ˄Critic˅ˈᆳԕሩᔸⲴ䐟㓯ᡆশਢ䇠ᖅ֌Ѫ䗃‫ˈޕ‬䗃ࠪⴞḷ࠭ᮠⲴа㌫ࡇ䇝㓳ṧ
ֻDŽྲമᡰ⽪ˈ⇿ањ䇝㓳ṧֻሩᓄ䐟㓯ѝⲴḀњỻⴈ⣦ᘱ઼ⴞḷ࠭ᮠ㔉䘉њṧֻⲴ䇴ՠ٬
VtrainDŽ൘ᡁԜⲴֻᆀѝˈ䢤ᇊಘሩᓄᔿ 1.1 㔉ࠪⲴ䇝㓳⌅ࡉDŽ

⌋ॆಘ˄Generalizer˅ˈᆳԕ䇝㓳ṧֻ֌Ѫ䗃‫ˈޕ‬䗃ࠪањ‫ٷ‬䇮ˈ֌Ѫᆳሩⴞḷ࠭ᮠⲴ
ՠ䇑DŽᆳӾ⢩ᇊⲴ䇝㓳ṧֻѝ⌋ॆˈ⥌⍻ања㡜࠭ᮠˈ֯ަ㜭ཏ㾶ⴆ䘉Ӌṧֻԕ৺ṧֻѻ
ཆⲴᛵᖒDŽ൘ᡁԜⲴֻᆀѝˈ⌋ॆಘሩᓄLMS㇇⌅ˈ䗃ࠪ‫ٷ‬䇮ᱟ⭘ᆖҐࡠⲴᵳ٬w0 ,..., w6᧿
ˆ
䘠Ⲵ࠭ᮠ V DŽ

ᇎ傼⭏ᡀಘ˄Experiment Generator˅ˈᆳԕᖃࡽⲴ‫ٷ‬䇮˄ᖃࡽᆖࡠⲴ࠭ᮠ˅֌Ѫ䗃‫ˈޕ‬
䗃ࠪањᯠⲴ䰞仈˄ֻྲˈᴰࡍⲴỻተ˅‫׋‬ᢗ㹼㌫㔏৫᧒㍒DŽᆳⲴ䀂㢢ᱟ᥁䘹ᯠⲴ㓳Ґ䰞仈ˈ
ԕ֯ᮤњ㌫㔏ⲴᆖҐ䙏⦷ᴰབྷॆDŽ൘ᡁԜⲴֻᆀѝˈᇎ傼⭏ᡀಘ䟷⭘Ҷ䶎ᑨㆰঅⲴㆆ⮕˖ᆳ
ᙫᱟ㔉ࠪањ਼ṧⲴࡍ࿻ỻተᶕᔰ࿻ᯠⲴаⴈỻDŽᴤᆼழⲴㆆ⮕ਟ㜭㠤࣋Ҿ㋮ᗳ䇮䇑ỻᆀս
㖞ԕ᧒㍒ỻⴈオ䰤Ⲵ⢩ᇊ४ฏDŽ

ᙫփᶕⴻˈᡁԜѪ㾯⌻䐣ỻ〻ᒿ֌Ⲵ䇮䇑ቡᱟӗ⭏ᢗ㹼㌫㔏ǃ䢤ᇊಘǃ⌋ॆಘ઼ᇎ傼⭏
ᡀಘⲴ⢩ᇊᇎֻDŽᖸཊᵪಘᆖҐ㌫㔏䙊ᑨਟԕ⭘䘉ഋњ䙊⭘⁑ඇᶕ࡫⭫DŽ

䇮䇑㾯⌻䐣ỻ〻ᒿⲴ⍱〻㻛ᖂ㓣൘മ 1-2 ѝDŽ䘉њ䇮䇑ᐢ㓿൘ࠐᯩ䶒ᢺᆖҐԫ࣑䲀ࡦ൘


䖳ሿⲴ㤳ത޵DŽ㾱ᆖҐⲴ⸕䇶㊫ර㻛䲀ࡦѪањঅаⲴ㓯ᙗ䇴ՠ࠭ᮠDŽ㘼ф䘉њ䇴ՠ࠭ᮠ㻛
䲀ࡦѪӵ‫׍‬䎆Ҿ‫ޝ‬њỻⴈ⢩ᖱDŽྲ᷌ⴞḷ࠭ᮠⵏⲴਟ㺘⽪Ѫ䘉Ӌ⢩ᇊ৲ᮠⲴ㓯ᙗ㓴ਸˈ䛓Ѹ
〻ᒿᆖࡠ䘉њⴞḷ࠭ᮠⲴਟ㜭ᙗᖸབྷDŽ৽ѻˈᴰཊਚᐼᵋᆳᆖࡠањਸ⨶Ⲵ䘁լˈഐѪањ
〻ᒿᖃ❦н㜭ᆖՊᆳṩᵜн㜭㺘⽪Ⲵь㾯DŽ

插图——原书页码: 13

Determine Type of Training Experience- ߣᇊ䇝㓳㓿傼ᖒᔿ

Games against experts- оуᇦሩᔸ

Games against self- о㠚ᐡሩᔸ

Table of correct moves- ↓⺞䎠ᆀⲴ㺘Ṭ

Determine Target Function- ߣᇊⴞḷ࠭ᮠ

Board->move- ỻⴈo䎠ᆀ

Board->value- ỻⴈo࠶٬

Determine Representation of Learned Function-ߣᇊⴞḷ࠭ᮠⲴ㺘⽪

Polynomial- ཊ亩ᔿ

Linear function of six features- ‫ޝ‬њ৲ᮠⲴ㓯ᙗ࠭ᮠ

Artificial neural network- Ӫᐕ⾎㓿㖁㔌

Determine Learning Algorithm- ߣᇊᆖҐ㇇⌅

Gradient descent- ởᓖл䱽

Linear programming- 㓯ᙗ㿴ࡂ

Completed Design- ᆼᡀⲴ䇮䇑

മ 1-2 㾯⌻䐣ỻᆖҐ〻ᒿⲴ䇮䇑䗷〻ᾲ䘠

ᡁԜ‫ٷ‬ᇊⵏᇎ࠭ᮠ V Ⲵਸ⨶Ⲵ䘁լ⺞ᇎਟ㻛㺘⽪Ѫ䘉⿽ᖒᔿDŽ䛓Ѹ䰞仈ਈᡀ䘉⿽ᆖҐ
ᢰᵟᱟ੖⺞‫؍‬㜭ਁ⧠ањਸ⨶Ⲵ䘁լDŽㅜ 13 ㄐᨀ‫׋‬Ҷа⿽⨶䇪࠶᷀ˈ㺘᰾ሩҾḀӋ㊫රⲴ
ᩌ㍒䰞仈ˈ൘⴨ᖃѕṬⲴࡽᨀлˈ䘉⿽ᯩ⌅⺞ᇎ᭦ᮋࡠᵏᵋⲴ䇴ՠ࠭ᮠDŽᖸᒨ䘀ˈᇎ䐥㓿傼
㺘᰾䘉⿽ᆖҐ䇴ՠ࠭ᮠⲴ䙄ᖴ㓿ᑨᱟᡀ࣏Ⲵˈ⭊㠣൘㜭㻛䇱᰾Ⲵᛵᖒѻཆҏᱟྲ↔DŽ
ᐢ㓿䇮䇑Ⲵ〻ᒿ㜭ᆖᗇ䏣ཏྭ㘼ࠫ䍕Ӫ㊫Ⲵ㾯⌻䐣ỻߐߋੇ˛ᡆ䇨н㜭DŽ䜘࠶ൠˈ䘉ᱟ
ഐѪ Vˆ Ⲵ㓯ᙗ࠭ᮠ㺘⽪ཚㆰঅԕ㠤Ҿн㜭ᖸྭᦅ᥹䘉⿽ỻⲴᗞ࿉ѻ༴DŽ❦㘼ˈྲ᷌㔉оа
њᴤᆼழⲴⴞḷ࠭ᮠ㺘⽪⌅ˈ䘉⿽䙊⭘Ⲵ䙄ᖴһᇎкਟԕ䶎ᑨᡀ࣏DŽֻྲˈTesauro(1992, 1995)
ᣕ੺ҶᆖҐл㾯⌻ৼ䱶ỻⲴ〻ᒿⲴ㊫լ䇮䇑ˈᯩ⌅ᱟᆖҐањ䶎ᑨ㊫լⲴỻተ䇴ՠ࠭ᮠDŽᆳ
Ⲵ〻ᒿ֯⭘Ӫᐕ⾎㓿‫ݳ‬㖁㔌㺘⽪ᆖࡠⲴ䇴ՠ࠭ᮠˈᆳ㘳㲁ሩỻተⲴᆼᮤ᧿䘠㘼нᱟỻⴈⲴࠐ
њ৲ᮠDŽ㓿শҶаⲮз⅑ԕкⲴ㠚ᡁ⭏ᡀⲴ䇝㓳∄䎋ਾˈԆⲴ〻ᒿ㜭ཏ઼а⍱ⲴӪ㊫㾯⌻ৼ
䱶ỻ䘹᡻аҹ儈лDŽ

ᖃ❦䘈ਟ㜭Ѫ㾯⌻䐣ỻᆖҐԫ࣑䇮䇑ᖸཊަԆⲴ㇇⌅DŽֻྲˈа⿽ਟ㜭ਚㆰঅൠᆈۘ䇝
㓳ṧֻˈ❦ਾ৫ራ᢮‫؍‬ᆈⲴĀᴰ᧕䘁Ⲵāᛵᖒᶕ३䝽ᯠⲴᛵߥ˄ᴰ䘁䛫㇇⌅ˈㅜ 8 ㄐ˅DŽᡆ
㘵ਟԕӗ⭏བྷ䟿‫ى‬䘹Ⲵ㾯⌻䐣ỻ〻ᒿˈᒦ䇙ᆳԜ⴨ӂ∄䎋ˈ‫⮉؍‬ᴰᡀ࣏Ⲵ〻ᒿᒦ䘋а↕⭘⁑
ᤏ䘋ॆⲴᯩᔿᶕษ㛢ᡆਈᔲᆳԜ˄䚇Ր㇇⌅ˈㅜ 9 ㄐ˅DŽӪ㊫լѾ䚥ᗚਖа⿽䙄ᖴራ᢮ᆖҐ
ㆆ⮕ˈԆԜ࠶᷀ᡆੁ㠚ᐡ䀓䟺∄䎋ѝ⻠ࡠⲴᡀ䍕Ⲵ৏ഐ˄สҾ䀓䟺ⲴᆖҐˈㅜ 11 ㄐ˅DŽк䶒
Ⲵ䇮䇑ᱟ䘉Ӌ⿽㊫ѝⲴањㆰঅⲴ㇇⌅ˈᆳᱟѪҶ㔉ᡁԜӺਾⲴ䪸ሩ⢩ᇊ㊫࡛Ⲵԫ࣑ⲴᆖҐ
ᯩ⌅Ⲵ䇮䇑ྐᇊส⹰DŽ

1.3 ᵰಞᆜҖⲺжӑ㿸⛯ૂ䰤从

൘ᵪಘᆖҐᯩ䶒ˈањᴹ᭸Ⲵ㿲⛩ᱟᵪಘᆖҐ䰞仈㓿ᑨᖂ㔃Ҿᩌ㍒䰞仈ˈণሩ䶎ᑨབྷⲴ
‫ٷ‬䇮オ䰤䘋㹼ᩌ㍒ˈԕ⺞ᇊᴰ֣ᤏਸ㿲ሏࡠⲴᮠᦞ઼ᆖҐಘᐢᴹ⸕䇶Ⲵ‫ٷ‬䇮DŽֻྲˈ㘳㲁а
лк䶒Ⲵ㾯⌻䐣ỻᆖҐ〻ᒿ䗃ࠪⲴ‫ٷ‬䇮オ䰤DŽ䘉њ‫ٷ‬䇮オ䰤वਜ਼ᡰᴹਟ⭡ᵳw0ࡠw6Ⲵн਼٬
Ⲵ䇴ՠ࠭ᮠDŽҾᱟᆖҐಘⲴԫ࣑ቡᱟᩌ㍒䘉њབྷⲴオ䰤ˈራ᢮о䇝㓳ᮠᦞᴰ֣ᤏਸⲴ‫ٷ‬䇮DŽ
䪸ሩᤏਸᵳ٬ⲴLMS㇇⌅䙊䗷䘝ԓ䈳ᮤᵳ٬ᇎ⧠Ҷ䘉њⴞⲴˈ⇿ᖃ‫ٷ‬䇮Ⲵ䇴ՠ࠭ᮠ亴⍻ࠪ
ањо䇝㓳ᮠᦞᴹ‫ٿ‬ᐞⲴ٬ᰦቡሩ⇿њᵳ٬䘋㹼ṑ↓DŽᖃᆖҐಘ㘳㲁Ⲵ‫ٷ‬䇮㺘⽪ᇊѹҶањ
䘎㔝Ⲵ৲ᮠॆⲴ▌൘‫ٷ‬䇮オ䰤ᰦˈ䘉њ㇇⌅ᖸᴹ᭸DŽ

ᵜҖⲴᖸཊㄐ㢲㔉ࠪҶሩаӋสᵜ㺘⽪˄ֻྲˈ㓯ᙗ࠭ᮠǃ䙫䗁᧿䘠ǃߣㆆṁǃӪᐕ⾎
㓿‫ݳ‬㖁㔌˅ᇊѹⲴ‫ٷ‬䇮オ䰤Ⲵᩌ㍒㇇⌅DŽ䘉Ӌн਼Ⲵ‫ٷ‬䇮㺘⽪⌅䘲ਸҾᆖҐн਼Ⲵⴞḷ࠭ᮠDŽ
ሩҾަѝⲴ⇿а⿽‫ٷ‬䇮㺘⽪⌅ˈሩᓄⲴᆖҐ㇇⌅ਁᥕн਼޵൘㔃ᶴⲴՈ࣯ᶕ㓴㓷ሩ‫ٷ‬䇮オ䰤
Ⲵᩌ㍒DŽ

㠚࿻㠣㓸ˈᵜҖ䜭䍟ク⵰䘉⿽ᢺᆖҐ䰞仈㿶Ѫᩌ㍒䰞仈Ⲵⴻ⌅ˈӾ㘼䙊䗷ᩌ㍒ㆆ⮕઼ᆖ
Ґಘ᧒㍒Ⲵᩌ㍒オ䰤Ⲵ޵൘㔃ᶴᶕ࡫⭫ᆖҐᯩ⌅DŽᡁԜҏՊਁ⧠ˈ䘉⿽㿲⛩ሩҾᖒᔿॆൠ࠶
᷀㾱ᩌ㍒Ⲵ‫ٷ‬䇮オ䰤Ⲵབྷሿǃਟ࡙⭘Ⲵ䇝㓳ṧֻⲴᮠ䟿ԕ৺ањо䇝㓳ᮠᦞа㠤Ⲵ‫ٷ‬䇮㜭⌋
ॆࡠᵚ㿱ᇎֻⲴ㖞ؑᓖ䘉й㘵ѻ䰤Ⲵ‫ޣ‬㌫䶎ᑨᴹ⭘DŽ

1.3.1 ᵰಞᆜҖⲺ䰤从

㾯⌻䐣ỻֻᆀᨀࠪҶᵪಘᆖҐᯩ䶒ᖸཊᲞ䙽䰞仈DŽᵪಘᆖҐ䘉䰘ᆖ、ˈ઼ᵜҖⲴ㔍བྷ䜘
࠶ˈ䜭㠤࣋Ҿഎㆄ㊫լл䶒Ⲵ䰞仈˖
x Ӿ⢩ᇊⲴ䇝㓳ᮠᦞᆖҐа㡜Ⲵⴞḷ࠭ᮠᆈ൘ӰѸṧⲴ㇇⌅˛ྲ᷌ᨀ‫׋‬Ҷ‫ݵ‬
䏣Ⲵ䇝㓳ᮠᦞˈӰѸṧⲴᶑԦлՊ֯⢩ᇊⲴ㇇⌅᭦ᮋࡠᵏᵋⲴ࠭ᮠ˛ଚњ㇇
⌅ሩଚӋ䰞仈઼㺘⽪Ⲵᙗ㜭ᴰྭDŽ
x ཊቁ䇝㓳ᮠᦞᱟ‫ݵ‬䏣Ⲵ˛ᘾṧ᢮ࡠᆖҐࡠⲴ‫ٷ‬䇮Ⲵ㖞ؑᓖо䇝㓳ᮠᦞⲴᮠ
䟿৺ᨀ‫׋‬㔉ᆖҐಘⲴ‫ٷ‬䇮オ䰤⢩ᙗѻ䰤Ⲵа㡜‫ޣ‬㌫˛
x ᆖҐಘᤕᴹⲴ‫ݸ‬傼⸕䇶ᱟᘾṧᕅሬӾṧֻ䘋㹼⌋ॆⲴ䗷〻Ⲵ˛ᖃ‫ݸ‬傼⸕䇶
ӵӵᱟ䘁լ↓⺞ᰦˈᆳԜՊᴹᑞࣙੇ˛
x ሩҾ䘹ᤙᴹ⭘Ⲵਾ㔝䇝㓳㓿傼ˈӰѸṧⲴㆆ⮕ᴰྭ˛䘉њㆆ⮕Ⲵ䘹ᤙՊᘾṧ
ᖡ૽ᆖҐ䰞仈Ⲵ༽ᵲᙗ˛
x ᘾṧᢺᆖҐԫ࣑ㆰॆѪањᡆཊњ࠭ᮠ䙬䘁䰞仈˛ᦒа⿽ᯩᔿˈ㌫㔏䈕䈅മ
ᆖҐଚӋ࠭ᮠ˛䘉њ䗷〻ᵜ䓛㜭㠚ࣘॆੇ˛
x ᆖҐಘᘾṧ㠚ࣘൠ᭩ਈ㺘⽪⌅ᶕᨀ儈㺘⽪઼ᆖҐⴞḷ࠭ᮠⲴ㜭࣋˛

1.4 ྸ֋䰻䈱ᵢҜ

䘉ᵜҖӻ㓽ҶᵪಘᆖҐⲴѫ㾱㇇⌅઼䙄ᖴ˗н਼ᆖҐԫ࣑ਟ㹼ᙗ઼⢩ᇊ㇇⌅㜭࣋Ⲵ⨶䇪
㔃᷌˗ԕ৺ᵪಘᆖҐᓄ⭘Ҿ䀓ߣ⧠ᇎ䰞仈ⲴֻᆀDŽਚ㾱ਟ㜭ˈ਴ㄐⲴ߉֌䜭࣋ҹо䰵䈫亪ᒿ
ᰐ‫ޣ‬DŽ❦㘼аӋ⴨ӂ‫׍‬䎆ᙗᱟнਟ䚯‫Ⲵݽ‬DŽྲ᷌ᵜҖ㻛⭘֌ᮉ、Җˈᡁᔪ䇞俆‫ݸ‬ᆼᡀㅜа઼
ㅜҼㄐˈ։л਴ㄐสᵜਟԕԕԫ᜿亪ᒿ䰵䈫DŽ䮯ᓖѪањᆖᵏⲴᵪಘᆖҐ䈮〻ਟԕवᤜࡽг
ㄐԕ৺仍ཆⲴࠐњᴰᝏ‫ޤ‬䏓Ⲵㄐ㢲DŽл䶒ㆰ㾱⍿㿸ал਴ㄐDŽ
x ㅜ 2 ㄐवᤜสҾㅖਧ઼䙫䗁㺘⽪ⲴᾲᘥᆖҐDŽҏ䇘䇪Ҷ‫ٷ‬䇮Ⲵа㡜ࡠ⢩↺‫ٿ‬
ᒿ㔃ᶴˈԕ৺ᆖҐѝᕅ‫ޕ‬ᖂ㓣‫ٿ‬㖞Ⲵᗵ㾱ᙗDŽ
x ㅜ 3 ㄐवᤜߣㆆṁᆖҐ઼䗷ᓖᤏਸ䇝㓳ᮠᦞⲴ䰞仈DŽ䘉аㄐҏࢆ᷀Ҷྕൾ࿶
ࡳ࠰üü䈕৏ࡉᔪ䇞൘оᮠᦞа㠤Ⲵ‫ٷ‬䇮ѝ䘹ᤙᴰ⸝‫ٷ‬䇮DŽ
x ㅜ 4 ㄐवᤜӪᐕ⾎㓿㖁㔌Ⲵ⸕䇶ˈ⢩࡛ᱟ⹄ウᐢѵⲴ৽ੁՐ᫝㇇⌅ˈԕ৺ở
ᓖл䱽Ⲵа㡜ᯩ⌅DŽ䘉аㄐवਜ਼ањ䈖㓶ⲴสҾ⾎㓿㖁㔌ⲴӪ㝨䇶࡛ᇎֻˈ
䈕ֻᆀ䴰㾱Ⲵᮠᦞ઼㇇⌅ਟԕ൘з㔤㖁кᗇࡠDŽ
x ㅜ 5 ㄐ㔉ࠪҶᶕ㠚㔏䇑઼ՠ䇑⨶䇪Ⲵส⹰ᾲᘥˈ⵰䟽Ҿ֯⭘ᴹ䲀Ⲵṧᵜᮠᦞ
䇴ՠ‫ٷ‬䇮Ⲵ㋮ᓖDŽ䘉аㄐवਜ਼Ҷ⭘Ҿՠ䇑‫ٷ‬䇮㋮ᓖⲴ㖞ؑオ䰤ˈ઼ሩн਼ᆖ
Ґ㇇⌅Ⲵ㋮ᓖ䘋㹼∄䖳Ⲵᯩ⌅DŽ
x ㅜ 6 ㄐӻ㓽ᵪಘᆖҐⲴ䍍ਦᯟ㿲⛩DŽᰒवᤜҶ֯⭘䍍ਦᯟ࠶᷀࡫⭫䶎䍍ਦᯟ
ᆖҐ㇇⌅ˈ৸वᤜҶⴤ᧕༴⨶ᾲ⦷Ⲵ䍍ਦᯟ㇇⌅DŽ䘉аㄐवᤜањᓄ⭘䍍ਦ
ᯟ࠶㊫ಘᶕ࠶㊫᮷ᵜ᮷ẓⲴ䈖㓶ֻᆀˈᡰ䴰Ⲵᮠᦞ઼䖟Ԧਟԕ൘з㔤㖁кᗇ
ࡠDŽ
x ㅜ 7 ㄐ㾶ⴆҶ䇑㇇ᆖҐ⨶䇪ˈवᤜਟ㜭䘁լ↓⺞˄Probably Approximately
CorrectˈPAC˅ᆖҐ⁑ර઼ࠪ䭉⭼䲀˄Mistake-Bound˅ᆖҐ⁑රDŽᵜㄐ䇘䇪
Ҷ㚄ਸཊњᆖҐᯩ⌅Ⲵ࣐ᵳཊᮠ˄Weighted Majority˅㇇⌅DŽ
x ㅜ 8 ㄐ᧿䘠ҶสҾᇎֻⲴᆖҐᯩ⌅ˈवᤜᴰ䘁䛫ᆖҐˈተ䜘࣐ᵳഎᖂˈ઼ส
ҾṸֻⲴ᧘⨶DŽ
x ㅜ 9 ㄐ䇘䇪Ҷṩᦞ⭏⢙䘋ॆᔪ⁑ⲴᆖҐ㇇⌅ˈवᤜ䚇Ր㇇⌅઼䚇Ր㕆〻DŽ
x ㅜ 10 ㄐ㾶ⴆҶа㓴ᆖҐ㿴ࡉ䳶ਸⲴ㇇⌅ˈवᤜᆖҐа䱦 Horn ᆀਕⲴᖂ㓣䙫
䗁㕆〻ᯩ⌅DŽ
x ㅜ 11 ㄐवਜ਼ҶสҾ䀓䟺ⲴᆖҐˈণа⿽֯⭘ԕࡽⲴ⸕䇶䀓䟺㿲ሏࡠⲴᇎֻˈ
❦ਾṩᦞ䘉Ӌ䀓䟺⌋ॆⲴᆖҐᯩ⌅DŽ
x ㅜ 12 ㄐ䇘䇪ҶᢺԕࡽⲴ䘁լ⸕䇶㔃ਸ䘋⧠ᴹⲴ䇝㓳ᮠᦞѝԕᨀ儈ᆖҐ㋮ᓖ
Ⲵᯩ⌅DŽ൘ަѝㅖਧ㇇⌅઼⾎㓿㖁㔌㇇⌅䜭ᴹ䇘䇪DŽ
x ㅜ 13 ㄐ䇘䇪Ҷ໎ᕪᆖҐDŽ䘉⿽ᯩ⌅ᱟѪҶ༴⨶ᶕ㠚䇝㓳ؑ᚟ѝⲴ䰤᧕Ⲵᡆ
ᔦ䘏Ⲵ৽侸DŽᵜㄐࡽ䶒ᨀ৺ⲴлỻᆖҐ〻ᒿᱟ໎ᕪᆖҐⲴањㆰঅⲴֻᆀDŽ

⇿ㄐⲴ㔃ቮवਜ਼Ҷᡰ㾶ⴆⲴѫ㾱ᾲᘥⲴሿ㔃ǃ䘋а↕䰵䈫Ⲵ৲㘳઼Ґ仈DŽަԆሩㄐ㢲Ⲵ
ᴤᯠˈवᤜᮠᦞ䳶઼㇇⌅Ⲵᇎ⧠ˈ䜭ਟӾ㖁൰ http://www.cs.cmu.edu/~tom/mlbook.html 䇯䰞
ࡠDŽ
1.5 ቅ㔉ૂ㺛‫ݻ‬䈱⢟

ᵪಘᆖҐ㠤࣋Ҿ⹄ウᔪ・㜭ཏṩᦞ㓿傼㠚ᡁᨀ儈༴⨶ᙗ㜭Ⲵ䇑㇇ᵪ〻ᒿDŽᵜㄐⲴ㾱⛩व
ᤜ˖
x ᵪಘᆖҐ㇇⌅൘ᖸཊᓄ⭘亶ฏ㻛䇱᰾ᴹᖸབྷⲴᇎ⭘ԧ٬DŽᆳԜ൘ԕлᯩ䶒⢩
࡛ᴹ⭘˖˄a˅ᮠᦞ᥆ᧈ䰞仈ˈণӾབྷ䟿ᮠᦞѝਁ⧠ਟ㜭वਜ਼൘ަѝⲴᴹԧ
٬Ⲵ㿴ᖻ˄ֻྲˈӾᛓ㘵ᮠᦞᓃѝ࠶᷀⋫⯇Ⲵ㔃᷌ˈᡆ㘵Ӿ䍒࣑ᮠᦞѝᗇࡠ
ؑ⭘䍧ⅮⲴᲞ䙽㿴ࡉ˅˗˄b˅൘ḀӋഠ䳮Ⲵ亶ฏѝˈӪԜਟ㜭䘈нާᴹᔰ
ਁࠪ儈᭸Ⲵ㇇⌅ᡰ䴰Ⲵ⸕䇶˄∄ྲˈӾമ‫ۿ‬ᓃѝ䇶࡛ࠪӪ㝨˅˗˄c˅䇑㇇
ᵪ〻ᒿᗵ享ࣘᘱൠ䘲ᓄਈॆⲴ亶ฏ˄ֻྲˈ൘৏ᯉ‫׋‬㔉ਈॆⲴ⧟ຳл䘋㹼⭏
ӗ䗷〻᧗ࡦˈᡆ䘲ᓄњӪ䰵䈫‫ޤ‬䏓Ⲵਈॆ˅DŽ
x ᵪಘᆖҐӾн਼Ⲵᆖ、੨᭦ᾲᘥˈवᤜӪᐕᲪ㜭ˈᾲ⦷઼㔏䇑ˈ䇑㇇༽ᵲᙗˈ
ؑ᚟䇪ˈᗳ⨶ᆖ઼⾎㓿⭏⢙ᆖǃ᧗ࡦ䇪ǃԕ৺ଢᆖDŽ
x ањᆼᮤᇊѹⲴᆖҐ䰞仈䴰㾱ањ᰾⺞⭼ᇊⲴԫ࣑ǃᙗ㜭ᓖ䟿ḷ߶ԕ৺䇝㓳
㓿傼ⲴᶕⓀDŽ
x ᵪಘᆖҐ㇇⌅Ⲵ䇮䇑䗷〻ѝवਜ਼䇨ཊ䘹ᤙˈवᤜ䘹ᤙ䇝㓳㓿傼Ⲵ㊫රǃ㾱ᆖ
ҐⲴⴞḷ࠭ᮠǃ䈕ⴞḷ࠭ᮠⲴ㺘⽪ᖒᔿǃԕ৺Ӿ䇝㓳ṧֻѝᆖҐⴞḷ࠭ᮠⲴ
㇇⌅DŽ
x ᆖҐⲴ䗷〻ণᩌ㍒Ⲵ䗷〻ˈᩌ㍒वਜ਼ਟ㜭‫ٷ‬䇮Ⲵオ䰤ˈ֯ᗇࡠⲴ‫ٷ‬䇮ᴰㅖਸ
ᐢᴹⲴ䇝㓳ṧ઼ֻަԆ‫ݸ‬傼Ⲵ㓖ᶏᡆ⸕䇶DŽᵜҖⲴབྷ䜘࠶޵ᇩത㔅⵰ᩌ㍒਴
⿽‫ٷ‬䇮オ䰤˄ֻྲˈवਜ਼ᮠ٬࠭ᮠǃ⾎㓿㖁㔌ǃߣㆆṁǃㅖਧ㿴ࡉⲴオ䰤˅
Ⲵн਼ᆖҐᯩ⌅ˈ઼⨶䇪к䘉Ӌᩌ㍒ᯩ⌅൘ӰѸᶑԦлՊ᭦ᮋࡠᴰ֣‫ٷ‬䇮DŽ

ᴹᖸཊ‫ޣ‬ҾᵪಘᆖҐᴰᯠ⹄ウᡀ᷌ⲴՈ⿰䍴Ⓚਟ‫׋‬䰵䈫DŽ⴨‫Ⲵޣ‬ᵲᘇवᤜljᵪಘᆖҐNJ
˄Machine Learning˅ˈlj⾎㓿䇑㇇NJ˄Neural Computation˅ ˈlj⾎㓿㖁㔌NJ˄Neural Networks˅ ˈ
lj㖾ഭ㔏䇑ॿՊᵏ࠺NJ˄Journal of the American Statistical Association˅઼ljIEEE ⁑ᔿ䇶઼࡛
ᵪಘᲪ㜭ᆖᣕNJ˄IEEE Transactions on Pattern Analysis and Machine Intelligence˅DŽҏᴹབྷ䟿
Ⲵᒤ Պ㾶ⴆҶᵪಘᆖҐⲴ਴њᯩ䶒ˈवᤜഭ䱵ᵪಘᆖҐՊ䇞(ICML)ˈ⾎㓿ؑ᚟༴⨶㌫㔏
(NIPS)ˈ䇑㇇ᆖҐ⨶䇪Պ䇞(CCLT)ˈഭ䱵䚇Ր㇇⌅Պ䇞(ICGA)ˈഭ䱵⸕䇶ਁ⧠઼ᮠᦞ᥆ᧈ
Պ䇞(ICKDD)ˈ⅗⍢ᵪಘᆖҐՊ䇞(ECML)ㅹDŽ
Ґ仈

1.1 㔉ࠪй⿽ᵪಘᆖҐᯩ⌅䘲ਸⲴᓄ⭘ˈй⿽н䘲ਸⲴᓄ⭘DŽ᥁䘹ᵜҖᵚᨀ৺Ⲵᓄ⭘ˈ
ᒦሩ⇿њᓄ⭘ԕаਕ䈍ᶕ䇴ԧDŽ

1.2 ᥁䘹аӋᵜҖᵚᨀࡠⲴᆖҐԫ࣑DŽ⭘㤡᮷߉а⇥䈍䶎↓ᔿൠ࣐ԕ᧿䘠DŽ޽ቭਟ㜭㋮
⺞ൠ᧿䘠ࠪᆳⲴԫ࣑ǃᙗ㜭㺑䟿ḷ߶઼䇝㓳㓿傼DŽᴰਾˈ㔉ࠪ㾱ᆖҐⲴⴞḷ࠭ᮠ઼ᆳⲴ㺘⽪DŽ
䇘䇪䘉њԫ࣑䇮䇑ѝ㘳㲁Ⲵѫ㾱ᣈѝDŽ

1.3 䇱᰾ᵜㄐ᧿䘠ⲴLMSᵳᴤᯠ⌅ࡉ䟷⭘Ҷởᓖл䱽ᯩ⌅֯䈟ᐞᒣᯩᴰሿॆDŽ⺞࠷ൠ
䇢ˈ‫ۿ‬᮷ѝ䛓ṧᇊѹᯩᐞEDŽ❦ਾ䇑㇇EሩᵳwiⲴሬᮠˈަѝ‫ٷ‬ᇊ Vˆ (b) о᮷ѝᇊѹⲴаṧˈ
wE
ᱟањ㓯ᙗ࠭ᮠDŽởᓖл䱽ᱟ䙊䗷о  ᡀ∄ֻൠᴤᯠ⇿њᵳ٬ᇎ⧠ⲴDŽᡰԕˈᗵ享䇱᰾
wwi
ሩҾᡰ䙷ࡠⲴ⇿ањ䇝㓳ṧֻˈLMS䇝㓳⌅ࡉ䜭ᱟ᤹䘉њ∄ֻᶕ᭩ਈᵳ٬DŽ

1.4 മ 1-1 ѝᇎ傼⭏ᡀಘ⁑ඇਟ䟷⭘ަԆаӋㆆ⮕DŽ⺞࠷ൠ䇢ˈ㘳㲁ᇎ傼⭏ᡀಘ⭘л䶒


Ⲵㆆ⮕ᨀࠪᯠⲴỻተ˖
x ӗ⭏䲿ᵪⲴਸ⌅Ⲵỻተ
x Ӿࡽ䶒Ⲵሩᔸѝ᥁䘹ањỻተˈ❦ਾ䎠а↕к⅑⋑ᴹ䎠Ⲵỻ㘼ӗ⭏ᯠⲴỻተ
x а⿽֐㠚ᐡ䇮䇑Ⲵㆆ⮕

䇘䇪䘉Ӌㆆ⮕ⲴՈ࣓DŽྲ᷌䇝㓳ṧֻⲴᮠ䟿ᱟപᇊⲴˈଚањ᭸᷌ᴰྭ˛‫ٷ‬ᇊᙗ㜭㺑䟿
ḷ߶ᱟ൘ц⭼䭖ḷ䎋к䎒ỻᴰཊDŽ

1.5 ֯⭘㊫լҾ㾯⌻䐣ỻ䰞仈Ⲵ㇇⌅ˈᇎ⧠ањᴤㆰঅⲴtic-tac-toe⑨ᠿķDŽᢺᆖҐࡠⲴ
࠭ᮠ Vˆ 㺘⽪Ѫ㠚䘹Ⲵỻተ৲ᮠⲴ㓯ᙗ㓴ਸDŽ㾱䇝㓳䘉њ〻ᒿˈਟԕ䇙ᆳ઼ᆳⲴਖањᤧ䍍
৽༽∄䎋ˈਾ㘵֯⭘᡻ᐕᔪ・Ⲵപᇊ䇴ՠ࠭ᮠDŽ⭘മ㺘㔈ࠪ֐Ⲵ〻ᒿ㜌࡙ⲴⲮ࠶∄ˈሩᓄҾ
䇝㓳⅑ᮠDŽ

৲㘳᮷⥞

ķ
䈁⌘˖䈕⑨ᠿỻⴈѪ 3X3 ᯩṬˈৼᯩӔӂ㩭ᆀˈ俆‫ݸ‬ᇎ⧠㠚ᯩйᆀ䘎а㓯㘵㜌DŽ
ㅢ2ㄖ ᾸᘫᆜҖૂж㡢ࡦ⢯⇀ᓅ

从特殊的训练样例中归纳出一般函数是机器学习的中心问题。本章介绍概念学
习:给定某一类别的若干正例和反例,从中获得该类别的一般定义。概念学习也可
被看作一个搜索问题,它在预定义的假设空间中搜索假设,使其与训练样例有最佳
的拟合度。多数情形下,为了高效的搜索,可以利用假设空间中一种自然形成的结
构——即一般到特殊偏序结构。本章展示了几种概念学习算法,并讨论了这些算法
能收敛得到正确假设的条件。这里还分析了归纳学习的本质,以及任意程序能从训
练数据中泛化的理由。

2.1 ԁ㔃

䇨ཊᵪಘᆖҐ䰞仈⎹৺ࡠӾ⢩↺䇝㓳ṧֻѝᗇࡠа㡜ᾲᘥDŽ∄ྲӪԜнᯝᆖҐⲴаӋа
㡜ᾲᘥ઼㊫࡛वᤜ˖呏㊫ǃ⊭䖖ǃऔཻⲴᆖҐㅹDŽ⇿њᾲᘥਟ㻛ⴻ֌ањሩ䊑ᡆһԦ䳶ਸˈ
ᆳᱟӾᴤབྷⲴ䳶ਸѝ䘹ਆⲴᆀ䳶˄ྲӾࣘ⢙Ⲵ䳶ਸѝ䘹ਆ呏㊫˅ˈᡆ㘵ᱟ൘䘉њ䖳བྷ䳶ਸѝ
ᇊѹⲴᐳቄ࠭ᮠ˄ྲ൘ࣘ⢙䳶ਸѝᇊѹⲴ࠭ᮠˈᆳሩ呏㊫ӗ⭏ true ᒦሩަԆࣘ⢙ӗ⭏ false˅DŽ

ᵜㄐ㘳㲁Ⲵ䰞仈ᱟˈ㔉ᇊаṧֻ䳶ਸԕ৺⇿њṧֻᱟ੖኎ҾḀаᾲᘥⲴḷ⌘ˈᘾṧ㠚ࣘ
ᾲᘥᆖҐ˄concept learning˅ˈᡆ〠Ӿṧֻѝ䙬
᧘ᯝࠪ䈕ᾲᘥⲴа㡜ᇊѹDŽ䘉а䰞仈㻛〠Ѫᾲ
䘁ᐳቄ٬࠭ᮠDŽ

定义: ᾲᘥᆖҐᱟᤷӾᴹ‫ޣ‬Ḁњᐳቄ࠭ᮠⲴ䗃‫ޕ‬䗃ࠪ䇝㓳ṧֻѝˈ᧘ᯝࠪ䈕ᐳቄ࠭
ᮠDŽ

2.2 жѠᾸᘫᆜҖԱࣗ

ѪҶ㢟ྭൠ⨶䀓ᾲᘥᆖҐˈ㘳㲁ањᾲᘥᆖҐⲴֻᆀˈⴞḷᾲᘥᱟ˖ĀAldo 䘋㹼≤к䘀
ࣘⲴᰕᆀāDŽ㺘 2-1 ᧿䘠Ҷа㌫ࡇᰕᆀⲴṧֻˈ⇿њṧֻ㺘⽪Ѫ኎ᙗⲴ䳶ਸDŽ኎ᙗ EnjoySport
㺘⽪䘉аཙ Aldo ᱟ੖ҀҾ䘋㹼≤к䘀ࣘDŽ䘉њԫ࣑ⲴⴞⲴᱟˈสҾḀཙⲴ਴኎ᙗˈԕ亴⍻
ࠪ䈕ཙ EnjoySport Ⲵ٬DŽ

㺘 2-1 ⴞḷᾲᘥ EnjoySport Ⲵ↓઼ֻ৽ֻ

Example Sky AirTemp Humidity Wind Water Forecast EnjoySport


1 Sunny Warm Normal Strong Warm Same Yes
2 Sunny Warm High Strong Warm Same Yes
3 Rainy Cold High Strong Warm Change No
4 Sunny Warm High Strong Cool Change Yes

൘䘉⿽ᛵߥлˈ䟷ਆӰѸṧⲴᖒᔿᶕ㺘⽪‫ٷ‬䇮઒˛ਟԕ‫ݸ‬㘳㲁ањ䖳ѪㆰঅⲴᖒᔿˈণ
ᇎֻⲴ਴኎ᙗ㓖ᶏⲴਸਆᔿDŽ൘䘉䟼ˈਟԔ⇿њ‫ٷ‬䇮Ѫ 6 њ㓖ᶏⲴੁ䟿ˈ䘉Ӌ㓖ᶏᤷᇊҶ኎
ᙗ SkyǃAirTempǃHumidityǃWindǃWater ઼ Forecast Ⲵ٬DŽ⇿њ኎ᙗਟਆ٬Ѫ˖
z ⭡Ā?ā㺘⽪ԫ᜿٬
z ᰾⺞ᤷᇊⲴ኎ᙗ٬˄ྲ AirTemp=Warm˅
z ⭡Ā‡ā㺘⽪н᧕ਇԫօ٬

ྲ᷌ḀӋᇎֻ x ┑䏣‫ٷ‬䇮 h Ⲵᡰᴹ㓖ᶏˈ䛓Ѹ h ሶ x ࠶㊫Ѫ↓ֻˈ˄h(x)=1 ˅DŽ∄ྲˈ


Ѫࡔᇊ Aldo ਚ൘ሂߧ઼▞⒯Ⲵᰕᆀ䟼䘋㹼≤к䘀ࣘ˄ᒦоަԆ኎ᙗᰐ‫˅ޣ‬ ˈ䘉ṧⲴ‫ٷ‬䇮ਟ㺘
⽪Ѫл䶒Ⲵ㺘䗮ᔿ˖

<?, Cold, High, ?, ?, ?>

ᴰа㡜Ⲵ‫ٷ‬䇮ᱟ⇿аཙ䜭ᱟ↓ֻˈਟ㺘⽪Ѫ˖

<?, ?, ?, ?, ?, ?>

㘼ᴰ⢩↺Ⲵ‫ٷ‬䇮ণ⇿аཙ䜭ᱟ৽ֻˈ㺘⽪Ѫ˖

<‡, ‡, ‡, ‡, ‡, ‡ >

㔬кᡰ䘠ˈEnjoySport 䘉њᾲᘥᆖҐԫ࣑䴰㾱ᆖҐⲴᱟ֯ EnjoySport=Yes Ⲵᰕᆀˈᒦሶ


ަ㺘⽪Ѫ኎ᙗ㓖ᶏⲴਸਆᔿDŽа㡜䈤ᶕˈԫօᾲᘥᆖҐԫ࣑㜭㻛᧿䘠Ѫ˖ᇎֻⲴ䳶ਸǃᇎֻ
䳶 ਸ к Ⲵ ⴞḷ ࠭ ᮠ ǃ ‫ى‬䘹 ‫ ٷ‬䇮 Ⲵ 䳶ਸ ԕ ৺ 䇝 㓳ṧ ֻ Ⲵ 䳶 ਸDŽ ԕ 䘉 ⿽ а㡜 ᖒ ᔿ ᇊ ѹⲴ
EnjoySport ᾲᘥᆖҐԫ࣑㿱㺘 2-2DŽ

㺘 2-2 EnjoySport ᾲᘥᆖҐԫ࣑

 ᐢ⸕˖
 ᇎֻ䳶 X˖ਟ㜭Ⲵᰕᆀˈ⇿њᰕᆀ⭡л䶒Ⲵ኎ᙗ᧿䘠˖
 Sky˄ਟਆ٬Ѫ SunnyˈCloudy ઼ Rainy˅
 AirTemp˄ਟਆ٬Ѫ Warm ઼ Cold˅
 Humidity˄ਟਆ٬Ѫ Normal ઼ High˅
 Wind˄ਟਆ٬Ѫ Strong ઼ Weak˅
 Water˄ਟਆ٬Ѫ Warm ઼ Cool˅
 Forecast˄ਟਆ٬Ѫ Same ઼ Change˅
 ‫ٷ‬䇮䳶 H˖⇿њ‫ٷ‬䇮᧿䘠Ѫ 6 њ኎ᙗ SkyˈAirTempˈHumidityˈWindˈWater ઼ Forecast Ⲵ٬㓖
ᶏⲴਸਆDŽ㓖ᶏਟԕѪĀ?ā˄㺘⽪᧕ਇԫ᜿٬˅ˈĀ‡ā˄㺘⽪ᤂ㔍ᡰᴹ٬˅ˈᡆа⢩ᇊ٬DŽ
 ⴞḷᾲᘥ c: EnjoySport: Xė{0, 1}
 䇝㓳ṧֻ䳶 D˖ⴞḷ࠭ᮠⲴ↓઼ֻ৽ֻ˄㿱㺘 2-1˅
 ≲䀓˖
 H ѝⲴа‫ٷ‬䇮 hˈ֯ሩҾ X ѝԫ᜿ xˈh(x)=c(x)DŽ

2.2.1 ᵥ䈣ᇐѿ

൘ᵜҖѝˈᡁԜ֯⭘ԕлⲴᵟ䈝ᶕ䇘䇪ᾲᘥᆖҐ䰞仈DŽᾲᘥᇊѹ൘ањᇎ ᇎֻ˄instance˅
䳶ਸѻкˈ䘉њ䳶ਸ㺘⽪Ѫ XDŽ൘ᵜֻѝˈX ᱟᡰᴹਟ㜭Ⲵᰕᆀˈ⇿њᰕᆀ⭡ SkyǃAirTempǃ
HumidityǃWindǃWater ઼ Forecast ‫ޝ‬њ኎ᙗ㺘⽪DŽᖵᆖҐⲴᾲᘥᡆ࠭ᮠ〠Ѫⴞ
ⴞḷᾲᘥ (target
concept)ˈ䇠֌ cDŽа㡜ᶕ䈤ˈc ਟԕᱟᇊѹ൘ᇎֻ X кⲴԫ᜿ᐳቄ࠭ᮠˈণ c:Xė{0, 1}DŽ൘
䘉њֻᆀ䟼ˈⴞḷᾲᘥሩᓄҾ኎ᙗ EnjoySport Ⲵ٬ˈᖃ EnjoySport=Yes ᰦ c(x)=1ˈᖃ
EnjoySport=No ᰦ c(x)=0DŽ
൘ᆖҐⴞḷᾲᘥᰦˈᗵ享ᨀ‫׋‬а྇䇝 䇝㓳ṧֻ˄training examples˅ˈ⇿њṧֻѪ X ѝⲴа
њᇎֻ x ԕ৺ᆳⲴⴞḷᾲᘥ٬ c(x)˄ྲ㺘 2-1 ѝⲴ䇝㓳ṧֻ˅DŽሩҾ c(x)=1 Ⲵᇎֻ㻛〠Ѫ↓ ↓
ֻ(positive example)ˈᡆ〠ѪⴞḷᾲᘥⲴᡀઈDŽሩҾ c(x)=0 ⲴᇎֻѪ৽ ৽ֻ(negative example)ˈ
ᡆ〠Ѫ䶎ⴞḷᾲᘥᡀઈDŽ㓿ᑨਟԕ⭘ᒿ‫<ڦ‬x,c(x)>ᶕ᧿䘠䇝㓳ṧֻˈ㺘⽪ަवਜ਼Ҷᇎֻ x ઼
ⴞḷᾲᘥ٬ c(x)DŽㅖਧ D ⭘ᶕ㺘⽪䇝㓳ṧֻⲴ䳶ਸDŽ

аᰖ㔉ᇊⴞḷᾲᘥ c Ⲵ䇝㓳ṧֻ䳶ˈᆖҐಘ䶒ѤⲴ䰞仈ቡᱟ‫ٷ‬䇮ᡆՠ䇑 cDŽ֯⭘ㅖਧ H


ᶕ㺘⽪ᡰ
ᡰᴹਟ㜭‫ٷ‬䇮(all possible hypotheses)Ⲵ䳶ਸˈ䘉њ䳶ਸ޵᡽ᱟѪ⺞ᇊⴞḷᾲᘥᡰ㘳㲁
Ⲵ㤳തDŽ䙊ᑨ H ‫׍‬䇮䇑㘵ᡰ䘹ᤙⲴ‫ٷ‬䇮㺘⽪㘼ᇊDŽH ѝ⇿њⲴ‫ٷ‬䇮 h 㺘⽪ X кᇊѹⲴᐳቄ
࠭ᮠˈণ h:Xė{0,1}DŽᵪಘᆖҐⲴⴞḷቡᱟራ᢮ањ‫ٷ‬䇮 hˈ֯ሩҾ X ѝⲴᡰᴹ xˈh(x)=c(x)DŽ

2.2.2 ᖈ㓩ᆜҖ‫ٽ‬䇴

ᵪಘᆖҐⲴԫ࣑ᱟ൘ᮤњᇎֻ䳶ਸ X к⺞ᇊоⴞḷᾲᘥ c ⴨਼Ⲵ‫ٷ‬䇮 hˈ❦㘼ᡁԜሩҾ


c ӵᴹⲴؑ᚟ਚᱟᆳ൘䇝㓳ṧֻкⲴ٬DŽഐ↔ˈᖂ㓣ᆖҐ㇇⌅ᴰཊਚ㜭‫؍‬䇱䗃ࠪⲴ‫ٷ‬䇮㜭о
䇝㓳ṧֻ⴨ᤏਸDŽྲ᷌⋑ᴹᴤཊⲴؑ᚟ˈᡁԜਚ㜭‫ٷ‬ᇊˈሩҾᵚ㿱ᇎֻᴰྭⲴ‫ٷ‬䇮ቡᱟо䇝
㓳ᮠᦞᴰ֣ᤏਸⲴ‫ٷ‬䇮DŽ䘉ᱟᖂ㓣ᆖҐⲴањสᵜ‫ٷ‬ᇊˈᵜҖѝሶሩ↔‫ڊ‬ᴤཊⲴ䱀䘠DŽ䘉䟼
ᡁԜㆰঅᨀ৺ˈ൘ㅜ 5ǃ6ǃ7 ㄐሶᴤᖒᔿॆ઼ᇊ䟿ൠᇑᇊ઼࠶᷀䘉а‫ٷ‬ᇊDŽ

ᖂ㓣ᆖҐ‫ٷ‬䇮 ԫа‫ٷ‬䇮ྲ᷌൘䏣ཏབྷⲴ䇝㓳ṧֻ䳶ѝᖸྭൠ䙬䘁ⴞḷ࠭ᮠˈᆳҏ㜭൘
ᵚ㿱ᇎֻѝᖸྭൠ䙬䘁ⴞḷ࠭ᮠDŽ

2.3 ֒Ѱᩒ㍘ⲺᾸᘫᆜҖ

ᾲᘥᆖҐਟԕⴻ֌ᱟањᩌ㍒Ⲵ䗷〻ˈ㤳തᱟ‫ٷ‬䇮Ⲵ㺘⽪ᡰ䳀ਜ਼ᇊѹⲴᮤњオ䰤DŽᩌ㍒
ⲴⴞḷᱟѪҶራ᢮㜭ᴰྭൠᤏਸ䇝㓳ṧֻⲴ‫ٷ‬䇮DŽᗵ享⌘᜿ࡠˈᖃ‫ٷ‬䇮Ⲵ㺘⽪ᖒᔿ䘹ᇊਾˈ
䛓Ѹҏቡ䳀ਜ਼ൠѪᆖҐ㇇⌅⺞ᇊҶᡰᴹ‫ٷ‬䇮Ⲵオ䰤DŽ䘉Ӌ‫ٷ‬䇮ᱟᆖҐ〻ᒿᡰ㜭㺘⽪Ⲵˈҏᱟ
ᆳ㜭ཏᆖҐⲴDŽ㘳㲁൘ EnjoySport ᆖҐԫ࣑ѝⲴᇎֻ䳶ਸ X ઼‫ٷ‬䇮䳶ਸ HDŽྲ᷌኎ᙗ Sky
ᴹ 3 ⿽ਟ㜭Ⲵ٬ˈ㘼 AirTempǃHumidityǃWindǃWater ઼ Forecast 䜭ਚᴹє⿽ਟ㜭٬ˈࡉ
ᇎֻオ䰤 X वਜ਼Ҷ 3×2×2×2×2×2=96 ⿽н਼ⲴᇎֻDŽ㊫լⲴ䇑㇇ਟᗇˈ൘‫ٷ‬䇮オ䰤 H ѝᴹ
䈝⌅н਼(syntactically distinct)Ⲵ‫ٷ‬䇮DŽ❦㘼ˈ⌘᜿ࡠवਜ਼ᴹ‡ㅖਧⲴ
5×4×4×4×4×4=5120 ⿽䈝
‫ٷ‬䇮ԓ㺘オᇎֻ䳶ਸˈণᆳԜሶ⇿њᇎֻ䜭࠶㊫Ѫ৽ֻDŽഐ↔ˈ䈝ѹн਼(semantically distinct)
Ⲵ‫ٷ‬䇮ਚᴹ 1+4×3×3×3×3×3=973 њDŽ䘉䟼Ⲵ EnjoySport ֻᆀᱟањ䶎ᑨㆰঅⲴᆖҐԫ࣑ˈ
ᆳⲴ‫ٷ‬䇮オ䰤⴨ሩ䖳ሿфᴹ䲀DŽཊᮠᇎ䱵ⲴᆖҐԫ࣑वਜ਼ᴤབྷⲴǃᴹᰦᱟᰐ䲀Ⲵ‫ٷ‬䇮オ䰤DŽ

ྲ᷌ᢺᆖҐⴻ֌ᱟањᩌ㍒䰞仈ˈ䛓Ѹᖸ㠚❦ˈሩᆖҐ㇇⌅Ⲵ⹄ウ䴰㾱㘳ḕ‫ٷ‬䇮オ䰤ᩌ
㍒Ⲵн਼ㆆ⮕DŽ⢩࡛ᕅ䎧ᡁԜ‫ޤ‬䏓Ⲵ㇇⌅ᓄ㜭ᴹ᭸ൠᩌ㍒䶎ᑨབྷⲴᡆᰐ䲀Ⲵ‫ٷ‬䇮オ䰤ˈԕ᢮
ࡠᴰ֣ᤏਸ䇝㓳ᮠᦞⲴ‫ٷ‬䇮DŽ

2.3.1 ‫ٽ‬䇴Ⲻж㡢ࡦ⢯⇀ᓅ

䇨ཊᾲᘥᆖҐ㇇⌅ѝˈᩌ㍒‫ٷ‬䇮オ䰤Ⲵᯩ⌅‫׍‬䎆Ҿަѝа⿽ᖸᴹ⭘Ⲵ㔃ᶴ˖‫ٷ‬䇮Ⲵа㡜
ࡠ⢩↺ᒿ‫ޣ‬㌫DŽ࡙⭘‫ٷ‬䇮オ䰤Ⲵ䘉⿽㠚❦㔃ᶴˈᡁԜਟԕ൘ᰐ䲀Ⲵ‫ٷ‬䇮オ䰤ѝ䘋㹼ᖫᓅⲴᩌ
㍒ˈ㘼н䴰㾱᰾⺞ൠࡇѮᡰᴹⲴ‫ٷ‬䇮DŽѪ䈤᰾а㡜ࡠ⢩↺ᒿˈ㘳㲁ԕлєњ‫ٷ‬䇮˖
h1=<Sunny, ?, ?, Strong, ?, ?>

h2=<Sunny, ?, ?, ?, ?, ?>

ଚӋᇎֻਟ㻛h1઼h2ࡂ࠶Ѫ↓ֻ˛⭡Ҿh2वਜ਼Ⲵᇎֻ㓖ᶏ䖳ቁˈᆳࡂ࠶ࠪⲴ↓ֻҏ䖳ཊDŽ
ᇎ䱵кˈԫօ㻛h1ࡂ࠶Ѫ↓ֻⲴᇎֻ䜭Պ㻛h2ࡂ࠶Ѫ↓ֻˈഐ↔ˈᡁԜ䈤h2∄h1ᴤа㡜DŽ

ⴤ㿲кⲴĀ∄ĂĂᴤа㡜ā䘉⿽‫ޣ‬㌫ਟԕྲл㋮⺞ᇊѹDŽ俆‫ˈݸ‬ሩXѝԫ᜿ᇎֻx઼Hѝ
ԫ ᜿ ‫ ٷ‬䇮 h ˈ ᡁ Ԝ 䈤 x ┑ 䏣 h ᖃ ф ӵ ᖃ h(x)=1 DŽ ⧠ ൘ ԕ ᇎ ֻ 䳶 ਸ Ⲵ ᖒ ᔿ ᇊ ѹ а њ
more-general-than-or-equal-toⲴ‫ޣ‬㌫˖㔉ᇊ‫ٷ‬䇮hj઼hkˈhj more-general-than-or-equal-to hkˈ
ᖃфӵᖃԫ᜿ањ┑䏣hkⲴᇎ਼ֻᰦҏ┑䏣hjDŽ

定义: Ԕhj ઼hk Ѫ൘XкᇊѹⲴᐳቄ࠭ᮠDŽᇊѹањmore-general-than-or-equal-to‫ޣ‬


㌫ˈ䇠‫ڊ‬ıgDŽ〠hjıg hkᖃфӵᖃ

(xęX)[(hk(x)=1)ė(hj(x)=1)]

ᴹ ᗵ 㾱 㘳 㲁 а ‫ ٷ‬䇮 ѕ Ṭ ൠ ∄ ਖ а ‫ ٷ‬䇮 ᴤ а 㡜 Ⲵ ᛵ ᖒ DŽ ഐ ↔ ˈ ᡁ Ԝ 䈤 hj ѕ Ṭ Ⲵ
more-general-than hk˄߉֌hj˚ghk˅ˈᖃфӵᖃ(hjıghk)ġ™(hkıghj)DŽᴰਾˈ䘈ਟԕᇊѹ䘶ੁ
Ⲵ‫ޣ‬㌫Ā∄ĂĂᴤ⢩↺āѪhj more-specific-than hkˈᖃhk more-general-than hjDŽ

插图——原书页码:25

Instances: ᇎֻ䳶

Hypotheses˖‫ٷ‬䇮䳶

Specific˖⢩↺

General˖а㡜

മ 2-1 ᇎֻǃ‫ٷ‬䇮઼ more-general-than ‫ޣ‬㌫


ᐖ䗩ⲴᯩṶԓ㺘ᡰᴹᇎֻⲴ䳶ਸXˈਣ䗩ⲴᯩṶԓ㺘ᡰᴹ‫ٷ‬䇮䳶ਸHDŽਣ䗩Ⲵ⇿њ‫ٷ‬䇮ሩᓄᐖ䗩Xѝ
Ḁњᆀ䳶üüণ㻛↔‫ٷ‬䇮ࡂ࠶Ѫ↓ֻⲴ䳶ਸDŽ䘎᧕‫ٷ‬䇮Ⲵ㇝ཤԓ㺘more-general-than‫ޣ‬㌫DŽ㇝ཤᡰ
ᤷѪ䖳⢩↺Ⲵ‫ٷ‬䇮DŽ⌘᜿ࡠh2ሩᓄⲴᇎֻᆀ䳶वਜ਼Ҷh1ሩᓄⲴᇎֻᆀ䳶ˈഐ↔h2 more-general-than
h 1DŽ

Ѫ䈤᰾䘉Ӌᇊѹˈ㘳㲁EnjoySportֻᆀѝⲴh1ǃh2ǃh3ˈྲമ 2-1 ᡰ⽪DŽ䘉йњ‫ٷ‬䇮ᱟྲ


օ⭡ıg‫ޣ‬㌫⴨‫ޣ‬㚄䎧ᶕⲴ˛ྲࡽᡰ䘠ˈh2∄h1ᴤа㡜ᱟഐѪ⇿њ┑䏣h1Ⲵᇎֻ䜭┑䏣h2DŽ⴨
լⲴˈh2ҏ∄h3ᴤа㡜DŽ⌘᜿h1઼h3ѻ䰤⴨ӂѻ䰤нᆈ൘ıg‫ޣ‬㌫ˈ㲭❦┑䏣䘉єњ‫ٷ‬䇮Ⲵᇎ
ֻᴹӔਐˈն⋑ᴹањ䳶ਸᆼ‫ޘ‬वਜ਼ਖањ䳶ਸDŽ⌘᜿ıg઼˚g‫ޣ‬㌫Ⲵᇊѹ⤜・ҾⴞḷᾲᘥDŽ
ᆳԜਚ‫׍‬䎆Ҿ┑䏣䘉єњ‫ٷ‬䇮Ⲵᇎֻˈ㘼оଚӋᇎֻ┑䏣ⴞḷᾲᘥᰐ‫ޣ‬DŽ⭘ᖒᔿॆⲴ䈝䀰ᶕ
䈤ˈıg‫ޣ‬㌫ᇊѹҶ‫ٷ‬䇮オ䰤HкⲴањ‫ٿ‬ᒿ˄ণ䘉њ‫ޣ‬㌫ᱟ㠚৽ǃ৽ሩ〠઼Ր䙂Ⲵ˅ DŽ‫ٿ‬ᒿ
‫ޣ‬㌫Ⲵਜ਼ѹ˄ሩᓄҾ‫ޘ‬ᒿ˅ᱟˈਟ㜭ᆈ൘h1઼h3䘉ṧⲴ‫ٷ‬䇮ሩˈ™ (h1ıgh3)㘼ф™ (h3ıgh1)DŽ

ıg‫ޣ‬㌫ᖸ䟽㾱ˈഐѪᆳ൘‫ٷ‬䇮オ䰤Hкሩԫ
ԫ᜿ᾲᘥᆖҐ䰞仈ᨀ‫׋‬Ҷа⿽ᴹ⭘Ⲵ㔃ᶴDŽ
ਾ䶒Ⲵㄐ㢲ሶ䱀䘠ᾲᘥᆖҐ㇇⌅ྲօ࡙⭘䘉а‫ٿ‬ᒿ㔃ᶴˈԕᴹ᭸ൠᩌ㍒‫ٷ‬䇮オ䰤DŽ
2.4 Find-Sφሱᢴᶷཝ⢯⇀‫ٽ‬䇴

ྲօ֯⭘ more-general-than ‫ٿ‬ᒿᶕᩌ㍒о䇝㓳ṧֻ⴨а㠤Ⲵ‫ٷ‬䇮˛а⿽࣎⌅ᱟӾ H ѝ


ᴰ⢩↺‫ٷ‬䇮ᔰ࿻ˈ❦ਾ൘䈕‫ٷ‬䇮㾶ⴆ↓ֻཡ䍕ᰦሶަа㡜ॆ˄ᖃа‫ٷ‬䇮㜭↓⺞ൠࡂ࠶ањ↓
ֻᰦˈ〠䈕‫ٷ‬䇮Ā㾶ⴆā䈕↓ֻ˅DŽ֯⭘‫ٿ‬ᒿᇎ⧠Ⲵ Find-S ㇇⌅Ⲵ㋮⺞᧿䘠㿱㺘 2-3DŽ

㺘 2-3 Find-S ㇇⌅

1. ሶ h ࡍ࿻ॆѪ H ѝᴰ⢩↺‫ٷ‬䇮
2. ሩ⇿њ↓ֻ x
 ሩhⲴ⇿њ኎ᙗ㓖ᶏai
ྲ᷌ x┑䏣ai
䛓Ѹ н‫ڊ‬ԫօһ
੖ࡉ ሶhѝaiᴯᦒѪx┑䏣Ⲵ㍗䛫Ⲵᴤа㡜㓖ᶏ
3. 䗃ࠪ‫ٷ‬䇮 h

Ѫ䈤᰾䘉а㇇⌅ˈ‫ٷ‬ᇊ㔉ҸᆖҐಘⲴа㌫ࡇ䇝㓳ṧֻྲ㺘 2-1 ᡰ⽪DŽFind-S Ⲵㅜа↕ᱟ


ሶ h ࡍ࿻ॆѪ H ѝᴰ⢩↺‫ٷ‬䇮˖

hĕ<‡, ‡, ‡, ‡, ‡, ‡>

൘ᢛ᧿ࡠ㺘 2-1 ѝㅜањ䇝㓳ṧֻᰦˈᆳࡊྭᱟњ↓ֻDŽᖸ␵ᾊˈ䘉ᰦⲴ h ཚ⢩↺ҶDŽ


h ѝⲴ⇿ањ‡㓖ᶏ䜭н㻛䈕ṧֻ┑䏣ˈഐ↔ˈ⇿њ኎ᙗ䜭㻛ᴯᦒᡀ㜭ᤏਸ䈕ֻⲴ㍗䛫Ⲵᴤ
а㡜Ⲵ٬㓖ᶏˈҏቡᱟ䘉аṧֻⲴ኎ᙗ٬ᵜ䓛˖

hĕ<Sunny, Warm, Normal, Strong, Warm, Same>

䘉њ h ӽᰗཚ⢩↺Ҷˈᆳᢺ䲔ҶㅜањṧֻԕཆⲴᡰᴹᇎֻ䜭ࡂ࠶Ѫ৽ֻDŽла↕ˈㅜ
2 њ䇝㓳ṧֻ˄ӽ❦Ѫ↓ֻ˅䘛֯䈕㇇⌅䘋а↕ሶ h ⌋ॆDŽ䘉⅑֯⭘Ā?āԓᴯ h ѝн㜭┑
䏣ᯠṧֻⲴ኎ᙗ٬DŽѻਾⲴ‫ٷ‬䇮ਈѪ˖

hĕ<Sunny, Warm, ?, Strong, Warm, Same>

❦ਾ༴⨶ㅜйњ䇝㓳ṧֻˈ䘉䟼ᱟањ৽ֻˈh нਈDŽᇎ䱵кˈFind-S ㇇⌅ㆰঅൠᘭ ᘭ⮕


⇿ањ৽ֻʽ䘉аᔰ࿻լѾᴹ⛩ཷᙚDŽ⌘᜿䘉ᰦ‫ٷ‬䇮 h ӽ❦оᯠⲴ৽ֻа㠤˄ণ h 㜭ሶ↔ֻ
↓⺞ൠࡂ࠶Ѫ৽ֻ˅ˈഐ↔н䴰㾱ሩ h ֌ԫօᴤ᭩DŽа㡜ᛵߥлˈਚ㾱ᡁԜ‫ٷ‬ᇊ‫ٷ‬䇮オ䰤 H
⺞ᇎवਜ਼ⵏ↓Ⲵⴞḷᾲᘥ cˈ㘼ф䇝㓳ṧֻнवਜ਼䭉䈟ˈ䛓ѸᖃࡽⲴ‫ٷ‬䇮 h н䴰㾱ഐ৽ֻࠪ
⧠㘼ᴤ᭩DŽ৏ഐ൘Ҿᖃࡽ‫ٷ‬䇮 h ᱟ H ѝоᡰ㿲ሏࡠⲴ↓ֻ⴨а㠤Ⲵᴰ⢩↺Ⲵ‫ٷ‬䇮ˈ⭡Ҿ‫ٷ‬
ᇊⴞḷᾲᘥ c ൘ H ѝˈ㘼фᆳаᇊᱟоᡰᴹ↓ֻа㠤Ⲵˈ䛓Ѹ c аᇊ∄ h ᴤа㡜DŽ㘼ⴞḷ
ᾲᘥ c нՊ㾶ⴆањ৽ֻˈഐ↔ h ҏнՊ˄⭡ more-general-than Ⲵᇊѹ˅
DŽഐ↔ˈሩ৽ֻˈh
н䴰㾱֌ࠪԫօ‫؞‬᭩DŽ

᧕⵰ᆼᡀ Find-S ㇇⌅ˈㅜഋњ↓ֻ֯ᗇ h ᴤа㡜˖

hĕ<Sunny, Warm, ?, Strong, ?, ?>

Find-S ㇇⌅╄⽪Ҷа⿽࡙⭘ more-general-than ‫ٿ‬ᒿᶕᩌ㍒‫ٷ‬䇮オ䰤Ⲵᯩ⌅DŽ䘉аᩌ㍒⋯


⵰‫ٿ‬ᒿ䬮ˈӾ䖳⢩↺Ⲵ‫ٷ‬䇮䙀⑀䖜〫ࡠ䖳а㡜Ⲵ‫ٷ‬䇮DŽമ 2-2 䈤᰾Ҷ൘ᇎ઼ֻ‫ٷ‬䇮オ䰤ѝⲴ
䘉⿽ᩌ㍒䗷〻DŽ൘⇿а↕ˈ‫ٷ‬䇮ਚ൘䴰㾱㾶ⴆᯠⲴ↓ֻᰦ㻛⌋ॆDŽഐ↔ˈ⇿а↕ᗇࡠⲴ‫ٷ‬䇮ˈ
䜭ᱟ൘䛓а⛩ко䇝㓳ṧֻа㠤Ⲵᴰ⢩↺Ⲵ‫ٷ‬䇮DŽ䘉ҏᱟަ਽ᆇ Find-S Ⲵ⭡ᶕDŽᾲᘥᆖҐ
Ⲵᙍᜣ൘䇨ཊн਼Ⲵ㇇⌅ѝ⭘ࡠˈᆳԜ֯⭘Ҷ਼ṧⲴ more-general-than ‫ٿ‬ᒿDŽа䜘࠶㇇⌅൘
ᵜㄐ䇘䇪ˈਖаӋ᭮൘ㅜ 10 ㄐDŽ

插图——原书页码:27

Instances: ᇎֻ䳶

Hypotheses˖‫ٷ‬䇮䳶

Specific˖⢩↺

General˖а㡜

മ 2-2 Find-S ѝⲴ‫ٷ‬䇮オ䰤ᩌ㍒


ᩌ㍒ᔰ࿻ҾHѝᴰ⢩↺Ⲵ‫ٷ‬䇮h0ˈ❦ਾṩᦞ䇝㓳ṧֻ䙀⑀а㡜ॆ˄h1ࡠh4˅DŽ൘ᇎֻオ䰤മѝˈ↓
ֻ㻛ḷԕĀ+āˈ৽ֻḷԕĀ-āˈ㘼⋑ᴹवਜ਼൘䇝㓳ṧֻѝⲴᇎֻࡉԕᇎᗳശ⛩㺘⽪DŽ

Find-S ㇇⌅Ⲵ‫ޣ‬䭞⢩⛩൘Ҿ˖ሩԕ኎ᙗ㓖ᶏⲴਸਆᔿ᧿䘠Ⲵ‫ٷ‬䇮オ䰤˄ྲ EnjoySport


ѝⲴ H˅ˈFind-S ‫؍‬䇱䗃ࠪѪ H ѝо↓ֻа㠤Ⲵᴰ⢩↺Ⲵ‫ٷ‬䇮DŽਚ㾱↓⺞Ⲵⴞḷᾲᘥवਜ਼൘
H ѝˈᒦф䇝㓳ᮠᦞ䜭ᱟ↓⺞Ⲵˈᴰ㓸Ⲵ‫ٷ‬䇮ҏоᡰᴹ৽ֻа㠤DŽ❦㘼ˈ䘉аᆖҐ㇇⌅ӽᆈ
൘аӋᵚ䀓ߣⲴ䰞仈˖
z ᆖҐ䗷〻ᱟ੖᭦ᮋࡠҶ↓⺞Ⲵⴞḷᾲᘥ˛㲭❦ Find-S ᢮ࡠҶо䇝㓳ᮠᦞа㠤Ⲵ
‫ٷ‬䇮ˈն⋑࣎⌅⺞ᇊᆳᱟ੖᢮ࡠҶᜏаਸ䘲Ⲵ‫ٷ‬䇮˄ণⴞḷᾲᘥᵜ䓛˅ˈᡆᱟ
੖䘈ᴹަԆਟ㜭Ⲵ‫ٷ‬䇮DŽᡁԜᐼᵋ㇇⌅⸕䚃ᆳ㜭੖᭦ᮋࡠⴞḷᾲᘥˈྲ᷌н㜭ˈ
㠣ቁ㾱᧿䘠ࠪ䘉⿽н⺞ᇊᙗDŽ
z ѪӰѸ㾱⭘ᴰ⢩↺Ⲵ‫ٷ‬䇮DŽྲ᷌ᴹཊњо䇝㓳ṧֻа㠤Ⲵ‫ٷ‬䇮ˈFind-S ਚ㜭᢮
ࡠᴰ⢩↺ⲴDŽѪӰѸᡁԜ‫ྭٿ‬ᴰ⢩↺Ⲵ‫ٷ‬䇮ˈ㘼н䘹ᴰа㡜‫ٷ‬䇮ˈᣁᡆа㡜〻
ᓖսҾє㘵ѻ䰤ⲴḀњ‫ٷ‬䇮DŽ
z 䇝㓳ṧֻᱟ੖⴨ӂа㠤˛൘ཊᮠᇎ䱵ⲴᆖҐ䰞仈ѝˈ䇝㓳ᮠᦞѝᑨࠪ⧠ḀӋ䭉
䈟ᡆಚ༠ˈ䘉ṧⲴна㠤Ⲵ䇝㓳䳶ሶѕ䟽⹤ൿ Find-S ㇇⌅ˈഐѪᆳᘭ⮕Ҷᡰᴹ
৽ֻDŽᡁԜᵏᵋⲴ㇇⌅㠣ቁ㜭Ự⍻ࠪ䇝㓳ᮠᦞⲴна㠤ᙗˈᒦфᴰྭ㜭ᇩ㓣䘉
ṧⲴ䭉䈟DŽ
z ྲ᷌ᴹཊњᶱབྷ⢩↺‫ٷ‬䇮ᘾѸ࣎˛൘ EnjoySport ԫ࣑Ⲵ‫ٷ‬䇮䈝䀰 H ѝˈᙫᴹа
њᜏаⲴᴰ⢩↺‫ٷ‬䇮о䇝㓳ᮠᦞа㠤DŽ❦㘼ˈሩަԆаӋ‫ٷ‬䇮オ䰤˄ਾ䶒ሶ䇘
䇪ࡠ˅ਟ㜭ᴹཊњᶱབྷ⢩↺‫ٷ‬䇮DŽ䘉⿽ᛵߥлˈFind-S ᗵ享㻛ᢙኅˈԕ‫ݱ‬䇨ަ
൘䘹ᤙᘾṧ⌋ॆ‫ٷ‬䇮Ⲵ䐟ᖴкഎⓟˈԕᇩ㓣ⴞḷ‫ٷ‬䇮սҾ‫ٿ‬ᒿ㔃ᶴⲴਖа࠶᭟
кⲴਟ㜭ᙗDŽᴤ䘋а↕ˈᡁԜਟԕᇊѹањнᆈ൘ᶱབྷ⢩↺‫ٷ‬䇮Ⲵ‫ٷ‬䇮オ䰤ˈ
❦㘼䘉ᱟањᴤ⨶䇪ᙗⲴ䰞仈㘼нᱟᇎ䐥䰞仈˄㿱Ґ仈 2.7˅

2.5 ਎ශグ䰪ૂُ䘿⎾䲚㇍⌋

ᵜ㢲᧿䘠ⲴᱟᾲᘥᆖҐⲴਖа⿽䙄ᖴণ‫ى‬ ‫ى‬䘹⎸䲔㇇⌅˄Candidate-Elimination˅DŽᆳ㜭䀓
ߣ Find-S ѝⲴ㤕ᒢн䏣ѻ༴DŽFind-S 䗃ࠪⲴ‫ٷ‬䇮ਚᱟ H ѝ㜭ཏᤏਸ䇝㓳ṧֻⲴཊњ‫ٷ‬䇮ѝ
ⲴањDŽ㘼൘‫ى‬䘹⎸䲔㇇⌅ѝˈ䗃ࠪⲴᱟо䇝㓳ṧֻа㠤Ⲵᡰᴹ‫ٷ‬䇮Ⲵ䳶ਸDŽԔӪ᛺ཷൠᱟˈ
‫ى‬䘹⎸䲔㇇⌅൘᧿䘠䘉а䳶ਸᰦн䴰㾱᰾⺞ࡇѮަᡰᴹᡀઈDŽ䘉ҏᖂ࣏Ҿ more-general-than
‫ٿ‬ᒿ㔃ᶴDŽ൘䘉䟼䴰㾱㔤ᣔања㠤‫ٷ‬䇮䳶ਸⲴㆰ⌱㺘⽪ˈ❦ਾ൘䙷ࡠᯠⲴ䇝㓳ṧֻᰦ䙀↕
㋮ॆ䘉а㺘⽪DŽ

‫ى‬䘹⎸䲔㇇⌅Ⲵᓄ⭘ᴹ˖Ӿॆᆖ䍘䉡࠶᷀˄chemical mass spectroscopy˅ѝᆖҐ㿴ࡉᙗ


(Mitchell 1979)˗઼ᆖҐ੟ਁᔿᩌ㍒Ⲵ᧗ࡦ㿴ࡉ(Mitchell et al. 1983)DŽ❦㘼ˈ‫ى‬䘹⎸䲔㇇⌅઼
Find-S ㇇⌅Ⲵᇎ䱵ᓄ⭘䜭ਇࡠ䲀ࡦˈഐѪᆳԜ൘䇝㓳ᮠᦞਜ਼ᴹಚ༠ᰦᙗ㜭䖳ᐞDŽ൘䘉䟼ӻ㓽
‫ى‬䘹⎸䲔㇇⌅ⲴⴞⲴˈᱟѪҶส⹰ⲴᵪಘᆖҐ⨶䇪ᨀ‫׋‬ањ㢟ྭⲴᾲᘥṶᷦDŽᵜㄐަ։䜘࠶
ሶኅ⽪䘉а㇇⌅৺⴨‫Ⲵޣ‬䰞仈DŽӾлаㄐᔰ࿻ሶ㘳ሏ䶒ሩᴹಚ༠ᮠᦞᰦᴤᑨ⭘ⲴᆖҐ㇇⌅DŽ

2.5.1 㺞⽰

‫ى‬䘹⎸䲔㇇⌅ራ᢮ᡰᴹо䇝㓳ṧֻа㠤Ⲵ‫ٷ‬䇮DŽѪ㋮⺞᧿䘠䘉а㇇⌅ˈ䘉䟼‫ݸ‬ᕅ‫ޕ‬аӋ
สᵜⲴᇊѹDŽ俆‫ˈݸ‬ᡁԜ〠ањ‫ٷ‬䇮ᱟо䇝㓳ṧֻа
а㠤Ⲵ(consistent)ˈᖃᆳ㜭↓⺞࠶㊫䘉Ӌ
ṧֻDŽ

定义: ањ‫ٷ‬䇮 h о䇝㓳ṧֻ䳶ਸ D а㠤(consistent)ˈᖃфӵᖃሩ D ѝ⇿ањṧֻ


<x,c(x)>ˈh(x)=c(x)DŽ

Consistent(h,D)į(<x,c(x)> ę D) h(x)=c(x)

⌘᜿䘉䟼ᇊѹⲴа а㠤оࡽ䶒ᇊѹⲴ┑
┑䏣ᴹ‫ޣ‬䭞Ⲵн਼DŽањṧֻ x ൘ h(x)=1 ᰦ〠Ѫ┑

䏣‫ٷ‬䇮 hˈн䇪 x ᱟⴞḷᾲᘥⲴ↓ֻ䘈ᱟ৽ֻDŽ❦㘼ˈ䘉аṧֻᱟ੖о h а㠤оⴞḷᾲᘥᴹ
‫ˈޣ‬ণᱟ੖ h(x)=c(x)DŽ

‫ى‬䘹⎸䲔㇇⌅㜭ཏ㺘⽪о䇝㓳ṧֻа㠤Ⲵᡰᴹ‫ٷ‬䇮DŽ൘‫ٷ‬䇮オ䰤ѝⲴ䘉аᆀ䳶㻛〠Ѫ‫ޣ‬
ਈරオ䰤(version space)ˈഐѪᆳवਜ਼ⲴᱟⴞḷᾲᘥⲴᡰᴹਸ
Ҿ‫ٷ‬䇮オ䰤 H ઼䇝㓳ṧֻ D Ⲵਈ
⨶ⲴਈරDŽ

ਈරオ䰤(version space)ˈḷ䇠ѪVSH,DˈᱟH
定义: ‫ޣ‬Ҿ‫ٷ‬䇮オ䰤H઼䇝㓳ṧֻ䳶DⲴਈ
ѝо䇝㓳ṧֻDа㠤Ⲵᡰᴹ‫ٷ‬䇮ᶴᡀⲴᆀ䳶DŽ

VSH,Dį{hęH|Consistent(h,D)}

2.5.2 ࡍ㺞੄⎾䲚㇍⌋

ᱮ❦ˈ㺘⽪ਈරオ䰤Ⲵа⿽ᯩ⌅ᱟࡇࠪަᡰᴹᡀઈDŽ䘉ṧਟӗ⭏ањㆰঅⲴ㇇⌅ˈ〠Ѫ
ࡇ㺘ਾ⎸䲔˄List-Then-Eliminate˅㇇⌅DŽަᇊѹ㿱㺘 2-4DŽ

㺘 2-4 ࡇ㺘ਾ⎸䲔㇇⌅

ࡇ㺘ਾ⎸䲔㇇⌅
1. ਈරオ䰤 VersionSpaceĕवਜ਼ H ѝᡰᴹ‫ٷ‬䇮Ⲵࡇ㺘
2. ሩ⇿њ䇝㓳ṧֻ<x, c(x)>
Ӿਈරオ䰤ѝ〫䲔ᡰᴹ h(x)Įc(x)Ⲵ‫ٷ‬䇮 h
3. 䗃ࠪ VersionSpace ѝⲴ‫ٷ‬䇮ࡇ㺘
ࡇ㺘ਾ⎸䲔㇇⌅俆‫ݸ‬ሶਈරオ䰤ࡍ࿻ॆѪवਜ਼ H ѝᡰᴹ‫ٷ‬䇮ˈ❦ਾӾѝ৫䲔оԫа䇝
㓳ṧֻна㠤Ⲵ‫ٷ‬䇮DŽवਜ਼‫ى‬䘹‫ٷ‬䇮Ⲵਈරオ䰤䲿⵰㿲ሏࡠ䎺ᶕ䎺ཊⲴṧֻ㘼㕙߿ˈⴤࡠਚ
࢙ањ˄⨶ᜣᛵߥл˅оᡰᴹṧֻа㠤Ⲵ‫ٷ‬䇮DŽ䘉ਟ㜭ቡᱟᡰ㾱ⲴⴞḷᾲᘥDŽྲ᷌⋑ᴹ‫ݵ‬䏣
Ⲵᮠᦞ֯ਈරオ䰤㕙߿ࡠਚᴹањ‫ٷ‬䇮ˈ䛓Ѹ䈕㇇⌅ሶ䗃ࠪањ䳶ਸˈ䘉њ䳶ਸѝᡰᴹⲴ‫ٷ‬
䇮о䇝㓳ṧֻ䜭а㠤DŽ

৏ࡉкˈਚ㾱‫ٷ‬䇮オ䰤ᱟᴹ䲀Ⲵˈቡਟ֯⭘ࡇ㺘ਾ⎸䲔㇇⌅DŽᆳާᴹᖸཊՈ⛩ˈྲ㜭‫؍‬
䇱ᗇࡠᡰᴹо䇝㓳ᮠᦞа㠤Ⲵ‫ٷ‬䇮DŽնᱟˈ䘉а㇇⌅䶎ᑨ✖⩀ൠࡇࠪҶ H ѝᡰᴹ‫ٷ‬䇮ˈ䘉
ሩҾབྷཊᮠᇎ䱵Ⲵ‫ٷ‬䇮オ䰤ᱟн⧠ᇎⲴ㾱≲DŽ

2.5.3 ਎ශグ䰪Ⲻᴪㆶ᱄㺞⽰

‫ى‬䘹⎸䲔㇇⌅ок䶒Ⲵࡇ㺘ਾ⎸䲔㇇⌅䚥ᗚ਼ṧⲴ৏ࡉDŽ❦㘼ˈᆳ֯⭘а⿽ᴤㆰ᰾Ⲵਈ
රオ䰤Ⲵ㺘⽪⌅DŽ൘↔ˈਈරオ䰤㻛㺘⽪ѪᆳⲴᴰа㡜Ⲵ઼ᴰ⢩↺ⲴᡀઈDŽ䘉ӋᡀઈᖒᡀҶ
а㡜઼⢩↺䗩⭼Ⲵ䳶ਸˈ䘉Ӌ䗩⭼൘ᮤњ‫ٿ‬ᒿ㔃ᶴѝࡂ࠶ࠪਈරオ䰤DŽ

插图——原书页码:31

മ 2-3 ਈරオ䰤৺ަа㡜઼⢩↺䗩⭼䳶ਸ
ਈරオ䰤ѝवਜ਼ҶᡰᴹⲴ 6 њ‫ٷ‬䇮ˈնਟԕㆰঅൠ⭘ S ઼ G ᶕ㺘⽪DŽ㇝ཤ㺘⽪ᇎֻ䰤Ⲵ
more-general-than ‫ޣ‬㌫DŽ䘉њਈරオ䰤ሩᓄҾ㺘 2-1 ѝ᧿䘠Ⲵ EnjoySport ᾲᘥᆖҐ䰞仈৺ަ䇝㓳ṧ
ֻDŽ

Ѫ䈤᰾ਈරオ䰤Ⲵ䘉⿽㺘⽪ˈ޽а⅑㘳㲁㺘 2-2 ѝ᧿䘠Ⲵ EnjoySport ᾲᘥᆖҐ䰞仈DŽሩ


Ҿ㺘 2-1 ѝ㔉ᇊⲴ 4 њ䇝㓳ṧֻˈFind-S 䗃ࠪ‫ٷ‬䇮˖

h˙<Sunny, Warm, ?, Strong, ?, ?>

ᇎ䱵кˈ䘉ਚᱟ H ѝо䇝㓳ṧֻа㠤Ⲵᡰᴹ 6 њ‫ٷ‬䇮ѻаDŽᡰᴹ 6 њ‫ٷ‬䇮൘മ 2-3 ѝ


㺘⽪ࠪDŽᆳԜᶴᡀҶо䈕ᮠᦞ䳶ਸ઼‫ٷ‬䇮㺘⽪⴨ሩᓄⲴਈරオ䰤DŽ6 њ‫ٷ‬䇮ѻ䰤Ⲵ㇝ཤ㺘⽪
ᇎֻ䰤Ⲵ more-general-than ‫ޣ‬㌫DŽ‫ى‬䘹⎸䲔㇇⌅䙊䗷֯⭘ᴰа㡜ᡀઈ˄൘മ 2-3 ѝḷѪ G˅
઼ᴰ⢩↺ᡀઈ˄മѝḷѪ S˅ᶕ㺘⽪ਈරオ䰤DŽਚ㔉ᇊ䘉єњ䳶ਸ S ઼ GˈቡਟԕࡇѮࠪਈ
රオ䰤ѝⲴᡰᴹᡀઈˈᯩ⌅ᱟ֯⭘а㡜ࡠ⢩↺‫ٿ‬ᒿ㔃ᶴᶕ⭏ᡀ S ઼ G 䳶ਸѻ䰤Ⲵᡰᴹ‫ٷ‬䇮DŽ

ਟԕⴤ㿲ൠⴻࠪˈ֯⭘ᴰа㡜઼ᴰ⢩↺䳶ਸ㺘⽪ਈරオ䰤Ⲵ֌⌅ᱟਸ⨶ⲴDŽл䶒ᡁԜ㋮
⺞ൠᇊѹ S ઼ G 䘉єњ䗩⭼䳶ਸˈᒦф䇱᰾ᆳԜ⺞ᇎԓ㺘Ҷਈරオ䰤DŽ

定义: ‫ޣ‬Ҿ‫ٷ‬䇮オ䰤 H ઼䇝㓳ᮠᦞ D Ⲵа а㡜䗩⭼˄General boundary˅Gˈᱟ൘ H ѝ


о D ⴨а㠤Ⲵᶱབྷа㡜˄maximally general˅ᡀઈⲴ䳶ਸDŽ
Gį{ gęH | Consistent(g, D)ġ(™g´ęH)[(g´ ˚g g) ġConsistent(g´, D)]}

定义: ‫ޣ‬Ҿ‫ٷ‬䇮オ䰤 H ઼䇝㓳ᮠᦞ D Ⲵ⢩ ⢩↺䗩⭼˄Specific boundary˅Sˈᱟ൘ H ѝ


о D ⴨а㠤Ⲵᶱབྷ⢩↺˄maximally specific˅ᡀઈⲴ䳶ਸDŽ

Sį{ sęH | Consistent(s, D)ġ(™s´ęH)[(s˚g s´) ġConsistent(s´, D)]}

ਚ㾱䳶ਸ G ઼ S 㻛㢟ྭൠᇊѹҶ˄㿱Ґ仈 2.7˅


ˈᆳԜቡᆼ‫ޘ‬㿴ᇊҶਈරオ䰤DŽ䘉䟼䘈
ਟԕ䇱᰾ˈਈරオ䰤Ⲵ⺞࠷㓴ᡀᱟ˖G ѝवਜ਼Ⲵ‫ٷ‬䇮䳶ˈS ѝवਜ਼Ⲵ‫ٷ‬䇮䳶ˈԕ৺ G ઼ S
ѻ䰤‫ٿ‬ᒿ㔃ᶴᡰ㿴ᇊⲴ‫ٷ‬䇮DŽ

ᇊ⨶ 2-1 ਈරオ䰤㺘⽪ᇊ⨶DŽԔ X Ѫаԫ᜿Ⲵᇎֻ䳶ਸˈH оѪ X кᇊѹⲴᐳቄ‫ٷ‬䇮Ⲵ䳶ਸDŽ


Ԕ c: Xė{0, 1}Ѫ X кᇊѹⲴԫаⴞḷᾲᘥˈᒦԔ D Ѫԫа䇝㓳ṧֻⲴ䳶ਸ{<x, c(x)>}DŽሩᡰᴹⲴ Xˈ
HˈcˈD ԕ৺㢟ྭᇊѹⲴ S ઼ G˖

VSH,D = { hęH | (sęS) (gęG) (gıghıgs)}

䇱᰾˖Ѫ䇱᰾䈕ᇊ⨶ਚ䴰䇱᰾˖(1)⇿ањ┑䏣кᔿਣ䗩Ⲵh䜭൘VSH,Dѝˈ(2) VSH,DⲴ⇿њᡀઈ䜭
┑䏣ㅹᔿਣ䗩DŽѪ䇱᰾˄1˅ˈԔgѪGѝԫ᜿ањᡀઈˈsѪSѝԫаᡀઈˈhѪHⲴԫаᡀઈ㘼фgıgh
ıgsDŽ⭡SⲴᇊѹˈsᗵ享㻛DѝᡰᴹⲴ↓ֻ┑䏣DŽഐѪhıg sˈ hҏ㻛Dѝᡰᴹ↓ֻ┑䏣DŽ⴨լൠˈ⭡G
Ⲵᇊѹˈgᗵ享н㻛Dѝԫа৽ֻ┑䏣ˈф⭡Ҿ gıg hˈhҏн㻛Dѝᡰᴹ৽ֻ┑䏣DŽ⭡Ҿ h㻛Dѝᡰᴹ
↓ֻ┑䏣фн㻛ަѝᡰᴹ৽ֻ┑䏣ˈഐ↔hоDа㠤ˈഐ↔hᱟVSH,DⲴᡀઈDŽ䘉䇱᰾Ҷ↕僔˄1˅DŽ˄2˅
Ⲵ䇘䇪〽ᗞᴹӋ༽ᵲˈਟԕ֯⭘৽䇱⌅ˈ‫ٷ‬ᇊVSH,DѝḀаhн┑䏣ㅹᔿਣ䗩ˈ䛓Ѹሶӗ⭏⸋⴮˄㿱Ґ
仈 2.6˅DŽ

2.5.4 ُ䘿⎾䲚ᆜҖ㇍⌋

‫ى‬䘹⎸䲔㇇⌅䇑㇇ࠪⲴਈරオ䰤ˈवਜ਼ H ѝᡰᴹо䇝㓳ṧֻⲴ㿲ሏࡠⲴᒿࡇа㠤Ⲵ‫ٷ‬
䇮DŽᔰ࿻ˈਈරオ䰤㻛ࡍ࿻ॆѪ H ѝᡰᴹ‫ٷ‬䇮Ⲵ䳶ਸDŽণሶ G 䗩⭼䳶ਸࡍ࿻ॆѪ H ѝᴰа
㡜Ⲵ‫ٷ‬䇮˖

G0ĕ{<?, ?, ?, ?, ?, ?>}

ᒦሶ S 䗩⭼䳶ਸࡍ࿻ॆѪᴰ⢩↺‫ٷ‬䇮˖

S0ĕ{<‡, ‡, ‡, ‡, ‡, ‡>}

䘉єњ䗩⭼䳶ਸवਜ਼Ҷᮤњ‫ٷ‬䇮オ䰤DŽഐѪHѝᡰᴹ‫ٷ‬䇮䜭∄S0ᴤа㡜ˈф∄G0ᴤ⢩↺DŽ
㇇⌅൘༴⨶⇿њ䇝㓳ṧֻᰦˈS઼G䗩⭼䳶ਸ࠶࡛㻛⌋ॆ઼⢩ॆˈӾਈරオ䰤ѝ䙀↕⎸৫о
ṧֻна㠤Ⲵ‫ٷ‬䇮DŽ൘ᡰᴹ䇝㓳ṧֻ༴⨶ᆼਾˈᗇࡠⲴਈරオ䰤ቡवਜ਼Ҷᡰᴹоṧֻа㠤Ⲵ
‫ٷ‬䇮ˈ㘼фਚवਜ਼䘉ṧⲴ‫ٷ‬䇮DŽ䘉а㇇⌅൘㺘 2-5 ѝ᧿䘠˖

㺘 2-5 ֯⭘ਈරオ䰤Ⲵ‫ى‬䘹⎸䲔㇇⌅
⌘᜿↓઼ֻ৽ֻᱟᘾṧ਼ᰦᖡ૽ S ઼ G ⲴDŽ
ሶ G 䳶ਸࡍ࿻ॆѪ H ѝᶱབྷа㡜‫ٷ‬䇮
ሶ S 䳶ਸࡍ࿻ॆѪ H ѝᶱབྷ⢩↺‫ٷ‬䇮
ሩ⇿њ䇝㓳ṧֻ dˈ䘋㹼ԕл᫽֌˖
 ྲ᷌ d ᱟа↓ֻ
 Ӿ G ѝ〫৫ᡰᴹо d на㠤Ⲵ‫ٷ‬䇮
 ሩ S ѝ⇿њо d на㠤Ⲵ‫ٷ‬䇮 s
 Ӿ S ѝ〫৫ s
 ᢺ s ⲴᡰᴹⲴᶱሿ⌋ॆᔿ h ࣐‫ ࡠޕ‬S ѝˈަѝ h ┑䏣
 h о d а㠤ˈ㘼ф G ⲴḀњᡀઈ∄ h ᴤа㡜
 Ӿ S ѝ〫৫ᡰᴹ䘉ṧⲴ‫ٷ‬䇮˖ᆳ∄ S ѝਖа‫ٷ‬䇮ᴤа㡜
 ྲ᷌ d ᱟањ৽ֻ
 Ӿ S ѝ〫৫ᡰᴹо d на㠤Ⲵ‫ٷ‬䇮
 ሩ G ѝ⇿њо d на㠤Ⲵ‫ٷ‬䇮 g
 Ӿ G ѝ〫৫ g
 ᢺ g ⲴᡰᴹⲴᶱሿ⢩ॆᔿ h ࣐‫ ࡠޕ‬G ѝˈަѝ h ┑䏣
 h о d а㠤ˈ㘼ф S ⲴḀњᡀઈ∄ h ᴤ⢩↺
 Ӿ G ѝ〫৫ᡰᴹ䘉ṧⲴ‫ٷ‬䇮˖ᆳ∄ G ѝਖа‫ٷ‬䇮ᴤ⢩↺

⌘᜿㇇⌅ѝⲴ᫽֌ˈवᤜሩ㔉ᇊ‫ٷ‬䇮Ⲵᶱሿ⌋ॆᔿ઼ᶱሿ⢩ॆᔿⲴ䇑㇇ˈᒦ⺞ᇊ䛓Ӌ䶎
ᶱሿ઼䶎ᶱབྷⲴ‫ٷ‬䇮DŽާփⲴᇎ⧠ᖃ❦‫׍‬䎆Ҿᇎ઼ֻ‫ٷ‬䇮Ⲵ㺘⽪ᯩᔿDŽ❦㘼ˈਚ㾱䘉Ӌ᫽֌
㻛㢟ྭൠᇊѹҶˈ䈕㇇⌅ቡਟᓄ⭘Ҿԫ᜿ᾲᘥᆖҐ઼ԫ᜿‫ٷ‬䇮オ䰤DŽ൘ԕлሶᇎ䱵╄⽪㇇⌅
Ⲵ䘀㹼↕僔ˈӾѝਟԕⴻࡠ൘ EnjoySport 䘉њֻᆀѝˈ䘉Ӌ᫽֌ᱟᘾṧᇎ⧠ⲴDŽ

2.5.5 ㇍⌋Ⲻ⽰ׁ

മ 2-4 ╄⽪Ҷ‫ى‬䘹⎸䲔㇇⌅ᓄ⭘ࡠ㺘 2-1 ѝཤєњ䇝㓳ṧֻᰦⲴ䘀㹼↕僔DŽྲкᡰ䘠ˈ


䗩⭼䳶ਸ‫ݸ‬㻛ࡍ࿻ॆѪG0઼S0ˈ࠶࡛ԓ㺘Hѝᴰа㡜઼ᴰ⢩↺Ⲵ‫ٷ‬䇮DŽ

插图——原书页码:34

Training examples: 䇝㓳ṧֻ

മ 2-4 ‫ى‬䘹⎸䲔㇇⌅↕僔 1
S0઼G0ѪᴰࡍⲴ䗩⭼䳶ਸˈ࠶࡛ሩᓄᴰ⢩↺઼ᴰа㡜‫ٷ‬䇮DŽ䇝㓳ṧֻ 1 ઼ 2 ֯ᗇS䗩⭼ਈᗇᴤа㡜ˈ
ྲFind-S㇇⌅ѝаṧDŽ䘉ӋṧֻሩG䗩⭼⋑ᴹᖡ૽DŽ

ᖃㅜањ䇝㓳ṧֻࠪ⧠ᰦ˄䘉䟼Ѫа↓ֻ˅ˈ‫ى‬䘹⎸䲔㇇⌅ỰḕS䗩⭼ˈᒦਁ⧠ᆳ䗷Ҿ⢩
↺ҶüüഐѪᆳн㜭㾶ⴆ䈕↓ֻDŽ䘉а䗩⭼ቡ㻛‫؞‬᭩Ѫ㍗䛫ᴤа㡜Ⲵ‫ٷ‬䇮ˈԕ㾶ⴆᯠⲴṧֻDŽ
‫؞‬᭩ਾⲴ䗩⭼൘മ 2-4 ѝᱮ⽪ѪS1DŽG䗩⭼н䴰㾱‫؞‬᭩ˈഐѪG0㜭ཏ↓⺞ൠ㾶ⴆ䈕ṧֻDŽᖃ
༴⨶ㅜҼњ䇝㓳ṧֻᰦ˄ҏᱟˉ↓ֻ˅ˈ਼ṧൠˈ䴰㾱ሶS䘋а↕⌋ॆࡠS2 ˈGӽᰗнਈ
˄G2=G1=G0˅DŽ⌘᜿ሩཤєњ↓ֻⲴ༴⨶䶎ᑨ㊫լҾFind-S㇇⌅DŽ
൘ཤє↕Ⲵ㇇⌅ѝˈ↓ֻ֯ᗇਈරオ䰤ⲴS䗩⭼䙀⑀⌋ॆDŽ㘼৽ֻᢞ╄Ⲵ䀂㢢ᚠྭ⴨৽ˈ
֯ᗇG䗩⭼䙀⑀⢩ॆDŽ㘳㲁ㅜйњ䇝㓳ṧֻˈྲമ 2-5 ᡰ⽪DŽ䘉а৽ֻᱮ⽪ˈG䗩⭼䗷Ҿа
㡜ҶDŽҏቡᱟ䈤ˈGѝⲴ‫ٷ‬䇮䭉䈟ൠሶ䈕ֻࡔᇊѪ↓ֻҶDŽഐ↔G䗩⭼ѝⲴ‫ٷ‬䇮ᗵ享㻛⢩ॆˈ
֯ᆳ㜭ሩᯠⲴ৽ֻ↓⺞࠶㊫DŽྲമ 2-5 ᡰ⽪ˈ䘉䟼ᴹࠐ⿽ਟ䘹Ⲵᶱሿᴤ⢩↺Ⲵ‫ٷ‬䇮DŽ䘉Ӌ‫ޘ‬
䜭ᡀѪᯠⲴG3䗩⭼䳶ਸⲴᡀઈDŽ

插图——原书页码:35

Training examples: 䇝㓳ṧֻ

മ 2-5 ‫ى‬䘹⎸䲔㇇⌅↕僔 2
ṧֻ 3 ᱟа৽ֻˈᆳᢺG2䗩⭼⢩ॆѪG3DŽ⌘᜿൘G3ѝᴹཊњਟ䘹Ⲵᶱབྷа㡜‫ٷ‬䇮DŽ

ᴹ 6 њ኎ᙗਟԕ⭘ᶕ֯G2⢩ॆˈѪӰѸਚᴹ 3 њ൘G3ѝ઒˛∄ྲh=<?, ?, Normal, ?, ?, ?>


ᱟG2Ⲵањᶱሿ⢩ॆᔿˈᆳ㜭ཏሶᯠⲴṧֻ↓⺞ൠࡂ࠶Ѫ৽ֻˈնᆳн൘G3ѝDŽሶ䘉а‫ٷ‬
䇮ᧂ䲔൘ཆⲴ৏ഐᱟˈᆳоԕࡽ䙷ࡠⲴ↓ֻна㠤DŽ൘㇇⌅ѝਚᱟㆰঅൠࡔᯝhᒦн∄ᖃࡽ
⢩↺䗩⭼S2ᴤа㡜DŽᇎ䱵кਈරオ䰤ⲴS䗩⭼ᖒᡀҶԕᖰ↓ֻⲴ᪈㾱䈤᰾ˈᆳਟԕ⭘ᶕࡔᯝ
ԫօ㔉ᇊⲴ‫ٷ‬䇮ᱟ੖оԕᖰṧֻа㠤DŽṩᦞᇊѹˈԫօ∄Sᴤа㡜Ⲵ‫ٷ‬䇮㜭ཏ㾶ⴆᡰᴹS㜭㾶
ⴆⲴṧֻˈণԕᖰⲴᡰᴹ↓ֻDŽ਼ṧˈG䗩⭼䈤᰾Ҷԕᖰᡰᴹ৽ֻⲴؑ᚟DŽԫօ∄Gᴤ⢩↺
Ⲵ‫ٷ‬䇮㜭‫؍‬䇱оᡰᴹ৽ֻ⴨а㠤DŽ䘉ᱟഐѪṩᦞᇊѹˈԫа‫ٷ‬䇮нՊ㾶ⴆGᡰн㜭㾶ⴆⲴṧ
ֻDŽ

ㅜഋњ䇝㓳ṧֻˈྲമ 2-6 ᡰ⽪ˈ֯ਈරオ䰤Ⲵ S 䗩⭼ᴤа㡜ॆDŽᆳҏሬ㠤 G 䗩⭼ѝ


Ⲵањᡀઈ㻛ࡐ䲔ˈഐѪ䘉њᡀઈн㜭㾶ⴆᯠⲴ↓ֻDŽᴰਾ䘉аࣘ֌ᶕ㠚Ҿ㺘 2-5 ㇇⌅ѝĀྲ
᷌ d ᱟа↓ֻāлⲴㅜа↕僔DŽѪ⨶䀓䘉а↕Ⲵ৏ഐˈ䴰㾱㘳㲁ѪӰѸна㠤Ⲵ‫ٷ‬䇮㾱Ӿ G
ѝ〫৫DŽ⌘᜿䘉а‫ٷ‬䇮н㜭޽㻛⢩ॆˈഐѪ䘉ṧᆳሶн㜭㾶ⴆᯠⲴṧֻDŽᆳҏн㜭㻛⌋ॆˈ
ഐѪ᤹➗ G Ⲵᇊѹˈԫօᴤа㡜Ⲵ‫ٷ‬䇮㠣ቁՊ㾶ⴆањ৽ֻDŽ䘉ṧˈ䘉а‫ٷ‬䇮ᗵ享Ӿ G ѝ
〫৫ˈҏ⴨ᖃҾ〫৫Ҷਈරオ䰤Ⲵ‫ٿ‬ᒿ㔃ᶴѝⲴаᮤњ࠶᭟DŽ

插图——原书页码:36 к

Training examples: 䇝㓳ṧֻ

മ 2-6 ‫ى‬䘹⎸䲔㇇⌅↕僔 3
↓ֻ֯S䗩⭼ᴤа㡜ˈӾS3ਈѪS4DŽG3Ⲵањᡀઈҏᗵ享㻛ࡐ䲔ˈഐѪᆳн޽∄S4䗩⭼ᴤа㡜DŽ
൘༴⨶ᆼ䘉 4 њṧֻਾˈ䗩⭼䳶ਸS4઼G4ࡂ࠶ࠪⲴਈරオ䰤वਜ਼Ҷоṧֻа㠤Ⲵᡰᴹ‫ٷ‬
䇮Ⲵ䳶ਸDŽᮤњਈරオ䰤ˈवਜ਼䛓Ӌ⭡S4઼G4⭼ᇊⲴ‫ٷ‬䇮䜭൘മ 2-7 ѝ⽪ࠪDŽ䘉аਈරオ䰤
н‫׍‬䎆Ҿ䇝㓳ṧᵜࠪ⧠Ⲵ⅑ᒿ˄ഐѪᴰ㓸ᆳवਜ਼Ҷо䇝㓳ṧֻ䳶а㠤Ⲵᡰᴹ‫ٷ‬䇮˅DŽྲ᷌ᨀ
‫׋‬ᴤཊⲴ䇝㓳ᮠᦞˈS઼G䗩⭼ሶ㔗㔝অ䈳〫ࣘᒦ⴨ӂ䶐䘁ˈࡂ࠶ࠪ䎺ᶕ䎺ሿⲴਈරオ䰤ᶕDŽ

插图——原书页码:36 л

മ 2-7 EnjoySport ᾲᘥᆖҐ䰞仈ѝⲴᴰ㓸Ⲵਈරオ䰤

2.6 ީӄ਎ශグ䰪ૂُ䘿⎾䲚Ⲻ䈪᱄

2.6.1 ُ䘿⎾䲚㇍⌋ᱥੜՐ᭬ᮑࡦ↙⺤Ⲻ‫ٽ‬䇴

⭡‫ى‬䘹⎸䲔㇇⌅ᗇࡠⲴਈරオ䰤㜭ཏ᭦ᮋࡠ᧿䘠ⴞḷᾲᘥⲴ‫ٷ‬䇮ⲴᶑԦᱟ˄1˅൘䇝㓳
ṧֻѝ⋑ᴹ䭉䈟˄2˅൘ H ѝ⺞ᇎवਜ਼᧿䘠ⴞḷᾲᘥⲴ↓⺞‫ٷ‬䇮DŽᇎ䱵кˈྲ᷌䙷ࡠᯠⲴ䇝
㓳ṧֻˈਟԕⴁ⍻ਈරオ䰤ԕࡔᇊަоⵏ↓Ⲵⴞḷᾲᘥѻ䰤ᱟ੖䘈ᴹ࠶↗ˈԕ৺Ѫ㋮⺞⺞ᇊ
ⴞḷᾲᘥ䘈䴰㾱ཊቁ䇝㓳ṧֻDŽᖃ S ઼ G 䗩⭼䳶ਸ᭦ᮋࡠঅњⲴਟ⺞ᇊⲴ‫ٷ‬䇮ᰦˈⴞḷᾲ
ᘥ᡽ⵏ↓㧧ᗇDŽ

ྲ᷌䇝㓳ᮠᦞѝवਜ਼䭉䈟Պᘾṧ˛∄ྲˈԕкֻᆀѝㅜҼњṧֻ㻛䭉䈟ൠḷ⽪Ѫа৽
ֻDŽ䘉⿽ᛵߥлˈᖸнᒨˈ㇇⌅㛟ᇊՊӾਈරオ䰤ѝࡐ䲔↓⺞ⲴⴞḷᾲᘥDŽഐѪᆳՊࡐ䲔ᡰ
ᴹоṧֻна㠤Ⲵ‫ٷ‬䇮ˈᡰԕ൘䙷ࡠ䘉а䭉䈟Ⲵ৽ֻᰦˈ㇇⌅ሶӾਈරオ䰤ѝ〫৫↓⺞Ⲵⴞ
ḷᾲᘥDŽᖃ❦ˈྲ᷌㔉ᇊ䏣ཏⲴ䇝㓳ᮠᦞˈᴰ㓸ˈᡁԜՊਁ⧠ S ઼ G 䗩⭼᭦ᮋᗇࡠањオ
Ⲵਈරオ䰤ˈӾ㘼ᗇ⸕䇝㓳ᮠᦞᴹ䈟DŽオⲴਈරオ䰤㺘⽪ H ѝ⋑
⋑ᴹ‫ٷ‬䇮㜭ཏоṧֻа㠤DŽ
⴨լⲴᛵᖒՊࠪ⧠൘ਖа⿽⧟ຳѝ˖ᖃ䇝㓳ṧֻ↓⺞ˈնⴞḷᾲᘥн㜭⭡‫ٷ‬䇮㺘⽪ᯩᔿᡰ᧿
䘠˄∄ྲⴞḷᾲᘥᱟḀࠐњ኎ᙗ⢩ᖱⲴ᷀ਆˈ㘼‫ٷ‬䇮オ䰤ਚ᭟ᤱਸਆⲴᖒᔿ˅DŽԕਾᡁԜሶ
䈖㓶㘳㲁䘉Ӌਟ㜭ᙗDŽⴞࡽˈᡁԜਚ㘳㲁ṧֻᮠᦞᱟ↓⺞Ⲵᒦфⴞḷᾲᘥ⺞ᇎ൘‫ٷ‬䇮オ䰤ѝDŽ

2.6.2 сж↛䴶㾷ӶѾṭⲺ䇣㓹ṭׁ

ࡠ䘉䟼ᡁԜ䜭‫ٷ‬ᇊ䇝㓳ṧֻ⭡Ḁњཆ䜘Ⲵᯭᮉ㘵ᨀ‫׋‬DŽ‫ٷ‬ᜣᆖҐಘਟԕѫᇠᇎ傼䘋〻ˈ
ла↕ᆳ㾱㠚ᐡ䘹ᤙањᇎֻˈ❦ਾӾཆ⭼˄㠚❦⭼ᡆањᯭᮉ㘵˅㧧ᗇ䈕ᇎֻⲴ↓⺞࠶㊫
㔃᷌DŽ䘉а൪Ჟਟ࠶Ѫє⿽ᛵߥˈа⿽ᱟᆖҐಘ൘㠚❦⭼ѝ䘋㹼ᇎ傼˄ྲ䙐аᓗᯠẕ❦ਾ䇙
㠚❦⭼ߣᇊަᱟ੖⢒പ˅ˈᡆ൘ањᯭᮉ㘵ᤷሬлᆖҐ˄ᨀࠪаᓗᯠẕằⲴ䇮䇑ˈ❦ਾ䇙ᯭ
ᮉ㘵ᶕࡔᯝᆳᱟ੖⢒പ˅ ḕ䈒˄query˅ᶕԓ㺘ᆖҐಘᔪ・Ⲵ䘉њᇎֻˈ❦ਾ⭡
DŽᡁԜ䘉䟼⭘ḕ
ཆ⭼ᶕሩᆳ࠶㊫DŽ

޽⅑㘳㲁മ 2-3 ѝᡰ⽪ⲴӾ EnjoySport Ⲵ 4 њṧֻѝᆖҐࡠⲴਈරオ䰤DŽ䘉ᰦᆖҐಘᘾ


ṧ㜭ᨀࠪањ䖳ྭⲴḕ䈒˛а㡜ᛵߥлᘾṧ䟷ਆа⿽ྭⲴḕ䈒ㆆ⮕˛ᱮ❦ᆖҐಘᓄ䈅മ൘
ᖃࡽਈරオ䰤ѝ䘹ᤙ‫ٷ‬䇮ˈԕ䘋а↕ࡂ࠶䈕オ䰤DŽഐ↔ˈ䴰㾱䘹ᤙⲴᇎֻ䴰┑䏣˖ᆳ㜭㻛ਈ
රオ䰤ѝаӋ‫ٷ‬䇮࠶㊫Ѫ↓ֻˈਖаӋ࠶㊫Ѫ৽ֻDŽަѝањ䘉ṧⲴᇎֻᱟ˖

<Sunny, Warm, Normal, Light, Warm, Same>

⌘᜿䘉аᇎֻ┑䏣ਈරオ䰤Ⲵ 6 њ‫ٷ‬䇮ѝⲴ 3 њDŽྲ᷌ᯭᮉ㘵ሶᇎֻࡂ࠶Ѫ↓ֻˈਈර


オ䰤Ⲵ S 䗩⭼ቡ䴰㾱㻛⌋ॆDŽ⴨৽ˈྲ᷌ᯭᮉ㘵ࡂ࠶ަѪ৽ֻˈG 䗩⭼䴰㾱㻛⢩ॆDŽᰐ䇪ଚ
⿽ᛵߥˈᵪಘሶ㜭ཏᆖࡠᴤཊⲴ⸕䇶ˈԕ⺞ᇊⴞḷᾲᘥˈᒦሶਈරオ䰤㕙ሿࡠ৏ᶕⲴаॺDŽ

а㡜ᶕ䈤ˈᾲᘥᆖҐⲴᴰՈḕ䈒ㆆ⮕ˈᱟӗ⭏ᇎֻԕ┑䏣ᖃࡽਈරオ䰤ѝབྷ㠤ॺᮠⲴ‫ٷ‬
䇮DŽྲ↔ˈਈරオ䰤Ⲵབྷሿਟԕ൘䙷ࡠ⇿њᯠṧֻᰦ߿ॺˈ↓⺞Ⲵⴞḷᾲᘥቡਟ൘ªlog2|VS|º
⅑ᇎ傼ਾᗇࡠDŽ䘉ᴹ⛩䊑⧙Ā20 䰞ā⑨ᠿˈ䙊䗷䰞仈Ⲵᱟˋ੖എㆄ䙀⑀㧧ᗇ䰞仈Ⲵᴰ㓸ㆄ
Ṹˈ⧙ 20 䰞⑨ᠿⲴㆆ⮕ᱟᨀⲴ䰞仈ᴰྭ㜭ᢺ‫ى‬䘹ㆄṸ߿ॺDŽ㲭❦൘മ 2-3 Ⲵਈරオ䰤ѝˈ
ᡁԜਟԕ⭏ᡀањᇎֻሶަ㋮⺞ൠ࠶ॺDŽնа㡜ᛵߥлˈਟ㜭ᰐ⌅ᶴ䙐ࠪ䘉ṧⲴ㋮⺞࠶ॺⲴ
ᇎֻDŽ䘉ṧˈḕ䈒Ⲵᮠⴞਟ㜭ՊཊҾªlog2|VS|ºDŽ

2.6.3 ᙄṭֵ⭞уᇂ‫ޞ‬ᆜҖᾸᘫ

൘к䶒Ⲵֻᆀѝˈྲ᷌䲔Ҷ 4 њṧֻѻཆ⋑ᴹᴤཊⲴ䇝㓳ṧֻˈնᵪಘ⧠൘㾱ሩᵚ㿱䗷
Ⲵᇎֻ䘋㹼࠶㊫DŽ㲭❦മ 2-3 Ⲵਈරオ䰤ѝӽवਜ਼ཊњ‫ٷ‬䇮ˈণⴞḷᾲᘥ䘈ᵚᆼ‫ޘ‬ᆖҐࡠˈ
ӽ❦ᴹਟ㜭ሩᯠṧֻ䘋㹼аᇊਟؑᓖⲴ࠶㊫DŽѪ⽪㤳䘉а䗷〻ˈ‫ٷ‬ᇊᵪಘ䴰㾱ሩ㺘 2-6 ѝⲴ
4 њᯠᇎֻ䘋㹼࠶㊫DŽ

㺘 2-6 ᖵ࠶㊫Ⲵᯠᇎֻ
Instance Sky AirTemp Humidity Wind Water Forecast EnjoySport
A Sunny Warm Normal Strong Cool Change ?
B Rainy Cold Normal Light Warm Same ?
C Sunny Warm Normal Light Warm Same ?
D Sunny Cold Normal Strong Warm Same ?

⌘᜿ˈ㲭❦ᇎֻ A н൘䇝㓳ṧֻѝˈնᖃࡽਈරオ䰤ѝˈ⇿њ‫ٷ‬䇮˄㿱മ 2-3˅䜭ሶަ


࠶㊫Ѫ↓ֻDŽ⭡Ҿਈරオ䰤Ⲵᡰᴹ‫ٷ‬䇮а㠤਼᜿ᇎֻ A Ѫ↓ֻˈᆖҐಘሶ A ࡂ࠶Ѫ↓ֻⲴ
ਟؑᓖˈоਚᴹঅњⲴⴞḷᾲᘥᰦаṧDŽн㇑ਈරオ䰤ѝଚњ‫ٷ‬䇮ᴰ㓸ᡀѪⴞḷᾲᘥˈᆳ䜭
Պሶަࡂ࠶Ѫ↓ֻDŽ䘋а↕ˈᡁԜ⸕䚃н䴰㾱ࡇѮਈරオ䰤ѝᡰᴹⲴ‫ٷ‬䇮ˈቡਟ⸕䚃⇿њ‫ٷ‬
䇮䜭Պሶަࡂ࠶Ѫ↓ֻDŽ䘉аᶑԦᡀ・ᖃфӵᖃᇎֻ┑䏣 S Ⲵ⇿њᡀઈ˄ѪӰѸ˛˅ DŽ৏ഐ
ᱟਈරオ䰤ѝⲴަԆ⇿њ‫ٷ‬䇮ˈ䜭㠣ቁ∄ S ⲴḀњᡀઈᴤа㡜DŽ⭡ᡁԜⲴ more-general-than
Ⲵᇊѹˈྲ᷌ᯠⲴᇎֻ┑䏣 S Ⲵᡰᴹᡀઈˈᆳаᇊҏ┑䏣䘉Ӌᴤа㡜Ⲵ‫ٷ‬䇮DŽ

⴨լൠˈᇎֻ B 㻛ਈරオ䰤ѝⲴ⇿њ‫ٷ‬䇮ࡂ࠶Ѫ৽ֻDŽᡰԕ䘉њᇎֻਟ㻛᭮ᗳൠࡂ࠶
Ѫ৽ֻˈণ֯ᾲᘥᱟнᆼ‫ޘ‬ᆖҐⲴDŽሩ䘉аᶑԦⲴ⍻䈅Ⲵᴹ᭸ᯩ⌅ᱟˈࡔᯝᇎֻн┑䏣 G
ѝⲴᡰᴹᡀઈ˄ѪӰѸ˛˅DŽ

ᇎֻ C Ⲵᛵߥᴹᡰн਼DŽਈරオ䰤ѝॺᮠⲴ‫ٷ‬䇮ࡂ࠶ަѪ↓ֻˈॺᮠࡂ࠶Ѫ৽ֻDŽഐ
↔ˈᆖҐಘᰐ⌅ਟؑൠ࠶㊫䘉аṧֻˈ䲔䶎ᨀ‫׋‬ᴤཊⲴ䇝㓳ṧֻDŽ⌘᜿ࡠˈᇎֻ C оࡽа
㢲ᨀࠪⲴањᴰՈḕ䈒⴨਼DŽ䘉ᱟਟԕ亴㿱ⲴˈഐѪᴰᴹ࠶㊫↗ѹᙗⲴᇎֻҏаᇊᴰ㜭ᨀ‫׋‬
ᯠⲴ࠶㊫ؑ᚟DŽ

ᴰਾˈᇎֻ D ൘ਈරオ䰤ѝ㻛єњ‫ٷ‬䇮࠶Ѫ↓ֻˈ㻛ަԆ 4 њ‫ٷ‬䇮࠶Ѫ৽ֻDŽ䘉њֻ


ᆀⲴ࠶㊫ਟؑᓖ∄ᇎֻ A ઼ B 㾱ሿDŽᣅ⾘䘹Ѯ㾱‫ੁٮ‬Ҿ৽ֻ࠶㊫ˈᡰԕᡁԜਟԕ䗃ࠪᤕᴹ
ᴰབྷ⾘ᮠⲴ࠶㊫ˈ䘈ਟ䱴ᑖањਟؑᓖ∄ֻԕ㺘᰾ᣅ⾘Ⲵ‫ੁٮ‬〻ᓖDŽ൘ㅜ 6 ㄐሶ䇘䇪ࡠˈྲ
᷌‫ٷ‬ᇊ H ѝᡰᴹ‫ٷ‬䇮ᱟᴹ⴨ㅹⲴ‫ݸ‬傼ᾲ⦷ˈ䛓Ѹᣅ⾘Ⲵᯩ⌅㜭ᗇࡠᯠᇎֻⲴᴰਟ㜭࠶㊫DŽ
䘋а↕Ⲵˈᣅ↓ֻ⾘‫ٷ‬䇮ᡰঐⲴ∄ֻਟ㿶Ѫ˖൘㔉ᇊ䇝㓳ᮠᦞᰦˈᇎֻѪ↓ֻⲴਟ㜭ᙗDŽ

2.7 ᖈ㓩‫څ‬㖤

ྲкᡰ䘠ˈ൘㔉ᇊ↓⺞Ⲵ䇝㓳ṧֻᒦф‫؍‬䇱ࡍ࿻‫ٷ‬䇮オ䰤वਜ਼ⴞḷᾲᘥᰦˈ‫ى‬䘹⎸䲔㇇
⌅ਟԕ᭦ᮋࡠⴞḷᾲᘥDŽྲ᷌ⴞḷᾲᘥн൘‫ٷ‬䇮オ䰤ѝᘾѸ࣎˛ᱟ੖ਟ䇮䇑аवਜ਼ᡰᴹ‫ٷ‬䇮
Ⲵオ䰤ᶕ䀓ߣ䘉аഠ䳮˛‫ٷ‬䇮オ䰤ⲴབྷሿሩҾ㇇⌅᧘ᒯࡠᵚ㿱ᇎֻⲴ㜭࣋ᴹӰѸᖡ૽˛‫ٷ‬
䇮オ䰤Ⲵབྷሿሩᡰ䴰䇝㓳ṧֻⲴᮠ䟿ᴹӰѸᖡ૽˛䘉Ӌ䜭ᱟᖂ㓣᧘⨶ѝⲴаӋสᵜ䰞仈DŽ䘉
䟼ᡁԜ൘‫ى‬䘹⎸䲔㇇⌅ѝ㘳ሏ䘉Ӌ䰞仈DŽ❦㘼ਟԕⴻࡠˈ䘉䟼Ⲵ࠶᷀ѝᗇࡠⲴ㔃䇪ਟԕᓄ⭘
Ҿԫ᜿ⲴᾲᘥᆖҐ㌫㔏DŽ

2.7.1 жѠᴿ‫ٽⲺڅ‬䇴グ䰪

ྲ᷌ᜣ‫؍‬䇱‫ٷ‬䇮オ䰤वਜ਼ⴞḷᾲᘥˈањ᰾ᱮⲴᯩ⌅ᱟᢙབྷ‫ٷ‬䇮オ䰤ˈ֯⇿њਟ㜭Ⲵ‫ٷ‬
䇮䜭वਜ਼൘޵DŽ޽а⅑֯⭘ EnjoySport 䘉њֻᆀˈަѝᡁԜሶ‫ٷ‬䇮オ䰤䲀ࡦѪਚवਜ਼኎ᙗ٬
ⲴਸਆDŽ⭡Ҿ䘉а䲀ࡦˈ‫ٷ‬䇮オ䰤н㜭ཏ㺘⽪ᴰㆰঅⲴ᷀ਆᖒᔿⲴⴞḷᾲᘥˈྲĀSky=Sunny
ᡆ Sky=CloudyāDŽᇎ䱵кˈྲ᷌㔉ᇊԕлйњ䇝㓳ṧֻˈᆳԜᶕ㠚Ҿ䈕᷀ਆᔿ‫ٷ‬䇮ˈᡁԜⲴ
㇇⌅ሶᗇࡠањオⲴਈරオ䰤DŽ
Example Sky AirTemp Humidity Wind Water Forecast EnjoySport
1 Sunny Warm Normal Strong Cool Change Yes
2 Cloudy Warm Normal Strong Cool Change Yes
3 Rainy Warm Normal Strong Cool Change No

ѻᡰԕнᆈ൘о䘉 3 њṧֻа㠤Ⲵ‫ٷ‬䇮Ⲵ৏ഐᱟˈоཤєњṧֻа㠤ˈᒦф㜭൘㔉ᇊ‫ٷ‬
䇮オ䰤 H ѝ㺘⽪Ⲵᴰ⢩↺Ⲵ‫ٷ‬䇮ᱟ˖

S2: <?, Warm, Nornal, Strong, Cool, Change>

䘉а‫ٷ‬䇮㲭❦ᱟ H ѝоṧֻа㠤Ⲵᴰ⢩↺Ⲵ‫ٷ‬䇮ˈᆳӽ❦䗷Ҿа㡜ॆҶ˖ᆳሶㅜйњ
ṧֻ䭉䈟ൠࡂѪ↓ֻDŽ䰞仈൘ҾˈᡁԜ֯ᆖҐಘ‫ੁٿ‬Ҿਚ㘳㲁ਸਆⲴ‫ٷ‬䇮ˈ䘉䟼䴰㾱㺘⽪㜭
࣋ᴤᕪⲴ‫ٷ‬䇮オ䰤DŽ

2.7.2 ᰖ‫Ⲻڅ‬ᆜҖಞ

ᖸᱮ❦ˈѪҶ‫؍‬䇱ⴞḷᾲᘥ൘‫ٷ‬䇮オ䰤ѝˈ䴰㾱ᨀ‫׋‬ањ‫ٷ‬䇮オ䰤ˈᆳ㜭㺘䗮ᡰᴹⲴਟ ਟ
ᮉᦸᾲᘥ(every teachable concept)DŽᦒ䀰ѻˈᆳ㜭ཏ㺘䗮ᇎֻ䳶 X Ⲵᡰᴹਟ㜭Ⲵᆀ䳶DŽа㡜
ൠˈᡁԜᢺ䳶ਸ X ᡰᴹᆀ䳶Ⲵ䳶ਸ〠Ѫ X Ⲵᑲ ᑲ䳶˄power set˅DŽ

ֻྲ൘EnjoySportᆖҐԫ࣑ѝˈ֯⭘ 6 ⿽኎ᙗ᧿䘠Ⲵᇎֻオ䰤XⲴབྷሿѪ 96DŽ൘䘉аᇎ


ֻ䳶ਸкਟԕᇊѹཊቁᾲᘥ˛ᦒ䀰ѻˈXⲴᑲ䳶བྷሿᱟӰѸ˛а㡜䈤ᶕ൘䳶ਸXкᇊѹⲴ⴨
ᔲᆀ䳶ᮠⴞ˄ণXᑲ䳶Ⲵབྷሿ˅Ѫ 2|X|ˈަѝ|X|ᱟXⲴ‫ݳ‬㍐ᮠⴞDŽഐ↔൘䘉аᇎֻオ䰤кਟᇊ
ѹ 296ˈᡆབྷ㓖ᱟ 1028њн਼Ⲵⴞḷᾲᘥˈ䘉ҏᱟᆖҐಘᡰ䴰㾱ᆖҐⲴⴞḷᾲᘥᮠⴞDŽഎᗶ
2.3 㢲ѝਸਆ‫ٷ‬䇮オ䰤ਚ㜭㺘⽪ 973 њ‫ٷ‬䇮üüᇎ൘ᱟањ‫ٿ‬㖞ᖸབྷⲴ‫ٷ‬䇮オ䰤ʽ

⧠൘ሶ EnjoySport ᆖҐԫ࣑䟽ᯠᇊѹѪа⿽ᰐ‫Ⲵٿ‬ᖒᔿDŽᯩ⌅ᱟᇊѹањᯠⲴ‫ٷ‬䇮オ䰤


H´ˈᆳ㜭㺘⽪ᇎֻⲴ⇿ањᆀ䳶ˈҏቡᱟᢺ H´ሩᓄࡠ X Ⲵᑲ䳶DŽᇊѹ H´Ⲵа⿽࣎⌅ᱟˈ‫ݱ‬
䇨֯⭘ࡽ䶒Ⲵ‫ٷ‬䇮Ⲵԫ᜿᷀ਆǃਸਆ઼੖ᇊᔿDŽֻྲⴞḷᾲᘥĀSky=Sunny ᡆ Sky=Cloudyā
ਟ㻛᧿䘠Ѫ˖

<Sunny, ?, ?, ?, ?, ?> Ģ <Cloudy, ?, ?, ?, ?, ?>

㔉ᇊ䘉ṧⲴ‫ٷ‬䇮オ䰤ˈᡁԜቡਟԕᆹ‫ޘ‬ൠ֯⭘‫ى‬䘹⎸䲔㇇⌅ˈ㘼нᗵᣵᗳᰐ⌅㺘䗮ⴞḷ
ᾲᘥDŽ❦㘼ˈ㲭❦䘉њ‫ٷ‬䇮オ䰤ᧂ䲔Ҷ㺘䗮㜭࣋Ⲵ䰞仈ˈᆳ৸ӗ⭏ҶањᯠⲴǃ਼ṧഠ䳮Ⲵ
䰞仈˖ᾲᘥᆖҐ㇇⌅ሶᆼ‫ޘ‬ᰐ⌅Ӿ䇝㓳ṧֻѝ⌋ॆʽަ৏ഐྲлˈ‫ٷ‬ᇊᡁԜᨀ‫׋‬Ҷ 3 њ↓ֻ
˄x1ˈx2ˈx3˅ԕ৺єњ৽ֻ˄x4ˈx5˅㔉ᆖҐಘDŽ䘉ᰦˈਈරオ䰤ⲴS䗩⭼वਜ਼Ⲵ‫ٷ‬䇮↓ྭ
ᱟйњ↓ֻⲴ᷀ਆ˖

S: { (x1Ģx2Ģx3) }

ഐѪ䘉ᱟ㜭㾶ⴆ 3 њ↓ֻⲴᴰ⢩↺‫ٷ‬䇮DŽ⴨լൠˈG 䗩⭼ሶ⭡䛓Ӌࡊྭ㜭ᧂ䲔ᦹ৽ֻⲴ


䛓Ӌ‫ٷ‬䇮㓴ᡀDŽ

G: {™ (x4Ģx5)}

䰞仈൘Ҿˈ䘉а䶎ᑨާᴹ㺘䗮࣋Ⲵ‫ٷ‬䇮㺘⽪ᯩ⌅ѝˈS 䗩⭼ᙫᱟㆰঅⲴᡰᴹ↓ֻ᷀ਆᔿˈ
G 䗩⭼ᙫᱟᡰᴹ৽ֻⲴ᷀ਆⲴ੖ᇊᔿDŽ䘉ṧ㜭ཏ⭡ S ઼ G ᰐ↗ѹൠ࠶㊫Ⲵˈਚᴹᐢ㿱ࡠⲴ
䇝㓳ṧֻᵜ䓛DŽ㾱ᜣ㧧ᗇঅњⲴⴞḷᾲᘥˈቡᗵ享ᨀ‫ ׋‬X ѝᡰᴹⲴᇎֻ֌Ѫ䇝㓳ṧֻDŽ

ⴻ䎧ᶕ䚯‫ݽ‬䘉а䰞仈Ⲵᯩ⌅ਟԕ֯⭘↔䜘࠶ᆖҐⲴਈරオ䰤ˈ❦ਾྲ 2.6.3 㢲ѝ䛓ṧ⭡


ਈරオ䰤Ⲵᡰᴹᡀઈᣅ⾘DŽнᒨⲴᱟˈ㜭ཏӗ⭏а㠤ᣅ⾘Ⲵਚᴹ䛓Ӌᐢ㿱䗷Ⲵ䇝㓳ṧֻDŽሩ
ަԆᡰᴹⲴᇎֻˈ䘋㹼ᣅ⾘⋑ᴹԫօ᭸᷌˖⇿ањᵚ㿱䗷Ⲵᇎֻ䜭Պ㻛ਈරオ䰤ѝࡊ ࡊྭॺᮠ
Ⲵ‫ٷ‬䇮ࡂ࠶Ѫ↓ֻˈ㘼㻛ਖаॺࡂ࠶Ѫ৽ֻ˄ѪӰѸ˛˅DŽ৏ഐྲлˈ㤕 H ᱟ X Ⲵᑲ䳶ˈ㘼
x ᱟḀњᵚࠪ⧠䗷ⲴᇎֻˈࡉሩҾਈරオ䰤ѝа㾶ⴆ x Ⲵ‫ٷ‬䇮 hˈᗵ❦ᆈ൘ਖа‫ٷ‬䇮 h´ˈᆳ
о h ࠐѾ⴨ㅹਚн䗷ሩ x Ⲵ࠶㊫н਼DŽ㘼фྲ᷌ h ൘ਈරオ䰤ѝˈ䛓Ѹ h´ҏ൘ˈഐѪᆳሩҾ
ᐢᖰ䇝㓳ṧֻⲴࡂ࠶о h ᆼ‫ޘ‬аṧDŽ

2.7.3 ᰖ‫څ‬ᆜҖⲺᰖ⭞ᙝ

ԕкⲴ䇘䇪䈤᰾Ҷᖂ㓣᧘⨶Ⲵањสᵜ኎ᙗ˖ᆖҐಘྲ᷌нሩⴞḷᾲᘥⲴᖒᔿ‫ڊ‬亴‫Ⲵݸ‬
‫ٷ‬ᇊˈᆳӾṩᵜкᰐ⌅ሩᵚ㿱ᇎֻ䘋㹼࠶㊫DŽᇎ䱵к൘ᡁԜ৏ᶕⲴ EnjoySport ԫ࣑ѝˈ‫ى‬䘹
⎸䲔㇇⌅㜭ཏӾ䇝㓳ṧֻѝ⌋ॆˈަᜏаⲴ৏ഐቡᱟᆳᱟᴹ‫ˈⲴٿ‬ᆳ䳀ਜ਼‫ٷ‬ᇊҶⴞḷᾲᘥਟ
ԕ⭡኎ᙗ٬Ⲵਸਆᶕ㺘⽪DŽྲ᷌䘉а‫ٷ‬ᇊ↓⺞˄ᒦф䇝㓳ᮠᦞᰐ䭉˅ˈሩҾᯠᇎֻⲴ࠶㊫ҏ
Պᱟ↓⺞ⲴDŽնྲ᷌䘉њ‫ٷ‬ᇊн↓⺞ˈ‫ى‬䘹⎸䲔㇇⌅㛟ᇊՊ䭉䈟ൠ࠶㊫ X ѝḀӋᇎֻDŽ
⭡Ҿᖂ㓣ᆖҐ䴰㾱Ḁ⿽ᖒᔿⲴ亴‫ٷݸ‬ᇊˈᡆ〠Ѫᖂ㓣‫ٿ‬㖞˄Inductive bias˅*ˈᡁԜਟԕ
⭘ᖂ㓣‫ٿ‬㖞ᶕ᧿䘠н਼ᆖҐᯩ⌅Ⲵ⢩ᖱDŽ⧠൘ᶕ㋮⺞ൠᇊѹᖂ㓣‫ٿ‬㖞DŽ䘉䟼㾱㧧ਆⲴ‫ޣ‬䭞ᙍ
ᜣ൘ҾˈᆖҐಘ൘Ӿ䇝㓳ṧֻѝ⌋ॆᒦ᧘ᯝᯠᇎֻⲴ࠶㊫䗷〻ѝᡰ䟷⭘Ⲵㆆ⮕DŽഐ↔ˈ㘳㲁
а㡜ᛵߥлԫ᜿ⲴᆖҐ㇇⌅Lˈԕ৺Ѫԫ᜿ⴞḷᾲᘥcᨀ‫Ⲵ׋‬ԫ᜿䇝㓳ᮠᦞDc={<x, c(x)>}DŽ
䇝㓳䗷〻㔃ᶏਾˈL䴰㾱ሩᯠⲴᇎֻxi䘋㹼࠶㊫DŽԔL(xi, Dc)㺘⽪൘ሩ䇝㓳ᮠᦞDcᆖҐਾL䍻
ҸxiⲴ࠶㊫˄↓ֻᡆ৽ֻ˅
ˈᡁԜਟԕྲл᧿䘠Lᡰ䘋㹼Ⲵ䘉аᖂ㓣᧘⨶䗷〻˖

(Dcġxi) L(xi,Dc)

䘉䟼Ⲵ䇠ਧy z㺘⽪zӾyᖂ㓣᧘⨶ᗇࡠˈֻྲˈྲ᷌ԔLѪ‫ى‬䘹⎸䲔㇇⌅ˈDcѪ㺘 2-1


ѝⲴ䇝㓳ᮠᦞˈxiѪ㺘 2-6 ѝㅜањᇎֻˈࡉᖂ㓣᧘⨶ਟᗇࡠ㔃䇪L(xi, Dc)=(EnjoySport=yes)DŽ

⭡ҾLᱟаᖂ㓣ᆖҐ㇇⌅ˈࡉа㡜ᛵߥлL(xi, Dc)䘉а᧘䇪ࠪⲴ㔃᷌↓⺞ᙗᰐ⌅䇱᰾˗ҏ
ቡᱟ䈤ˈ࠶㊫L(xi, Dc)ᒦ䶎Ӿ䇝㓳ᮠᦞDc઼ᯠᇎֻxiѝ╄㓾⍮⭏DŽ❦㘼䰞仈ᱟˈ䴰㾱൘Dcġxi
к䱴࣐ᘾṧⲴࡽᨀˈԕ֯L(xi,Dc)㜭╄㓾⍮⭏DŽᡁԜᇊѹLⲴᖂ ᖂ㓣‫ٿ‬㖞Ѫ䘉Ӌ䱴࣐ࡽᨀⲴ䳶ਸDŽ
ᴤ㋮⺞ൠ䈤ˈᡁԜᇊѹLⲴᖂ㓣‫ٿ‬㖞Ѫࡽᨀ䳶ਸBˈ֯ᡰᴹⲴᯠᇎֻxi┑䏣DŽ

(BġDcġxi) ƅ L(xi, Dc)

䘉䟼Ⲵ䇠ਧ yƅz 㺘⽪ z Ӿ y ╄㓾⍮⭏˄follow deductivelyˈᡆ z ਟԕ⭡ y 䇱᰾ᗇࠪ˅DŽ䘉


ṧˈᡁԜᇊѹᆖҐಘⲴᖂ㓣㕆ੁѪ䱴࣐Ⲵࡽᨀ䳶ਸ Bˈ䙊䗷 B ‫࠶ݵ‬ൠ֯ᖂ㓣᧘⨶⭡╄㓾᧘⨶
ᶕ䇪䇱DŽԕлᱟ䈕ᇊѹⲴᙫ㔃˖

定义: 㘳㲁ሩҾᇎֻ䳶ਸXⲴᾲᘥᆖҐ㇇⌅LDŽԔcѪXкᇊѹⲴԫаᾲᘥˈᒦԔDc={<x,
c(x)>}ѪcⲴԫ᜿䇝㓳ṧֻ䳶ਸDŽԔL(xi, Dc)㺘⽪㓿䗷ᮠᦞDcⲴ䇝㓳ਾˈL䍻Ҹᇎֻxi
Ⲵ࠶㊫DŽLⲴᖂ ᖂ㓣‫ٿ‬㖞ᱟᴰሿᯝ䀰䳶ਸBˈᆳ֯ԫ᜿ⴞḷᾲᘥc઼⴨ᓄⲴ䇝㓳ṧֻDc
┑䏣˖

(xięX)[ (BġDcġxi) ƅ L(xi, Dc)] (2.1)

䛓Ѹˈ‫ى‬䘹⎸䲔㇇⌅Ⲵᖂ㓣‫ٿ‬㖞ᱟӰѸ઒˛俆‫⺞ݸ‬ᇊ䘉а㇇⌅ⲴL(xi, Dc)˖㔉ᇊᮠᦞ䳶
Dcˈ‫ى‬䘹⎸䲔㇇⌅俆‫ݸ‬䇑㇇ਈරオ䰤VSH,Dcˈ❦ਾ൘ਈරオ䰤ᡰवਜ਼Ⲵ‫ٷ‬䇮ѝᣅ⾘ˈ䘋㹼ᯠ
ᇎֻxiⲴ࠶㊫DŽ䘉䟼‫ٷ‬ᇊӗ⭏xiⲴ࠶㊫ⲴᶑԦᱟᣅ⾘а㠤Ѫ↓ᡆѪ䍏ˈ੖ࡉн䘋㹼࠶㊫DŽ⧠
൘ᶕഎㆄӰѸᱟ‫ى‬䘹⎸䲔㇇⌅L(xi, Dc)Ⲵᖂ㓣‫ٿ‬㖞Ⲵ䰞仈˖ᖸㆰঅˈቡᱟcęH䘉њࡽᨀDŽᴹ
Ҷ䘉аࡽᨀˈ‫ى‬䘹⎸䲔㇇⌅ᡰᢗ㹼Ⲵ⇿аᖂ㓣᧘⨶䜭ਟԕ㻛╄㓾䇪䇱DŽ

⧠൘ⴻаⴻѪӰѸL(xi, Dc)䘉а࠶㊫ਟ⭡B={cęH}ǃᮠᦞDc઼ᇎֻxi╄㓾⍮⭏DŽ俆‫ˈݸ‬
⌘᜿ྲ᷌‫ٷ‬ᇊcęHˈ䛓Ѹਟ╄㓾⍮⭏ࠪcęVSH,DcDŽ䘉а⍮⭏ⲴᶑԦ䲔cęHˈ䘈वᤜਈරオ
䰤VSH,DcⲴᇊѹ˄ণHѝоDcа㠤Ⲵᡰᴹ‫ٷ‬䇮䳶ਸ˅ ˈԕ৺ሩDc={<x, c(x)>}Ⲵᇊѹ˄ণоⴞḷ
ᾲᘥа㠤Ⲵ䇝㓳ᮠᦞ˅DŽަ⅑ˈ⭡ҾL(xi, Dc)ᱟа࠶㊫ˈᆳᇊѹѪਈරオ䰤ѝᡰᴹ‫ٷ‬䇮Ⲵа㠤
ᣅ⾘DŽഐ↔ˈྲ᷌L䗃ࠪ࠶㊫L(xi, Dc)ˈ䛓ѸVSH,Dcѝ⇿а‫ٷ‬䇮ᗵሶӗ⭏਼ṧⲴ࠶㊫ˈवᤜ‫ٷ‬
䇮cęVSH,DcDŽഐ↔c(xi)=L(xi, Dc)‫ى‬䘹⎸䲔㇇⌅Ⲵᖂ㓣‫ٿ‬㖞ᾲᤜ䈤᰾ྲл˖

*
䘉䟼Ⲵᵟ䈝ᖂ
ᖂ㓣‫ٿ‬㖞˄inductive bias˅н㾱઼㔏䇑ᆖѝᲞ䙽֯⭘Ⲵՠ
ՠ䇑‫ٿ‬ᐞ˄estimation bias˅␧⏶DŽ
ՠ䇑‫ٿ‬ᐞሶ൘ㅜ 5 ㄐ䇘䇪DŽ
‫ى‬䘹⎸䲔㇇⌅Ⲵᖂ㓣‫ٿ‬㖞˖ⴞḷᾲᘥ c वਜ਼൘㔉ᇊⲴ‫ٷ‬䇮オ䰤 H ѝDŽ

插图——原书页码:44

Inductive system: ᖂ㓣㌫㔏

Training examples: 䇝㓳ṧֻ

New instance: ᯠᇎֻ

Candidate Elimination Algorithm ‫ى‬䘹⎸䲔㇇⌅

Using Hypothesis Space H: ֯⭘‫ٷ‬䇮オ䰤 H

Classification of new instance, or “don't know”: ሩᯠᇎֻⲴ࠶㊫ˈᡆĀᰐ⌅࠶㊫ā

Equivalent deductive system: ㅹԧⲴ╄㓾㌫㔏

Assertion “H contains the target concept”: ᯝ䀰˖ĀH वਜ਼ⴞḷᾲᘥā

Theorem Prover:ᇊ⨶䇱᰾ಘ

Inductive bias made explicit: 㻛᰾⺞ॆⲴᖂ㓣‫ٿ‬㖞

മ 2-8 ⭘ㅹԧⲴ╄㓾㌫㔏ᶕ⁑ᤏᖂ㓣㌫㔏
֯⭘‫ٷ‬䇮オ䰤 H Ⲵ‫ى‬䘹⎸䲔㇇⌅Ⲵ䗃‫ޕ‬䗃ࠪ㹼ѪˈㅹԧҾ࡙⭘Ҷᯝ䀰ĀH वਜ਼ⴞḷᾲᘥāⲴ╄㓾
ᇊ⨶䇱᰾ಘDŽ䈕ᯝ䀰ഐ↔㻛〠Ѫ‫ى‬䘹⎸䲔㇇⌅Ⲵᖂᖂ㓣‫ٿ‬㖞DŽ⭘ᖂ㓣‫ٿ‬㖞ᶕ࡫⭫ᖂ㓣㌫㔏ˈਟԕ‫ׯ‬Ҿ
֯⭘ㅹԧⲴ╄㓾㌫㔏ᶕ⁑ᤏᆳԜDŽ䘉ᨀ‫׋‬Ҷа⿽ሩᖂ㓣㌫㔏䘋㹼∄䖳Ⲵᯩ⌅ˈ䙊䗷ᆳԜӾ䇝㓳ᮠᦞ
ѝ⌋ॆⲴㆆ⮕DŽ

മ 2-8 Ѫа⽪᜿മ䀓DŽк䶒Ⲵമᱮ⽪Ⲵ‫ى‬䘹⎸䲔㇇⌅ᴹєњ䗃‫˖ޕ‬䇝㓳ṧ઼ֻᖵ࠶㊫Ⲵ
ᯠᇎֻDŽл䶒ⲴമѪа╄㓾ᇊ⨶䇱᰾ಘˈᆳⲴ䗃‫ޕ‬वᤜ਼ṧⲴє㓴ᮠᦞˈ޽࣐кᯝ䀰ĀH व
ਜ਼ⴞḷᾲᘥā DŽ䘉єњ㌫㔏ሩᡰᴹਟ㜭Ⲵ䇝㓳ṧֻ䗃‫઼ޕ‬ᯠᇎֻ䗃‫ޕ‬ӗ⭏਼ṧⲴ䗃ࠪDŽᖃ❦ˈ
൘ᇊ⨶䇱᰾ಘѝᱮᔿ䗃‫Ⲵޕ‬ᖂ㓣‫ٿ‬㖞ਚᱟ䳀ਜ਼൘Ҷ‫ى‬䘹⎸䲔㇇⌅Ⲵԓ⸱ѝDŽ൘Ḁ⿽᜿ѹкˈ
ᖂ㓣‫ٿ‬㖞ਚ൘ᡁԜⲴঠ䊑ѝᆈ൘ˈնᆳ⺞ᇎᱟ㜭㻛ᆼᮤᇊѹⲴᯝ䀰䳶ਸDŽ

ሶᖂ㓣᧘⨶㌫㔏ⴻ֌ᱟवਜ਼Ҷᖂ㓣‫ٿ‬㖞ˈྭ༴൘Ҿᆳᨀ‫׋‬Ҷа⿽䶎〻ᒿॆⲴ᧿䘠᡻⇥ˈ
ԕ᧿䘠ᆖҐಘӾ㿲ሏࡠⲴᮠᦞѝ䘋㹼⌋ॆⲴㆆ⮕DŽަ⅑ᆳ䘈ਟԕሩᖂ㓣‫ٿ‬㖞ᕪᓖн਼ⲴᆖҐ
ಘ䘋㹼∄䖳DŽֻྲˈ㘳㲁ԕл 3 њᆖҐ㇇⌅ˈ᤹ަᴹ‫ٿ‬〻ᓖӾᕡࡠᕪ䘋㹼ᧂᒿ˖

1. ᵪỠᆖҐಘ˄Rote-Learner˅DŽㆰঅൠሶ⇿њ㿲ሏࡠⲴ䇝㓳ṧֻᆈۘлᶕDŽਾ㔝Ⲵᇎ
ֻⲴ࠶㊫䙊䗷൘޵ᆈѝ३䝽䘋㹼DŽྲ᷌ᇎֻ൘޵ᆈѝ᢮ࡠҶˈᆈۘⲴ࠶㊫㔃᷌㻛䗃ࠪDŽ
੖ࡉ㌫㔏ᤂ㔍䘋㹼࠶㊫DŽ

2. ‫ى‬䘹⎸䲔㇇⌅DŽᯠⲴᇎֻਚ൘ਈරオ䰤ᡰᴹᡀઈ䜭䘋㹼਼ṧ࠶㊫ᰦ᡽䗃ࠪ࠶㊫㔃
᷌ˈ੖ࡉ㌫㔏ᤂ㔍࠶㊫DŽ
3. Find-SDŽྲࡽᡰ䘠ˈ䘉а㇇⌅ራ᢮о䇝㓳ṧֻа㠤Ⲵᴰ⢩↺Ⲵ‫ٷ‬䇮ˈᆳ⭘䘉а‫ٷ‬䇮
ᶕ࠶㊫ਾ㔝ᇎֻDŽ

䇠ᗶᆖҐಘ⋑ᴹᖂ㓣‫ٿ‬㖞DŽሩҾᯠᇎֻᡰ‫࠶Ⲵڊ‬㊫㜭Ӿᐢ㿲ሏࡠⲴ䇝㓳ṧֻѝ╄㓾⍮
⭏ˈн䴰㾱䱴࣐ⲴࡽᨀDŽ‫ى‬䘹⎸䲔㇇⌅ᴹ䖳ᕪⲴᖂ㓣‫ٿ‬㖞˖ণⴞḷᾲᘥ享൘‫ٷ‬䇮オ䰤ѝ㜭㺘
⽪DŽ⭡Ҿᆳᱟᴹ‫ˈⲴٿ‬ᡰԕ㜭ཏሩ䇠ᗶᆖҐಘн㜭࠶㊫Ⲵᇎֻ䘋㹼࠶㊫DŽᖃ❦࠶㊫Ⲵ↓⺞ᙗ
ҏᆼ‫׍ޘ‬䎆Ҿᖂ㓣‫ٿ‬㖞Ⲵ↓⺞ᙗDŽFind-S㇇⌅ᴹᴤᕪⲴᖂ㓣‫ٿ‬㖞ˈ䲔Ҷ‫ٷ‬ᇊⴞḷᾲᘥ享൘‫ٷ‬
䇮オ䰤ѝˈᆳ䘈ᴹਖа仍ཆⲴᖂ㓣‫ٿ‬㖞ࡽᨀ˖ԫօᇎֻˈ䲔䶎ᆳⲴ䘶ᇎֻਟ⭡ަԆ⸕䇶䙫䗁
᧘ࠪˈ੖ࡉᆳѪ৽ֻDŽ*

൘⹄ウަԆⲴᖂ㓣᧘⨶ᯩ⌅ᰦˈᴹᗵ㾱⢒䇠䘉⿽ᖂ㓣‫ٿ‬㖞Ⲵᆈ൘৺ަᕪᓖDŽа⿽㇇⌅ྲ
᷌ᴹ‫ٿ‬ᙗ䎺ᕪˈ䛓ᆳⲴᖂ㓣㜭࣋䎺ᕪˈਟԕ࠶㊫ᴤཊⲴᵚ㿱ᇎֻDŽḀӋᖂ㓣‫ٿ‬㖞ᱟሩ㊫࡛Ⲵ
‫ٷ‬ᇊˈԕ⺞ᇊⴞḷᾲᘥⲴ㤳തDŽྲĀ‫ٷ‬䇮オ䰤 H वਜ਼ⴞḷᾲᘥāDŽަԆⲴᖂ㓣‫ٿ‬㖞ਚᱟሩ‫ٷ‬
䇮䘋㹼ᧂᒿˈԕ᧿䘠‫ྭٿ‬〻ᓖˈ∄ྲĀ‫ੁٿ‬Ҿ⢩↺‫ٷ‬䇮ˈ㘼нᱟа㡜‫ٷ‬䇮DŽāḀӋ‫ٿ‬㖞䳀ਜ਼
൘ᆖҐಘѝнਟᴤ᭩ˈྲ䘉䟼ᡰ䇘䇪ⲴֻᆀDŽ൘ㅜ 11 ઼ 12 ㄐਟԕⴻࡠ᰾⺞㺘⽪ᖂ㓣‫ٿ‬㖞Ⲵ
㌫㔏ˈᆳԜሶ‫ٿ‬㖞㺘⽪Ѫᯝ䀰Ⲵ䳶ਸᒦਟ⭡ᆖҐಘ᫽㓥DŽ

2.8 ቅ㔉ૂ㺛‫ݻ‬䈱⢟

ᵜㄐⲴ㾱⛩वᤜ˖

 ᾲᘥᆖҐਟⴻ֌ᱟᩌ㍒亴ᇊѹ▌൘‫ٷ‬䇮オ䰤Ⲵ䗷〻DŽ

 ‫ٷ‬䇮Ⲵа㡜ࡠ⢩↺‫ٿ‬ᒿ㔃ᶴਟԕᇊѹ൘ԫօᾲᘥᆖҐ䰞仈ѝˈᆳᨀ‫׋‬Ҷа⿽ᴹ⭘Ⲵ
㔃ᶴԕ‫ׯ‬Ҿ‫ٷ‬䇮オ䰤Ⲵᩌ㍒DŽ

 Find-S ㇇⌅֯⭘Ҷа㡜ࡠ⢩↺ᒿˈ൘‫ٿ‬ᒿ㔃ᶴⲴањ࠶᭟кᢗ㹼Ⲵа㡜ࡠ⢩↺ᩌ
㍒ˈԕራ᢮оṧֻа㠤Ⲵᴰ⢩↺‫ٷ‬䇮DŽ

 ‫ى‬䘹⎸䲔㇇⌅࡙⭘а㡜ࡠ⢩↺ᒿˈ䙊䗷⑀䘋ൠ䇑㇇ᶱབྷ⢩↺‫ٷ‬䇮䳶ਸ S ઼ᶱབྷа㡜
‫ٷ‬䇮䳶ਸ G 䇑㇇ਈරオ䰤˄ণᡰᴹо䇝㓳ᮠᦞа㠤Ⲵ‫ٷ‬䇮䳶˅DŽ

 ⭡Ҿ S ઼ G Ӿᮤњ‫ٷ‬䇮䳶ਸѝࡂ࠶ࠪҶо䇝㓳ᮠᦞа㠤Ⲵ䛓䜘࠶䳶ਸˈᆳԜᨀ‫׋‬
ҶሩⴞḷᾲᘥⲴн⺞ᇊᙗ᧿䘠DŽਜ਼ᴹཊњ‫ٷ‬䇮Ⲵਈරオ䰤ਟԕ⭘ᶕࡔᯝᆖҐಘᱟ੖
ᐢ᭦ᮋࡠҶⴞḷᾲᘥ˗ࡔᯝ䇝㓳ᮠᦞᱟ੖на㠤˗ӗ⭏ḕ䈒ԕ䘋а↕㋮ॆਈරオ䰤˗
ԕ৺⺞ᇊᵚ㿱䗷Ⲵᇎֻᱟ੖㜭⭘нᆼ‫ޘ‬ᆖҐࡠⲴᾲᘥᶕᰐ↗ѹൠ࠶㊫DŽ

 ਈරオ䰤઼‫ى‬䘹⎸䲔㇇⌅Ѫ⹄ウᾲᘥᆖҐᨀ‫׋‬Ҷа⿽ᴹ⭘ⲴṶᷦˈ❦㘼䘉а㇇⌅㕪
ቁ励ἂᙗˈ⢩࡛ᱟ൘䙷ࡠᴹಚ༠Ⲵᮠᦞԕ৺ⴞḷᾲᘥᰐ⌅൘‫ٷ‬䇮オ䰤ѝ㺘⽪Ⲵᛵߥ
лDŽㅜ 10 ㄐ᧿䘠Ҷࠐ⿽สҾа㡜ࡠ⢩↺ᒿ‫ޣ‬㌫ⲴᾲᘥᆖҐ㇇⌅ˈᆳԜ㜭ཏ༴⨶ᴹ
ಚ༠ᮠᦞDŽ

*
⌘᜿ᴰਾ䶒䘉њᖂ㓣‫ٿ‬㖞‫ٷ‬ᇊˈᆳवਜ਼ҶḀ⿽唈䇔᧘⨶ˈᡆ䶎অ䈳᧘⨶DŽ
 ᖂ㓣ᆖҐ㇇⌅㜭ཏሩᵚ㿱ᮠᦞ䘋㹼࠶㊫ˈᱟഐѪᆳԜ൘䘹ᤙа㠤Ⲵ‫ٷ‬䇮ᰦ䳀ਜ਼Ⲵᖂ
㓣‫ٿ‬㖞DŽ‫ى‬䘹⎸䲔㇇⌅ѝⲴ‫ٿ‬㖞Ѫ˖ⴞḷᾲᘥਟԕ൘‫ٷ‬䇮オ䰤ѝ᢮ࡠ˄cęH˅DŽ䗃
ࠪⲴ‫ٷ‬䇮઼ሩਾ㔝ᇎֻⲴ࠶㊫ਟ⭡䘉аࡽᨀ৺䇝㓳ṧֻ╄㓾᧘ࠪDŽ

 ྲ᷌‫ٷ‬䇮オ䰤㻛ᢙኅˈ֯ሩᓄᇎֻ䳶Ⲵ⇿ањᆀ䳶˄ᇎֻⲴᑲ䳶˅䜭ᴹањ‫ٷ‬䇮ˈ
ሶ֯‫ى‬䘹⎸䲔㇇⌅ѝⲴᖂ㓣‫ٿ‬㖞⎸ཡDŽ❦㘼ˈ䘉ҏሶ⎸䲔ަሩᯠᇎֻ࠶㊫Ⲵ㜭࣋DŽ
ᰐ‫Ⲵٿ‬ᆖҐಘᰐ⌅ሩᵚ㿱ṧֻ䘋㹼ᖂ㓣DŽ

ᾲᘥᆖҐԕ৺֯⭘а㡜ࡠ⢩↺ᒿⲴ⴨‫⹄ޣ‬ウ⭡ᶕҏѵDŽBruner et al.˄1957˅䖳ᰙൠሩӪ
㊫ⲴᾲᘥᆖҐ֌ࠪ⹄ウˈ㘼 Hunt & Hovland˄1963˅䖳ᰙሶަ㠚ࣘॆDŽWinston˄1970˅Ⲵ
ᴹ਽Ⲵঊ༛䇪᮷ѝሶᾲᘥᆖҐⴻ֌ᱟवਜ਼⌋ॆ઼⢩ॆ᫽֌Ⲵᩌ㍒䗷〻DŽPlotkin˄1970, 1971˅
䖳ᰙൠᨀ‫׋‬ҶᖒᔿॆⲴ more-general-than ‫ޣ‬㌫ˈԕ৺ањ⴨‫Ⲵޣ‬ᾲᘥT-वᇩ˄൘ㅜ 10 ㄐѝ
䇘䇪˅DŽSimon ઼ Lea˄1973˅ሶᆖҐⲴ䗷〻ⴻ֌ᱟ൘‫ٷ‬䇮オ䰤ѝᩌ㍒Ⲵ䗷〻DŽަԆаӋ䖳
ᰙⲴᾲᘥᆖҐ㌫㔏वᤜ˄Popplestone 1969˗Michalski 1973˗Buchanan 1974˗Vere 1975˗
Hayes-Roth 1974˅DŽབྷ䟿ⲴสҾㅖਧ㺘⽪ⲴᾲᘥᆖҐ㇇⌅ᐢ㻛ᔰਁࠪᶕDŽㅜ 10 ㄐ᧿䘠Ҷࠐ⿽
䘁ᵏⲴᾲᘥᆖҐ㇇⌅DŽवᤜ⭘а䱦䙫䗁㺘⽪ⲴᾲᘥᆖҐ㇇⌅ˈሩᴹಚ༠ᮠᦞᴹ励ἂᙗⲴ㇇⌅ˈ
ԕ৺ᖃⴞḷᾲᘥᰐ⌅൘ᆖҐಘⲴ‫ٷ‬䇮オ䰤ѝ㺘⽪ᰦ㜭䖳ྭൠ䱽㓗ᆖҐⲴ㇇⌅DŽ

ਈරオ䰤઼‫ى‬䘹⎸䲔㇇⌅⭡ Mitchell˄1977ˈ1982˅ᨀࠪˈ䘉а㇇⌅ᐢᓄ⭘Ҿ䍘䉡࠶᷀
˄mass spectroscopy˅ѝⲴ㿴ࡉ᧘⨶˄Mitchell 1979˅ԕ৺ᓄ⭘ҾᆖҐᩌ㍒᧗ࡦ㿴ࡉ˄Mitchell
DŽHaussler˄1988˅䇱᰾ণ֯ᖃ‫ٷ‬䇮オ䰤ਚवਜ਼ㆰঅⲴ⢩ᖱਸਆᰦˈа㡜䗩⭼Ⲵ
et al. 1983˅
བྷሿṩᦞ䇝㓳ṧֻⲴᮠⴞᤷᮠ໎䮯DŽSmith & Rosenbloom˄1990˅ᨀࠪሩ G 䳶ਸⲴ㺘⽪䘋㹼
ㆰঅⲴᴤ᭩ˈԕ᭩䘋ަ⢩ᇊᛵߥлⲴ༽ᵲᙗˈHirsh˄1992˅ᨀࠪ൘ḀӋᛵߥлнᆈۘ G 䳶
ਸᰦᆖҐ䗷〻ѪṧֻᮠⴞⲴཊ亩ᔿ࠭ᮠDŽSubramanian & Feigenbaum˄1986˅䇘䇪Ҷ⢩ᇊᛵ
ߥл䙊䗷࠶䀓ਈරオ䰤ԕ⭏ᡀᴹ᭸ḕ䈒а⿽ᯩ⌅DŽ‫ى‬䘹⎸䲔㇇⌅ⲴањᴰབྷⲴᇎ䱵䲀ࡦᱟᆳ
㾱≲䇝㓳ᮠᦞᱟᰐಚ༠ⲴDŽMitchell˄1979˅᧿䘠Ҷ䈕㇇⌅Ⲵа⿽ᢙኅˈԕ༴⨶ਟ亴㿱Ⲵᴹ
䲀ᮠ䟿Ⲵ䈟࠶㊫ṧֻˈHirsh˄1990, 1994˅ᨀࠪа⿽㢟ྭⲴᢙኅԕ༴⨶ާᴹᇎᮠ٬኎ᙗⲴ䇝
㓳ṧֻѝⲴᴹ䲀ಚ༠DŽHirsh˄1990˅᧿䘠Ҷа⿽䙂໎ਈරオ䰤ਸᒦ㇇⌅ˈᆳሶ‫ى‬䘹⎸䲔㇇
⌅ᢙኅࡠ㜭༴⨶⭡н਼㊫රⲴ٬㓖ᶏ㺘⽪Ⲵ䇝㓳ؑ᚟DŽᶕ㠚⇿њ㓖ᶏⲴؑ᚟⭡ਈරオ䰤ᶕ㺘
⽪ˈ❦ਾ⭘Ӕਐਈරオ䰤Ⲵ࣎⌅ਸᒦ䘉Ӌ㓖ᶏDŽSebag˄1994, 1996˅ኅ⽪Ҷа⿽㻛〠Ѫ᷀ਆ
ਈරオ䰤Ⲵᯩ⌅ᶕӾᴹಚ༠ᮠᦞѝᆖҐ᷀ਆᾲᘥDŽӾ⇿њ↓ֻѝᆖࡠањ࠶・Ⲵਈරオ䰤ˈ
❦ਾ⭘䘉н਼ਈරオ䰤䘋㹼ᣅ⾘ԕ࠶㊫ᯠᇎֻDŽྩ൘ࠐњ䰞仈亶ฏ䘋㹼Ҷᇎ傼ˈᗇࠪྩⲴᯩ
⌅਼ަԆᒯ⌋֯⭘Ⲵᖂ㓣ᯩ⌅ᴹ਼ṧ㢟ྭⲴᙗ㜭ˈྲߣㆆṁ઼ k-䘁䛫ᯩ⌅DŽ
Ґ仈

2.1 䀓䟺ѪӰѸ EnjoySport ᆖҐԫ࣑Ⲵ‫ٷ‬䇮オ䰤ⲴབྷሿѪ 973DŽྲ᷌໎࣐а኎ᙗ


WaterCurrentˈਟਆ٬ LightǃModerate ઼ Strongˈ䛓Ѹਟ㜭Ⲵᇎֻᮠ઼ਟ㜭Ⲵ‫ٷ‬䇮ᮠሶՊ໎
࣐ཊቁ˛᧘ᒯࡠа㡜ˈ໎࣐аᯠ኎ᙗ Aˈᴹ k ⿽ਆ٬ˈᇎֻᮠ઼‫ٷ‬䇮ᮠሶՊ໎࣐ཊቁ˛

2.2 ൘‫ى‬䘹⎸䲔㇇⌅ѝˈྲ᷌䇝㓳ṧֻ᤹㺘 2-1 ѝⲴ䘶


䘶ᒿࠪ⧠ˈ䈧࠶↕㔉ࠪ S ઼ G 䗩⭼
䳶ਸDŽ㲭❦н䇪ṧֻࠪ⧠亪ᒿྲօˈᴰ㓸Ⲵਈරオ䰤⴨਼˄ѪӰѸ˛˅ˈ൘ѝ䰤↕僔ѝᗇࡠ
Ⲵ S ઼ G ӽሶ‫׍‬䎆Ҿ䈕亪ᒿDŽᱟ੖ᴹ࣎⌅ሩ䇝㓳ṧֻᧂᒿˈԕ֯ EnjoySport ֻᆀѝⲴᡰᴹ S
઼ G 䳶ਸⲴѝ䰤㔃᷌Ⲵབྷሿѻ઼Ѫᴰሿ˛

2.3 㔗㔝㘳㲁 EnjoySport ᆖҐԫ઼࣑ 2.2 㢲ѝ᧿䘠Ⲵ‫ٷ‬䇮オ䰤 HDŽྲ᷌ᇊѹањᯠⲴ‫ٷ‬


䇮オ䰤 H´ˈᆳवਜ਼ H ѝᡰᴹ‫ٷ‬䇮Ⲵᡀሩ᷀ਆDŽྲ H´ѝа‫ٷ‬䇮Ѫ˖

<?, Cold, High, ?, ?, ?>Ģ<Sunny, ?, High, ?, ?, Same>

䈅䐏䑚䘀㹼֯⭘䈕‫ٷ‬䇮オ䰤 H´Ⲵ‫ى‬䘹⎸䲔㇇⌅ˈ㔉ᇊⲴ䇝㓳ṧֻྲ㺘 2-1 ᡰ⽪˄䴰㾱


࠶↕ࡇࠪ S ઼ G 䳶ਸ˅DŽ

2.4 ‫ٷ‬ᇊаᇎֻオ䰤वਜ਼ xˈy ᒣ䶒ѝⲴᮤᮠ⛩ˈ‫ٷ‬䇮䳶ਸ H Ѫ⸙ᖒ䳶DŽᴤ㋮⺞ൠˈ‫ٷ‬


䇮ⲴᖒᔿѪ aİxİbˈcİyİdˈަѝ a,b,c,d Ѫԫ᜿ᮤᮠDŽ

˄a˅㘳㲁ሩᓄҾлമᡰ⽪↓ֻ˄ˇ˅઼৽ֻ˄ˉ˅䳶ਸⲴਈරオ䰤ˈᆳⲴ S 䗩⭼ᱟӰ
Ѹ˛߉ࠪަѝⲴ‫ٷ‬䇮ᒦ൘മѝ⭫ࠪDŽ

插图——原书页码:48

˄b˅ਈරオ䰤Ⲵ G 䗩⭼ᱟӰѸˈ߉ࠪަѝⲴ‫ٷ‬䇮ᒦ൘മѝ⭫ࠪDŽ

˄c˅‫ٷ‬ᇊᆖҐಘਟᨀࠪањᯠᇎֻ(x, y)ˈᒦ㾱≲ᯭᮉ㘵䘋㹼࠶㊫ˈ䈅㔉ࠪањḕ䈒ˈ
ᰐ䇪ᯭᮉ㘵ᘾṧ࠶㊫䜭㜭‫؍‬䇱߿ሿਈරオ䰤DŽ޽㔉ࠪањн㜭‫؍‬䇱Ⲵḕ䈒DŽ

˄d˅֌Ѫᯭᮉ㘵ˈྲ᷌ᜣ䇙ᆖҐಘᆖҐа⢩ᇊⲴⴞḷᾲᘥ˄ྲ 3İxİ5ˈ2İyİ9˅
ˈ
Ѫ֯‫ى‬䘹⎸䲔㇇⌅ᆼ‫ޘ‬ᆖҐࡠⴞḷᾲᘥˈ䴰㾱ᨀ‫ⲴⲴ׋‬䇝㓳ṧֻᮠⴞᴰሿᱟཊቁDŽ

2.5 䈧ⴻԕлⲴ↓઼ֻ৽ֻᒿֻˈᆳԜ᧿䘠ⲴᾲᘥᱟĀєњտ൘਼аᡯ䰤ѝⲴӪāDŽ⇿њ
䇝㓳ṧֻ᧿䘠Ҷањᴹ ᴹᒿሩˈ⇿њӪ⭡ަᙗ࡛ǃཤਁ仌㢢˄black, brown ᡆ blonde˅ǃ䓛儈
˄tall, medium ᡆ short˅ԕ৺ഭ㉽˄US, French, German, Irish, Indian, Chinese ᡆ Portuguese˅DŽ

+ < <male brown tall US>, <female black short US> >
+ < <male brown short French>, <female black short US> >

- < <female brown tall German>, <female black short Indian> >

+ < <male brown tall Irish>, <female brown short Irish> >

㘳㲁൘䘉ӋᇎֻкᇊѹⲴ‫ٷ‬䇮オ䰤Ѫ˖ަѝᡰᴹ‫ٷ‬䇮ԕаሩ 4 ‫ݳ‬㓴㺘⽪ˈަѝ⇿њ٬㓖
ᶏо EnjoySport ѝⲴ‫ٷ‬䇮㺘⽪⴨լˈਟԕѪ˖⢩ᇊ٬ǃĀ?āᡆ㘵Ā‡āDŽֻྲˈл䶒Ⲵ‫ٷ‬䇮˖

< <male ? Tall ? > <female ? ? French> >

ᆳ㺘⽪Ҷᡰᴹ䘉ṧⲴᴹᒿሩ˖ㅜањӪѪ儈њ⭧ᙗ˄ഭ㉽઼ਁ㢢ԫ᜿˅ˈㅜҼњӪѪ⌅
ഭྣᙗ˄ਁ㢢઼䓛儈ԫ᜿˅DŽ

˄a˅ṩᦞк䘠ᨀ‫Ⲵ׋‬䇝㓳ṧ઼ֻ‫ٷ‬䇮㺘⽪ˈ᡻ࣘᢗ㹼‫ى‬䘹⎸䲔㇇⌅DŽ⢩࡛ᱟ㾱߉ࠪ༴
⨶Ҷ⇿ањ䇝㓳ṧֻਾਈරオ䰤Ⲵ⢩↺઼а㡜䗩⭼DŽ

˄b˅䇑㇇㔉ᇊⲴ‫ٷ‬䇮オ䰤ѝᴹཊቁ‫ٷ‬䇮ол䶒Ⲵ↓ֻа㠤˖

+ < <male black short Portuguese> <female blonde tall Indian> >

˄c˅ྲ᷌ᆖҐಘਚᴹањ䇝㓳ṧֻྲ˄b˅ѝᡰ⽪ˈ⧠൘⭡ᆖҐಘᨀࠪḕ䈒ˈᒦ⭡ᯭᮉ
㘵㔉ࠪަ࠶㊫DŽ≲ࠪањ⢩ᇊⲴḕ䈒ᒿࡇˈԕ‫؍‬䇱ᆖҐಘ᭦ᮋࡠঅњ↓⺞Ⲵ‫ٷ‬䇮ˈ㘼н䇪䈕
‫ٷ‬䇮ᱟଚањ˄‫ٷ‬ᇊⴞḷᾲᘥਟԕ֯⭘㔉ᇊⲴ‫ٷ‬䇮㺘⽪䈝䀰ᶕ᧿䘠˅DŽ≲ࠪᴰ⸝Ⲵḕ䈒ᒿࡇDŽ
䘉аᒿࡇⲴ䮯ᓖо䰞仈˄b˅ⲴㆄṸᴹӰѸ‫ޣ‬㚄˛

˄d˅⌘᜿ࡠ䘉䟼Ⲵ‫ٷ‬䇮㺘⽪䈝䀰н㜭ཏ㺘⽪䘉ӋᇎֻкⲴᡰᴹᾲᘥ˄ྲᡁԜਟᇊѹࠪ
а㌫ࡇⲴ↓઼ֻ৽ֻˈᆳԜᒦ⋑ᴹ⴨ᓄⲴਟ᧿䘠‫ٷ‬䇮˅DŽྲ᷌㾱ᢙኅ䘉а䈝䀰ˈ֯ަ㜭ཏ㺘
䗮䈕ᇎֻ䈝䀰кⲴᡰᴹᾲᘥˈ䛓Ѹ˄c˅ⲴㆄṸᓄ䈕ྲօᴤ᭩DŽ

2.6 ᆼᡀਈරオ䰤㺘⽪ᇊ⨶Ⲵ䇱᰾˄ᇊ⨶ 2.1˅DŽ

2.7 㘳㲁ањᾲᘥᆖҐ䰞仈ˈަѝ⇿њᇎֻѪаᇎᮠˈ㘼⇿њ‫ٷ‬䇮ѪᇎᮠѝⲴ४䰤DŽ㋮
⺞ൠᇊѹѪ˖‫ٷ‬䇮オ䰤 H ѝⲴ⇿њ‫ٷ‬䇮ᖒᔿѪ a<x<bˈަѝ aǃb Ѫԫ᜿ᇎᑨᮠˈx ԓ㺘䈕
ᇎֻDŽֻྲ 4.5<x<6.1 䘉њ‫ٷ‬䇮ሶ 4.5 ઼ 6.1 ѻ䰤Ⲵᇎֻࡂ࠶Ѫ↓ֻˈަԆѪ৽ֻDŽㆰ㾱䀓
䟺ѪӰѸнᆈ൘ањሩԫ᜿↓ֻ䳶ਸ䜭а㠤Ⲵᴰ⢩↺‫ٷ‬䇮DŽ䈅‫؞‬᭩‫ٷ‬䇮Ⲵ㺘⽪ᯩ⌅ԕ䚯‫ݽ‬䘉
а㕪⛩DŽ

2.8 ᵜㄐѝᤷࠪྲ᷌㔉ᇊањᰐ‫ٷⲴٿ‬䇮オ䰤˄ণᇎֻⲴᑲ䳶˅ˈᆖҐಘሶਁ⧠⇿аᵚ㿲
ሏⲴᇎֻሶࡊྭоਈරオ䰤ѝॺᮠⲴᡀઈ३䝽ˈ㘼н䇪ᐢ㓿䗷ҶᘾṧⲴ䇝㓳ṧֻDŽ䇱᰾䘉а
㔃䇪DŽ⺞࠷ൠ䇢ˈ䇱᰾ሩҾԫ᜿ᇎֻオ䰤Xˈԫ᜿䇝㓳ṧֻ䳶Dˈ઼ԫ᜿нवਜ਼൘DѝⲴᇎ
ֻxęXˈྲ᷌HᱟXⲴᑲ䳶ˈ䛓Ѹ൘VSH,DѝᴹᚠྭॺᮠⲴ‫ٷ‬䇮ሶxࡂ࠶Ѫ↓ֻˈਖཆॺᮠࡂ
࠶Ѫ৽ֻDŽ

2.9 ᴹаᆖҐ䰞仈ˈަѝ⇿њᇎֻ䜭⭡nњᐳቄ٬኎ᙗa1, a2, … ,anⲴਸਆᶕ᧿䘠DŽഐ↔ˈ


ањިරⲴᇎֻྲл˖

(a1=T)ġ(a2=F)ġ…ġ(an=T)
⧠㘳㲁ањ‫ٷ‬䇮オ䰤 H ѝˈ⇿њ‫ٷ‬䇮ᱟ䘉Ӌ኎ᙗ㓖ᶏⲴ᷀ਆˈֻྲ˖

(a1=T)Ģ(a5=F)Ģ(a7=T)

䇮䇑а㇇⌅ˈᆳ㓿䗷а㌫ࡇⲴṧֻ䇝㓳ਾ䗃ࠪања㠤Ⲵ‫ٷ‬䇮˄ྲᆈ൘Ⲵ䈍˅DŽ㇇⌅Ⲵ
ᰦ䰤㾱≲Ѫ n ઼䇝㓳ṧֻᮠⴞⲴཊ亩ᔿ࠭ᮠDŽ

2.10 ᇎ⧠ Find-S ㇇⌅DŽ俆‫ˈݸ‬傼䇱ᆳਟᡀ࣏ൠӗ⭏ 2.4 㢲ѝ EnjoySport ֻᆀѝ਴↕僔㔃


᷌DŽ❦ਾ֯⭘䘉а〻ᒿˈ⹄ウѪҶᆖҐࡠ⺞࠷Ⲵⴞḷᾲᘥᡰ䴰Ⲵ䲿ᵪ䇝㓳ṧֻᮠⴞDŽᇎ⧠а
䇝㓳ṧֻ⭏ᡀಘᶕ⭏ᡀ䘉Ӌ䲿ᵪⲴᇎֻˈ޽⭘л䶒Ⲵⴞḷᾲᘥӗ⭏࠶㊫㔃᷌˖

<SunnyˈWarmˈ˛ˈ˛ˈ˛ˈ˛>

䈅⭘䲿ᵪӗ⭏Ⲵṧֻ䇝㓳֐Ⲵ Find-S ㇇⌅ˈᒦ⍻䟿䴰㾱ཊቁṧֻ᡽㜭֯〻ᒿⲴ‫ٷ‬䇮о


ⴞḷᾲᘥ⴨ㅹDŽ㜭੖亴⍻ᡰ䴰Ⲵᒣ൷ṧֻᮠⴞ˛䘀㹼䈕ᇎ傼 20 ⅑ᒦᣕ੺ᡰ䴰ṧֻⲴᒣ൷ᮠDŽ
䘉аᮠⴞՊᘾṧ䲿⵰ⴞḷᾲᘥѝⲴĀ?āᮠⴞ㘼ਈࣘ˛ԕ৺ᆳՊᘾṧ䲿⵰ᇎֻᡆ‫ٷ‬䇮ѝ኎ᙗ
Ⲵᮠⴞ㘼ਈࣘ˛
ㅢ3ㄖ ߩㆌṇᆜҖ

决策树学习是应用最广的归纳推理算法之一。它是一种逼近离散函数的方法,
且对噪声数据有很好的鲁棒性,能够学习析取表达式。本章描述了一系列决策树学
习算法,包括象 ID3、ASSISTANT 和 C4.5 这样广为应用的算法。这些决策树学
习方法搜索完整表示的假设空间,从而避免了受限假设空间的不足。决策树学习的
归纳偏置是优先选择较小的树。

3.1 ㆶԁ

‫އ‬ㄪᷥᄺдᰃϔ⾡䘐䖥⾏ᬷؐⳂᷛߑ᭄ⱘᮍ⊩ˈ೼䖭⾡ᮍ⊩Ёᄺдࠄⱘߑ᭄㹿㸼⼎
Ўϔỉ‫އ‬ㄪᷥDŽᄺдᕫࠄⱘ‫އ‬ㄪᷥг㛑‫ݡ‬㹿㸼⼎Ў໮Ͼ if-then ⱘ㾘߭ˈҹᦤ催ৃ䇏ᗻDŽ
䖭⾡ᄺдㅫ⊩ᰃ᳔⌕㸠ⱘᔦ㒇᥼⧚ㅫ⊩ПϔˈᏆ㒣㹿៤ࡳഄᑨ⫼ࠄҢᄺдए⭫䆞ᮁࠄᄺ
д䆘Ԅ䌋ℒ⬇䇋ⱘֵ⫼亢䰽ⱘᑓ䯨乚ඳDŽ

3.2 ߩㆌṇ㺞⽰⌋

‫އ‬ㄪᷥ䗮䖛ᡞᅲ՟Ңḍ㒧⚍ᥦ߫˄sort˅ࠄᶤϾ৊ᄤ㒧⚍ᴹߚ㉏ᅲ՟ˈ৊ᄤ㒧⚍े
Ўᅲ՟᠔ሲⱘߚ㉏DŽᷥϞⱘ↣ϔϾ㒧⚍ᣛᅮњᇍᅲ՟ⱘᶤϾሲᗻ˄attribute˅ⱘ⌟䆩ˈ
ᑊϨ䆹㒧⚍ⱘ↣ϔϾৢ㒻ߚᬃᇍᑨѢ䆹ሲᗻⱘϔϾৃ㛑ؐDŽߚ㉏ᅲ՟ⱘᮍ⊩ᰃҢ䖭ỉᷥ
ⱘḍ㒧⚍ᓔྟˈ⌟䆩䖭Ͼ㒧⚍ᣛᅮⱘሲᗻˈ✊ৢᣝ✻㒭ᅮᅲ՟ⱘ䆹ሲᗻؐᇍᑨⱘᷥᵱ৥
ϟ⿏ࡼDŽ䖭Ͼ䖛⿟‫ݡ‬೼ҹᮄ㒧⚍ЎḍⱘᄤᷥϞ䞡໡DŽ

插图——原书页码:53

೒ 3-1 ὖᗉ PlayTennis ⱘ‫އ‬ㄪᷥ

ߚ㉏ϔϾḋ՟ⱘᮍ⊩ᰃˈᇚ݊⊓ḍ㒧⚍ᥦ߫ࠄড়䗖ⱘ৊ᄤ㒧⚍ˈ✊ৢ䖨ಲϢ䖭Ͼ৊ᄤ㒧⚍݇㘨ⱘߚ㉏
˄ᴀ՟ЁЎ Yes ៪ No˅DŽ䖭ỉ‫އ‬ㄪᷥḍ᥂໽⇨ߚ㉏Ā᯳ᳳ݁Ϟजᰃ৺䗖ড়ᠧ㔥⧗āDŽ

೒ 3-1 ⬏ߎњϔỉ‫݌‬ൟⱘᄺдࠄⱘ‫އ‬ㄪᷥDŽ䖭ỉ‫އ‬ㄪᷥḍ᥂໽⇨ᚙ‫㉏ߚމ‬Ā᯳ᳳ݁
Ϟजᰃ৺䗖ড়ᠧ㔥⧗āDŽ՟བˈϟ䴶ⱘᅲ՟˖

< Outlook=SunnyˈTemperature=HotˈHumidity=HighˈWind=Strong >

ᇚ㹿⊓ⴔ䖭ỉ‫އ‬ㄪᷥⱘ᳔Ꮊߚᬃ৥ϟᥦ߫ˈ಴㗠㹿䆘ᅮЎড՟˄гህᰃ䖭ỉᷥ乘⌟䖭Ͼ
ᅲ՟ PlayTennis=No˅DŽ䖭ỉᷥҹঞ㸼 3-2 Ё⫼ᴹⓨ⼎ ID3 ᄺдㅫ⊩ⱘ՟ᄤᨬ㞾˄Quinlan
1986˅DŽ

䗮ᐌ‫އ‬ㄪᷥҷ㸼ᅲ՟ሲᗻؐ㑺ᴳⱘড়প˄conjunction˅ⱘᵤপᓣ˄disjunction˅DŽҢ
ᷥḍࠄᷥ৊ⱘ↣ϔᴵ䏃ᕘᇍᑨϔ㒘ሲᗻ⌟䆩ⱘড়পˈᷥᴀ䑿ᇍᑨ䖭ѯড়পⱘᵤপDŽ՟བˈ
೒ 3-1 㸼⼎ⱘ‫އ‬ㄪᷥᇍᑨѢҹϟ㸼䖒ᓣ˖

˄Outlook=Sunny  Humidity=Normal˅

˄Outlook=Overcast˅

˄Outlook=Rain  Wind=Weak˅

3.3 ߩㆌṇᆜҖⲺ䘸⭞䰤从

ሑㅵᏆ㒣ᓔথⱘ⾡⾡‫އ‬ㄪᷥᄺдㅫ⊩᳝䖭ḋ៪䙷ḋϡ໾ϔ㟈ⱘ㛑࡯੠㽕∖ˈ䗮ᐌ‫އ‬
ㄪᷥᄺд᳔䗖ড়‫݋‬᳝ҹϟ⡍ᕕⱘ䯂乬˖
z ᅲ՟ᰃ⬅Āሲᗻ-ؐāᇍ˄pair˅㸼⼎ⱘDŽᅲ՟ᰃ⫼ϔ㋏߫೎ᅮⱘሲᗻ˄՟བˈ
Temperature˅੠ᅗӀⱘؐ˄՟བˈHot˅ᴹᦣ䗄ⱘDŽ᳔ㅔऩⱘ‫އ‬ㄪᷥᄺдЁˈ↣
ϔϾሲᗻপᇥ᭄ⱘߚ⾏ⱘؐ˄՟བˈHotǃMildǃCold˅DŽ✊㗠ˈᠽሩⱘㅫ⊩˄೼
3.7.2 㡖Ё䅼䆎˅г‫ܕ‬䆌໘⧚ؐඳЎᅲ᭄ⱘሲᗻ˄՟བˈ᭄ᄫ㸼⼎ⱘ⏽ᑺ˅DŽ
z Ⳃᷛߑ᭄‫݋‬᳝⾏ᬷⱘ䕧ߎؐDŽ೒ 3-1 ⱘ‫އ‬ㄪᷥ㒭↣Ͼᅲ՟䌟ќϔϾᏗᇨൟⱘߚ㉏
˄՟བˈyes ៪ no˅DŽ‫އ‬ㄪᷥᮍ⊩ᕜᆍᯧᠽሩࠄᄺд᳝ϸϾҹϞ䕧ߎؐⱘߑ᭄DŽ
ϔ⾡᳈ᔎ᳝࡯ⱘᠽሩㅫ⊩‫ܕ‬䆌ᄺд‫݋‬᳝ᅲ᭄ؐ䕧ߎⱘߑ᭄ˈሑㅵ‫އ‬ㄪᷥ೼䖭⾡
ᚙ‫މ‬ϟⱘᑨ⫼ϡ໾ᐌ㾕DŽ
z ৃ㛑䳔㽕ᵤপⱘᦣ䗄˄disjunctive description˅DŽབϞ䴶ᣛߎⱘˈ‫އ‬ㄪᷥᕜ㞾✊
ഄҷ㸼њᵤপ㸼䖒ᓣDŽ
z 䆁㒗᭄᥂ৃҹࣙ৿䫭䇃DŽ‫އ‬ㄪᷥᄺдᇍ䫭䇃᳝ᕜདⱘ剕Ầᗻˈ᮴䆎ᰃ䆁㒗ḋ՟
᠔ሲⱘߚ㉏䫭䇃䖬ᰃᦣ䗄䖭ѯḋ՟ⱘሲᗻؐ䫭䇃DŽ
z 䆁㒗᭄᥂ৃҹࣙ৿㔎ᇥሲᗻؐⱘᅲ՟DŽ‫އ‬ㄪᷥᄺд⫮㟇ৃҹ೼᳝᳾ⶹሲᗻؐⱘ
䆁㒗ḋ՟ЁՓ⫼˄՟བˈҙ᳝ϔ䚼ߚ䆁㒗ḋ՟ⶹ䘧ᔧ໽ⱘ⑓ᑺ˅DŽ䖭Ͼ䯂乬ᇚ
೼㄀ 3.7.4 ᇣ㡖Ё䅼䆎DŽ

Ꮖ㒣থ⦄ᕜ໮ᅲ䰙ⱘ䯂乬ヺড়䖭ѯ⡍ᕕˈ᠔ҹ‫އ‬ㄪᷥᄺдᏆ㒣㹿ᑨ⫼ࠄᕜ໮䯂乬
ЁDŽ՟བḍ᥂⮒⮙ߚ㉏ᙷ㗙˗ḍ᥂䍋಴ߚ㉏䆒໛ᬙ䱰˗ḍ᥂ᢪ⃴ᬃҬⱘৃ㛑ᗻߚ㉏䌋ℒ
⬇䇋DŽᇍѢ䖭ѯ䯂乬ˈḌᖗӏࡵ䛑ᰃ㽕ᡞḋ՟ߚ㉏ࠄ৘ৃ㛑ⱘ⾏ᬷؐᇍᑨⱘ㉏߿
˄category˅Ёˈ಴ℸ㒣ᐌ㹿⿄Ўߚ㉏䯂乬˄Classification Problem˅DŽ

䖭ϔゴⱘ݊ԭ䚼ߚᰃ䖭ḋᅝᥦⱘDŽ3.4 㡖㒭ߎᄺд‫އ‬ㄪᷥⱘ෎ᴀ ID3 ㅫ⊩ᑊⓨ⼎ᅗ


ⱘ‫݋‬ԧ᪡԰DŽ3.5 㡖ߚᵤՓ⫼䖭⾡ᄺдㅫ⊩䖯㸠ⱘ‫؛‬䆒ぎ䯈᧰㋶ˈᑊϢ㄀ 2 ゴⱘㅫ⊩䖯
㸠њ↨䕗DŽ3.6 㡖ࠏ⬏њ‫އ‬ㄪᷥᄺдㅫ⊩ⱘᔦ㒇‫أ‬㕂ˈᑊ᳈ϔ㠀࣪ⱘ᥶㋶њϔ⾡㹿⿄Ў
༹ഢྚࠗߔⱘᔦ㒇‫أ‬㕂ˈ䆹‫أ‬㕂Ӭ‫ܜ‬䗝ᢽ᳔ㅔऩⱘ‫؛‬䆒DŽ3.7 㡖䅼䆎њ䆁㒗᭄᥂ⱘ䖛ᑺ
ᢳড়˄overfitting˅ˈҹঞ㾷‫އ‬䖭⾡䯂乬ⱘㄪ⬹ˈ↨བ㾘߭ৢׂ࠾˄post-pruning˅DŽ䖭ϔ
㡖䖬䅼䆎њϔѯ᳈⏅ܹⱘ䆱乬ˈ↨བᇚㅫ⊩ᠽሩҹ䗖ᑨᅲ᭄ؐሲᗻǃᏺ᳝᳾㾖⌟ࠄሲᗻ
ⱘ䆁㒗᭄᥂ǃҹঞ᳝ϡৠҷӋⱘሲᗻDŽ

3.4 ะᵢⲺߩㆌṇᆜҖ㇍⌋

໻໮᭄Ꮖᓔথⱘ‫އ‬ㄪᷥᄺдㅫ⊩ᰃϔ⾡Ḍᖗㅫ⊩ⱘবԧDŽ䆹ㅫ⊩䞛⫼㞾乊৥ϟⱘ䋾
ှ᧰㋶䘡ग़ৃ㛑ⱘ‫އ‬ㄪᷥぎ䯈DŽ䖭⾡ᮍ⊩ᰃ ID3 ㅫ⊩˄Quinlan 1986˅੠ৢ㒻ⱘ C4.5
ㅫ⊩˄Quinlan 1993˅ⱘ෎⸔ˈгᰃ䖭䞠䅼䆎ⱘ䞡⚍DŽ䖭ϔ㡖ᇚ㒭ߎ‫އ‬ㄪᷥᄺдⱘ෎ᴀ
ㅫ⊩ˈ໻㟈ⳌᔧѢ ID3 ㅫ⊩DŽ೼ 3.7 㡖៥Ӏ㗗㰥䆹෎ᴀㅫ⊩ⱘϔѯᠽሩˈࣙᣀ㹿ড়ᑊࠄ
C4.5 ⱘᠽሩ੠݊Ҫϔѯ䕗ᮄⱘ‫އ‬ㄪᷥᄺдㅫ⊩DŽ

෎ᴀⱘ ID3 ㅫ⊩䗮䖛㞾乊৥ϟᵘ䗴‫އ‬ㄪᷥᴹ䖯㸠ᄺдDŽᵘ䗴䖛⿟ᰃҢĀાϔϾሲ


ᗻᇚ೼ᷥⱘḍ㒧⚍㹿⌟䆩˛ā䖭Ͼ䯂乬ᓔྟⱘDŽЎњಲㄨ䖭Ͼ䯂乬ˈՓ⫼㒳䅵⌟䆩ᴹ⹂
ᅮ↣ϔϾᅲ՟ሲᗻऩ⣀ߚ㉏䆁㒗ḋ՟ⱘ㛑࡯DŽߚ㉏㛑࡯᳔དⱘሲᗻ㹿䗝԰ᷥⱘḍ㒧⚍ⱘ
⌟䆩DŽ✊ৢЎḍ㒧⚍ሲᗻⱘ↣Ͼৃ㛑ؐѻ⫳ϔϾߚᬃˈᑊᡞ䆁㒗ḋ՟ᥦ߫ࠄ䗖ᔧⱘߚᬃ
˄гህᰃˈḋ՟ⱘ䆹ሲᗻؐᇍᑨⱘߚᬃ˅ПϟDŽ✊ৢ䞡໡ᭈϾ䖛⿟ˈ⫼↣Ͼߚᬃ㒧⚍݇
㘨ⱘ䆁㒗ḋ՟ᴹ䗝প೼䆹⚍㹿⌟䆩ⱘ᳔ՇሲᗻDŽ䖭ᔶ៤њᇍড়Ḑ‫އ‬ㄪᷥⱘ䋾ှ᧰㋶
˄greedy search˅ˈгህᰃㅫ⊩Ңϡಲ⒃䞡ᮄ㗗㰥ҹࠡⱘ䗝ᢽDŽ㸼 3-1 ᦣ䗄њ䆹ㅫ⊩ⱘϔ
Ͼㅔ࣪⠜ᴀüüϧ䮼⫼ᴹᄺдᏗᇨؐߑ᭄˄ेὖᗉᄺд˅DŽ

㸼 3-1 ϧ⫼ѢᄺдᏗᇨߑ᭄ⱘ ID3 ㅫ⊩ὖ㽕

ID3 ᰃϔ⾡㞾乊৥ϟ๲䭓ᷥⱘ䋾ှㅫ⊩ˈ೼↣Ͼ㒧⚍䗝প㛑᳔དഄߚ㉏ḋ՟ⱘሲᗻDŽ㒻㓁䖭Ͼ䖛⿟Ⳉ
ࠄ䖭ỉᷥ㛑ᅠ㕢ߚ㉏䆁㒗ḋ՟ˈ៪᠔᳝ⱘሲᗻ䛑Փ⫼䖛њDŽ

ID3(ExamplesˈTarget_attributeˈAttributes)
Examples े䆁㒗ḋ՟䲚DŽTarget_attribute ᰃ䖭ỉᷥ㽕乘⌟ⱘⳂᷛሲᗻDŽAttributes
ᰃ䰸Ⳃᷛሲᗻ໪կᄺдࠄⱘ‫އ‬ㄪᷥ⌟䆩ⱘሲᗻ߫㸼DŽ䖨ಲ㛑ℷ⹂ߚ㉏㒭ᅮ
Examples ⱘ‫އ‬ㄪᷥDŽ
z ߯ᓎᷥⱘ Root 㒧⚍
z བᵰ Examples 䛑Ўℷˈ䙷М䖨ಲ label =+ ⱘऩ㒧⚍ᷥ Root
z བᵰ Examples 䛑Ўডˈ䙷М䖨ಲ label =- ⱘऩ㒧⚍ᷥ Root
z བᵰ Attributes Ўぎˈ䙷М䖨ಲऩ㒧⚍ᷥ Rootˈlabel=Examples Ё᳔᱂䘡ⱘ
Target_attribute ؐ
z ৺߭
z AĕAttributes Ёߚ㉏ Examples 㛑࡯᳔ད*ⱘሲᗻ
z Root ⱘ‫އ‬ㄪሲᗻĕA
z ᇍѢAⱘ↣Ͼৃ㛑ؐvi
z ೼RootϟࡴϔϾᮄⱘߚᬃᇍᑨ⌟䆩A= vi
z Ҹ Examplesvi ЎExamplesЁ⒵䎇AሲᗻؐЎviⱘᄤ䲚
z བᵰ Examplesvi Ўぎ
z ೼䖭ϾᮄߚᬃϟࡴϔϾ৊ᄤ㒧⚍ˈ㒧⚍ⱘ label=Examples
Ё᳔᱂䘡ⱘ Target_attribute ؐ
z ৺߭೼䖭ϾᮄߚᬃϟࡴϔϾᄤᷥ ID3˄ Examplesvi ,
Target_attribute, Attributes-{A}˅
z 㒧ᴳ
z 䖨ಲ Root

*ḍ᥂݀ᓣ 3.4 ⱘᅮНˈ‫݋‬᳔᳝催ֵᙃ๲Ⲟ˄information gain˅ⱘሲᗻᰃ᳔དⱘሲᗻDŽ

3.4.1 ଠѠኔᙝᱥᴶ֩Ⲻ࠼㊱ኔᙝϋ

ID3 ㅫ⊩ⱘḌᖗ䯂乬ᰃ䗝প೼ᷥⱘ↣Ͼ㒧⚍㽕⌟䆩ⱘሲᗻDŽ៥ӀᏠᳯ䗝ᢽⱘᰃ᳔᳝
ࡽѢߚ㉏ᅲ՟ⱘሲᗻDŽ䙷М㸵䞣ሲᗻӋؐⱘϔϾདⱘᅮ䞣ᷛ‫ޚ‬ᰃҔМਸ਼˛䖭䞠ᇚᅮНϔ
Ͼ㒳䅵ሲᗻˈ⿄ЎĀֵᙃ๲Ⲟ˄information gain˅
āˈ⫼ᴹ㸵䞣㒭ᅮⱘሲᗻऎߚ䆁㒗ḋ՟
ⱘ㛑࡯DŽID3 ㅫ⊩೼๲䭓ᷥⱘ↣ϔℹՓ⫼䖭Ͼֵᙃ๲Ⲟᷛ‫ޚ‬Ң‫׭‬䗝ሲᗻЁ䗝ᢽሲᗻDŽ
3.4.1.1 ⭞⟫ᓜ䠅ṭׁⲺൽжᙝ

Ўњ㊒⹂ഄᅮНֵᙃ๲Ⲟˈ៥Ӏ‫ܜ‬ᅮНֵᙃ䆎Ёᑓ⊯Փ⫼ⱘϔϾᑺ䞣ᷛ‫⿄ˈޚ‬Ў➉
˄entropy˅
ˈᅗࠏ⬏њӏᛣḋ՟䲚ⱘ㒃ᑺ˄purity˅DŽ㒭ᅮࣙ৿݇ѢᶤϾⳂᷛὖᗉⱘℷড
ḋ՟ⱘḋ՟䲚 Sˈ䙷М S Ⳍᇍ䖭ϾᏗᇨൟߚ㉏ⱘ➉Ў˖

Entropy(S) {-p†log2p†-plog2p ˄3.1˅

݊Ёp†ᰃ೼SЁℷ՟ⱘ↨՟ˈpᰃ೼SЁ䋳՟ⱘ↨՟DŽ೼᳝݇➉ⱘ᠔᳝䅵ㅫЁ៥Ӏᅮ
Н 0log0 Ў 0DŽ

В՟䇈ᯢˈ‫؛‬䆒 S ᰃϔϾ݇ѢᶤᏗᇨὖᗉⱘ᳝ 14 Ͼḋ՟ⱘ䲚ড়ˈᅗࣙᣀ 9 Ͼℷ՟


੠ 5 Ͼড՟˄៥Ӏ䞛⫼䆄ো[9+ˈ5-]ᴹὖᣀ䖭ḋⱘ᭄᥂ḋ՟˅DŽ䙷М S ⳌᇍѢ䖭ϾᏗᇨ
ߚ㉏ⱘ➉˄Entropy˅Ў˖

Entropy ([9,5]) (9 / 14) log 2 (9 / 14)  (5 / 14) log 2 (5 / 14)

=0.940 ˄3.2˅

⊼ᛣˈབᵰSⱘ᠔᳝៤ਬሲѢৠϔ㉏ˈ䙷МSⱘ➉Ў 0DŽ՟བˈབᵰ᠔᳝ⱘ៤ਬᰃℷ
ⱘ ˄ p†=1 ˅ ˈ 䙷 М p ህ ᰃ 0 ˈ Ѣ ᰃ Entropy(S) =
 1 ˜ log 2 (1)  (0) ˜ log 2 (0) 1 ˜ 0  0 ˜ log 2 0 0 DŽ঺໪ˈᔧ䲚ড়Ёℷডḋ՟ⱘ᭄䞣
Ⳍㄝᯊ➉Ў 1DŽབᵰ䲚ড়Ёℷড՟ⱘ᭄䞣ϡㄝᯊˈ➉ҟѢ 0 ੠ 1 П䯈DŽ೒ 3-2 ᰒ⼎њ݇
ѢᶤᏗᇨߚ㉏ⱘ➉ߑ᭄䱣ⴔp†Ң 0 ࠄ 1 ব࣪ⱘ᳆㒓DŽ

插图——原书页码:57

೒ 3-2 ݇ѢᶤᏗᇨߚ㉏ⱘⱘ➉ߑ᭄

೒Ё⬏ߎњ䱣ⴔℷ՟᠔ऴ↨՟p†Ң 0 ࠄ 1ˈ➉ߑ᭄ব࣪ⱘ᳆㒓DŽ

ֵᙃ䆎Ё➉ⱘϔ⾡㾷䞞ᰃˈ➉⹂ᅮњ㽕㓪ⷕ䲚ড় S Ёӏᛣ៤ਬ˄ेҹഛࣔⱘὖ⥛䱣
ᴎᢑߎⱘϔϾ៤ਬ˅ⱘߚ㉏᠔䳔㽕ⱘ᳔ᇥѠ䖯ࠊԡ᭄DŽВ՟ᴹ䇈ˈབᵰ p † ᰃ 1ˈ᥹ᬊ
㗙ⶹ䘧ᢑߎⱘḋ՟ᖙЎℷˈ᠔ҹϡᖙথӏԩ⍜ᙃˈℸᯊⱘ➉Ў 0DŽ঺ϔᮍ䴶ˈབᵰ p † ᰃ
0.5ˈᖙ乏⫼ϔϾѠ䖯ࠊԡᴹ䇈ᯢᢑߎⱘḋ՟ᰃℷ䖬ᰃ䋳DŽབᵰ p † ᰃ 0.8ˈ䙷Мᇍ᠔䳔
ⱘ⍜ᙃ㓪ⷕᮍ⊩ᰃ䌟㒭ℷ՟䲚ড়䕗ⷁⱘ㓪ⷕˈৃ㛑ᗻ䕗ᇣⱘড՟䲚ড়䕗䭓ⱘ㓪ⷕˈᑇഛ
↣ᴵ⍜ᙃⱘ㓪ⷕᇥѢ 1 ϾѠ䖯ࠊԡDŽ

㟇ℸ៥Ӏ䅼䆎њⳂᷛߚ㉏ᰃᏗᇨൟⱘᚙ‫މ‬ϟⱘ➉DŽ᳈ϔ㠀ⱘˈབᵰⳂᷛሲᗻ‫݋‬᳝ c
Ͼϡৠⱘؐˈ䙷М S ⳌᇍѢ c Ͼ⢊ᗕ˄c-wise˅ⱘߚ㉏ⱘ➉ᅮНЎ˖

c
Entropy ( S ) { ¦  pi log 2 pi (3.3)
i 1

݊ЁpiᰃSЁሲѢ㉏߿iⱘ↨՟DŽ䇋⊼ᛣᇍ᭄ⱘᑩ᭄ҡ✊Ў 2ˈॳ಴ᰃ➉ᰃҹӂ䘑࡬ԡ
ⱘϾ᭄ᴹᑺ䞣㓪ⷕ䭓ᑺⱘDŽৠᯊ⊼ᛣབᵰⳂᷛሲᗻ‫݋‬᳝cϾৃ㛑ؐˈ䙷М➉᳔໻ৃ㛑ࠄ
log2cDŽ

3.4.1.2 ⭞‫ؗ‬ᚥ໔ⴀᓜ䠅ᵕᵑⲺ⟫䲃ք

Ꮖ㒣᳝њ➉԰Ў㸵䞣䆁㒗ḋ՟䲚ড়㒃ᑺⱘᷛ‫⦄ˈޚ‬೼ৃҹᅮНሲᗻߚ㉏䆁㒗᭄᥂ⱘ
ᬜ࡯ⱘᑺ䞣ᷛ‫ޚ‬DŽ䖭Ͼᷛ‫ޚ‬㹿⿄ЎĀֵᙃ๲Ⲟ˄information gain˅
āDŽㅔऩⱘ䇈ˈϔϾሲ
ᗻⱘֵᙃ๲Ⲟህᰃ⬅ѢՓ⫼䖭Ͼሲᗻߚࡆḋ՟㗠ᇐ㟈ⱘᳳᳯ➉䰡ԢDŽ᳈㊒⹂ഄ䆆ˈϔϾ
ሲᗻ A Ⳍᇍḋ՟䲚ড় S ⱘֵᙃ๲Ⲟ Gain(S,A)㹿ᅮНЎ

| Sv |
Gain( S , A) { Entropy ( S )  ¦
vValues ( A ) | S |
Entropy ( S v ) ˄3.4˅

݊Ё Values(A)ᰃሲᗻA᠔᳝ৃ㛑ؐⱘ䲚ড়ˈS v ᰃSЁሲᗻAⱘؐЎvⱘᄤ䲚˄гህᰃˈ
S v ={sS|A(s)=v}˅DŽ䇋⊼ᛣˈㄝᓣ˄3.4˅ⱘ㄀ϔ乍ህᰃॳᴹ䲚ড়Sⱘ➉ˈ㄀Ѡ乍ᰃ⫼A
ߚ㉏Sৢ➉ⱘᳳᳯؐDŽ䖭Ͼ㄀Ѡ乍ᦣ䗄ⱘᳳᳯ➉ህᰃ↣Ͼᄤ䲚ⱘ➉ⱘࡴᴗ੠ˈᴗؐЎሲ
| Sv |
ѢSvⱘḋ՟ऴॳྟḋ՟Sⱘ↨՟ DŽ᠔ҹGain(S,A)ᰃ⬅Ѣⶹ䘧ሲᗻAⱘؐ㗠ᇐ㟈ⱘᳳ
|S|
ᳯ➉‫ޣ‬ᇥDŽᤶহ䆱ᴹ䆆ˈGain(S,A)ᰃ⬅Ѣ㒭ᅮሲᗻAⱘؐ㗠ᕫࠄⱘ݇ѢⳂᷛߑ᭄ؐⱘֵ
ᙃDŽᔧᇍSⱘϔϾӏᛣ៤ਬⱘⳂᷛؐ㓪ⷕᯊˈGain(S,A)ⱘؐᰃ೼ⶹ䘧ሲᗻAⱘؐৢৃҹ
㡖ⳕⱘѠ䖯ࠊԡ᭄DŽ

՟བˈ‫؛‬ᅮ S ᰃϔ༫᳝݇໽⇨ⱘ䆁㒗ḋ՟ˈᦣ䗄ᅗⱘሲᗻࣙᣀৃ㛑ᰃ‫݋‬᳝ Weak ੠


Strong ϸϾؐⱘ WindDŽ‫ࠡڣ‬䴶ϔḋˈ‫؛‬ᅮ S ࣙ৿ 14 Ͼḋ՟ˈ[9+ˈ5-]DŽ೼䖭 14 Ͼḋ՟
Ёˈ‫؛‬ᅮℷ՟Ёⱘ 6 Ͼ੠ড՟Ёⱘ 2 Ͼ᳝ Wind =Weakˈ݊Ҫⱘ᳝ Wind=StrongDŽ⬅Ѣᣝ
✻ሲᗻ Wind ߚ㉏ 14 Ͼḋ՟ᕫࠄⱘֵᙃ๲Ⲟৃҹ䅵ㅫབϟDŽ

Values(Wind) Weak,Strong
S [9,5-]
SWeak m [6,2]
S Strong m [3,3]
| Sv |
Gain( S ,Wind ) Entropy ( S )  ¦
v{Weak , Strong } | S |
Entropy ( S v )

Entropy ( S )  (8 / 14) Entropy ( SWeak )  (6 / 14) Entropy ( S Strong )


0.940  (8 / 14)0.811  (6 / 14)1.00
0.048

ֵᙃ๲Ⲟℷᰃ ID3 ㅫ⊩๲䭓ᷥⱘ↣ϔℹЁ䗝প᳔Շሲᗻⱘᑺ䞣ᷛ‫ޚ‬DŽ೒ 3-3 ὖ䗄њ


བԩՓ⫼ֵᙃ๲Ⲟᴹ䆘Ԅሲᗻⱘߚ㉏㛑࡯DŽ೼䖭Ͼ೒Ёˈ䅵ㅫњϸϾϡৠሲᗻ˖⑓ᑺ
˄Humidity˅੠亢࡯˄Wind˅ⱘֵᙃ๲Ⲟˈҹ֓‫އ‬ᅮᇍѢߚ㉏㸼 3-2 ⱘ䆁㒗ḋ՟ાϔϾ
ሲᗻ᳈དDŽ

插图——原书页码:59
Which attribute is the best classifier? ાϔϾሲᗻᰃ᳔Շⱘߚ㉏ሲᗻ˛

೒ 3-3 䅵ㅫሲᗻⱘֵᙃ๲Ⲟ

ⳌᇍѢⳂᷛߚ㉏˄े᯳ᳳ݁Ϟजᰃ৺䗖ড়ᠧ㔥⧗˅ˈHumidity ↨ Wind ᳝᳈໻ⱘֵᙃ๲ⲞDŽ䖭䞠ˈE ҷ


㸼➉ˈS ҷ㸼ॳྟḋ՟䲚ড়DŽᏆⶹ߱ྟ䲚ড় S ᳝ 9 Ͼℷ՟੠ 5 Ͼ䋳՟ˈे[9+ˈ5-]DŽ⫼ Humidity ߚ㉏䖭
ѯḋ՟ѻ⫳њᄤ䲚[3+ˈ4-]˄Humidity=High˅੠[6+ˈ1-]˄Humidity=Normal˅DŽ䖭⾡ߚ㉏ⱘֵᙃ๲Ⲟ
Ў 0.151ˈ㗠ᇍѢሲᗻ Wind ๲ⲞҙЎ 0.048DŽ

3.4.2 ⽰ׁ

Ўњⓨ⼎ ID3 ㅫ⊩ⱘ‫݋‬ԧ᪡԰ˈ㗗㰥㸼 3-2 ⱘ䆁㒗᭄᥂᠔ҷ㸼ⱘᄺдӏࡵDŽ䖭䞠ˈ


Ⳃᷛሲᗻ PlayTennis ᇍѢϡৠⱘ᯳ᳳ݁Ϟज‫݋‬᳝ yes ੠ no ϸϾؐˈ៥Ӏᇚḍ᥂݊Ҫሲ
ᗻᴹ乘⌟䖭ϾⳂᷛሲᗻؐDŽ‫ܜ‬㗗㰥䖭Ͼㅫ⊩ⱘ㄀ϔℹˈ߯ᓎ‫އ‬ㄪᷥⱘ᳔乊ッ㒧⚍DŽાϔ
Ͼሲᗻ䆹೼ᷥϞ㄀ϔϾ㹿⌟䆩ਸ਼˛ID3 ㅫ⊩䅵ㅫ↣ϔϾ‫׭‬䗝ሲᗻ˄гህᰃ Outlookˈ
TemperatureˈHumidityˈ੠ Wind˅ⱘֵᙃ๲Ⲟˈ✊ৢ䗝ᢽֵᙃ๲Ⲟ᳔催ⱘϔϾDŽ݊Ё
ϸϾሲᗻⱘֵᙃ๲Ⲟⱘ䅵ㅫᰒ⼎೼೒ 3-3 ЁDŽ᠔᳝ಯϾሲᗻⱘֵᙃ๲ⲞЎ

Gain(S,Outlook)=0.246

Gain(S,Humidity)=0.151

Gain(S,Wind)=0.048

Gain(S,Temperature)=0.029

݊Ё S 㸼⼎ᴹ㞾㸼 3-2 ⱘ䆁㒗ḋ՟ⱘ䲚ড়DŽ

㸼 3-2 Ⳃᷛὖᗉ PlayTennis ⱘ䆁㒗ḋ՟


Day Outlook Temperature Humidity Wind PlayTennis
D1 Sunny Hot High Weak No
D2 Sunny Hot High Strong No
D3 Overcast Hot High Weak Yes
D4 Rain Mild High Weak Yes
D5 Rain Cool Normal Weak Yes
D6 Rain Cool Normal Strong No
D7 Overcast Cool Normal Strong Yes
D8 Sunny Mild High Weak No
D9 Sunny Cool Normal Weak Yes
D10 Rain Mild Normal Weak Yes
D11 Sunny Mild Normal Strong Yes
D12 Overcast Mild High Strong Yes
D13 Overcast Hot Normal Weak Yes
D14 Rain Mild High Strong No

ḍ᥂ֵᙃ๲Ⲟᷛ‫ˈޚ‬ሲᗻ Outlook ೼䆁㒗ḋ՟ϞᦤկњᇍⳂᷛሲᗻ PlayTennis ⱘ᳔


ད乘⌟DŽ᠔ҹˈOutlook 㹿䗝԰ḍ㒧⚍ⱘ‫އ‬ㄪሲᗻˈ ᑊЎᅗⱘ↣ϔϾৃ㛑ؐ˄гህᰃ Sunnyˈ
Overcast ੠ Rain˅೼ḍ㒧⚍ϟ߯ᓎߚᬃDŽ䚼ߚ‫އ‬ㄪᷥⱘ㒧ᵰᰒ⼎೼೒ 3-4 Ёˈৠᯊ⬏ߎ
ⱘ䖬᳝㹿ᥦ߫ࠄ↣Ͼᮄⱘৢ㒻㒧⚍ⱘ䆁㒗ḋ՟DŽ⊼ᛣࠄ↣ϔϾ Outlook=Overcast ⱘḋ՟
г䛑ᰃ PlayTennis ⱘℷ՟DŽ᠔ҹˈᷥⱘ䖭Ͼ㒧⚍៤ЎϔϾ৊ᄤ㒧⚍ˈᅗᇍⳂᷛሲᗻⱘߚ
㉏ᰃ PlayTennis=YesDŽⳌডˈᇍᑨ Outlook=Sunny ੠ Outlook=Rain ⱘৢ㒻㒧⚍䖬᳝䴲 0
ⱘ➉ˈ᠔ҹ‫އ‬ㄪᷥӮ೼䖭ѯ㒧⚍ϟ䖯ϔℹሩᓔDŽ

ᇍѢ䴲㒜ッⱘৢ㒻㒧⚍ˈ‫ݡ‬䞡໡ࠡ䴶ⱘ䖛⿟䗝ᢽϔϾᮄⱘሲᗻᴹߚࡆ䆁㒗ḋ՟ˈ䖭
ϔ⃵ҙՓ⫼Ϣ䖭Ͼ㒧⚍݇㘨ⱘ䆁㒗ḋ՟DŽᏆ㒣㹿ᬊ㓪ܹᷥⱘ䕗催㒧⚍ⱘሲᗻ㹿ᥦ䰸೼
໪ˈҹ֓ӏԩ㒭ᅮⱘሲᗻ೼ᷥⱘӏᛣ䏃ᕘϞ᳔໮ҙߎ⦄ϔ⃵DŽᇍѢ↣ϔϾᮄⱘ৊ᄤ㒧⚍
㒻㓁䖭Ͼ䖛⿟ˈⳈࠄ⒵䎇ҹϟϸϾᴵӊЁⱘӏϔϾ˖˄1˅᠔᳝ⱘሲᗻᏆ㒣㹿䖭ᴵ䏃ᕘࣙ
ᣀˈ៪˄2˅Ϣ䖭Ͼ㒧⚍݇㘨ⱘ᠔᳝䆁㒗ḋ՟䛑‫݋‬᳝ৠḋⱘⳂᷛሲᗻؐ˄гህᰃᅗӀⱘ
➉Ў 0˅DŽ೒ 3-4 ߫ߎњϟϔℹ๲䭓ᷥ㽕䅵ㅫⱘֵᙃ๲ⲞDŽҢ㸼 3-2 ⱘ 14 Ͼ䆁㒗ḋ՟䗮
䖛 ID3 ㅫ⊩ᕫࠄⱘ᳔㒜‫އ‬ㄪᷥ㹿⬏೼೒ 3-1 ЁDŽ

插图——原书页码:61

Which attribute should be test here? ાϔϾሲᗻᑨ೼䖭䞠㹿⌟䆩˛

೒ 3-4 ID3 ㅫ⊩㄀ϔℹৢᔶ៤ⱘ䚼ߚ‫އ‬ㄪᷥ

䆁㒗ḋ՟㹿ᥦ߫ࠄᇍᑨⱘߚᬃ㒧⚍DŽߚᬃ Overcast ⱘ᠔᳝ḋ՟䛑ᰃℷ՟ˈ᠔ҹ៤ЎⳂᷛߚ㉏Ў Yes ⱘ


৊㒧⚍DŽ঺ϸϾ㒧⚍ᇚ㹿䖯ϔℹሩᓔˈᮍ⊩ᰃᣝ✻ᮄⱘḋ՟ᄤ䲚䗝পֵᙃ๲Ⲟ᳔催ⱘሲᗻDŽ

3.5 ߩㆌṇᆜҖѣⲺ‫ٽ‬䇴グ䰪ᩒ㍘

Ϣ݊Ҫⱘᔦ㒇ᄺдㅫ⊩ϔḋˈID3 ㅫ⊩ৃҹ㹿ᦣ䗄ЎҢϔϾ‫؛‬䆒ぎ䯈Ё᧰㋶ϔϾᢳ
ড়䆁㒗ḋ՟ⱘ‫؛‬䆒DŽ㹿 ID3 ㅫ⊩᧰㋶ⱘ‫؛‬䆒ぎ䯈ህᰃৃ㛑ⱘ‫އ‬ㄪᷥⱘ䲚ড়DŽID3 ㅫ⊩ҹ
ϔ⾡Ңㅔऩࠄ໡ᴖⱘ⠀ቅㅫ⊩䘡ग़䖭Ͼ‫؛‬䆒ぎ䯈ˈҢぎⱘᷥᓔྟˈ✊ৢ䗤ℹ㗗㰥᳈ࡴ໡
ᴖⱘ‫؛‬䆒ˈⳂⱘᰃ᧰㋶ࠄϔϾℷ⹂ߚ㉏䆁㒗᭄᥂ⱘ‫އ‬ㄪᷥDŽᓩᇐ䖭⾡⠀ቅ᧰㋶ⱘ䆘Ԅߑ
᭄ᰃֵᙃ๲Ⲟᑺ䞣DŽ೒ 3-5 ᦣ䗄њ䖭⾡᧰㋶DŽ

插图——原书页码:62

೒ 3-5 ID3 ᧰㋶ⱘ‫؛‬䆒ぎ䯈

ID3 䘡ग़ৃ㛑‫އ‬ㄪᷥⱘぎ䯈ˈҢ᳔ㅔऩⱘᷥࠄ䗤⏤໡ᴖⱘᷥDŽ݊᧰㋶⬅ֵᙃ๲Ⲟਃথᓣ㾘߭ᓩᇐDŽ

䗮䖛㾖ᆳ ID3 ㅫ⊩ⱘ᧰㋶ぎ䯈੠᧰㋶ㄪ⬹ˈ៥Ӏৃҹ⏅ܹ䅸䆚䖭Ͼㅫ⊩ⱘӬ࢓੠


ϡ䎇DŽ
z ID3 ㅫ⊩Ёⱘ‫؛‬䆒ぎ䯈ࣙ৿᠔᳝ⱘ‫އ‬ㄪᷥˈᅗᰃⳌᇍѢ⦄᳝ሲᗻⱘ᳝䰤⾏ᬷؐߑ
᭄ⱘϔϾᅠ ᅠᭈぎ䯈DŽ಴Ў↣Ͼ᳝䰤⾏ᬷؐߑ᭄ৃ㹿㸼⼎ЎᶤϾ‫އ‬ㄪᷥˈ᠔ҹ ID3
ㅫ⊩䙓‫ܡ‬њ᧰㋶ϡᅠᭈ‫؛‬䆒ぎ䯈˄՟བ䙷ѯҙ㗗㰥ড়প‫؛‬䆒ⱘᮍ⊩˅ⱘϔϾЏ
㽕亢䰽˖‫؛‬䆒ぎ䯈ৃ㛑ϡࣙ৿Ⳃᷛߑ᭄DŽ
z ᔧ䘡ग़‫އ‬ㄪᷥぎ䯈ᯊˈID3 ҙ㓈ᡸऩϔⱘᔧࠡ‫؛‬䆒DŽ䖭Ϣ㄀ 2 ゴ䅼䆎ⱘবൟぎ䯈
‫׭‬䗝⍜䰸ᮍ⊩ϡৠˈৢ㗙㓈ᡸњϢᔧࠡⱘ䆁㒗ḋ՟ϔ㟈ⱘ᠔᳝‫؛‬䆒ⱘ䲚ড়DŽ಴
Ўҙ㗗㰥ऩϔⱘ‫؛‬䆒ˈID3 ㅫ⊩༅এњ㸼⼎᠔᳝ϔ㟈‫؛‬䆒᠔ᏺᴹⱘӬ࢓DŽ՟བˈ
ᅗϡ㛑߸ᮁ᳝໮ᇥϾ݊Ҫⱘ‫އ‬ㄪᷥгᰃϢ⦄᳝ⱘ䆁㒗᭄᥂ϔ㟈ⱘˈ៪㗙Փ⫼ᮄ
ⱘᅲ՟ᶹ䆶ᴹ᳔Ӭഄऎߚ䖭ѯゲѝ‫؛‬䆒DŽ
z ෎ᴀⱘ ID3 ㅫ⊩೼᧰㋶Ёϡ䖯㸠ಲ⒃DŽ↣ᔧ೼ᷥⱘᶤϔሖ⃵䗝ᢽњϔϾሲᗻ䖯
㸠⌟䆩ˈᅗϡӮ‫ݡ‬ಲ⒃䞡ᮄ㗗㰥䖭Ͼ䗝ᢽDŽ᠔ҹˈᅗᯧফ᮴ಲ⒃ⱘ⠀ቅ᧰㋶Ё
ᐌ㾕亢䰽ᕅડ˖ᬊᬯࠄሔ䚼᳔ӬⱘㄨḜˈԚϡᰃܼሔ᳔ӬⱘDŽᇍѢ ID3 ㅫ⊩ˈ
ϔϾሔ䚼᳔ӬⱘㄨḜᇍᑨⴔᅗ೼ϔᴵ᧰㋶䏃ᕘϞ᥶㋶ᯊ䗝ᢽⱘ‫އ‬ㄪᷥDŽ✊㗠ˈ
䖭Ͼሔ䚼᳔ӬⱘㄨḜৃ㛑ϡབ⊓ⴔ঺ϔᴵߚᬃ᧰㋶ࠄⱘ᳈ҸҎ⒵ᛣDŽৢ䴶៥Ӏ
䅼䆎ϔϾᠽሩˈ๲ࡴϔ⾡ᔶᓣⱘಲ⒃˄ৢׂ࠾‫އ‬ㄪᷥ˅DŽ
z ID3 ㅫ⊩೼᧰㋶ⱘ↣ϔℹ䛑Փ⫼ᔧࠡⱘ᠔᳝䆁㒗ḋ՟ˈҹ㒳䅵Ў෎⸔‫އ‬ᅮᗢḋ㊒
࣪ᔧࠡⱘ‫؛‬䆒DŽ䖭Ϣ䙷ѯ෎Ѣऩ⣀ⱘ䆁㒗ḋ՟䗦๲԰ߎ‫އ‬ᅮⱘᮍ⊩˄՟བˈFind-S
៪‫׭‬䗝⍜䰸⊩˅ϡৠDŽՓ⫼᠔᳝ḋ՟ⱘ㒳䅵ሲᗻ˄՟བˈֵᙃ๲Ⲟ˅ⱘϔϾӬ
⚍ᰃ໻໻‫ޣ‬ᇣњᇍϾ߿䆁㒗ḋ՟䫭䇃ⱘᬣᛳᗻDŽ಴ℸˈ䗮䖛ׂᬍ ID3 ㅫ⊩ⱘ㒜
ℶ‫߭ޚ‬ҹ᥹ফϡᅠܼᢳড়䆁㒗᭄᥂ⱘ‫؛‬䆒ˈᅗৃҹ㹿ᕜᆍᯧഄᠽሩࠄ໘⧚৿᳝
ాໄⱘ䆁㒗᭄᥂DŽ

3.6 ߩㆌṇᆜҖⲺᖈ㓩‫څ‬㖤

ID3 ㅫ⊩Ң㾖⌟ࠄⱘ䆁㒗᭄᥂⊯࣪ҹߚ㉏᳾㾕ᅲ՟ⱘㄪ⬹ᰃҔМਸ਼˛ᤶহ䆱䇈ˈᅗ
ⱘᔦ㒇‫أ‬㕂ᰃҔМ˛ಲᖚ㄀ 2 ゴЁˈᔦ㒇‫أ‬㕂ᰃϔ㋏߫ࠡᦤˈ䖭ѯࠡᦤϢ䆁㒗᭄᥂ϔ䍋
ⓨ㒢䆎䆕᳾ᴹᅲ՟ⱘߚ㉏DŽ

བᵰ㒭ᅮϔϾ䆁㒗ḋ՟ⱘ䲚ড়ˈ䙷М䗮ᐌ᳝ᕜ໮‫އ‬ㄪᷥϢ䖭ѯḋ՟ϔ㟈DŽ᠔ҹˈ㽕
ᦣ䗄 ID3 ㅫ⊩ⱘᔦ㒇‫أ‬㕂ˈᑨᡒࠄᅗҢ᠔᳝ϔ㟈ⱘ‫؛‬䆒Ё䗝ᢽϔϾⱘḍ᥂DŽID3 Ң䖭ѯ
‫އ‬ㄪᷥЁ䗝ᢽાϔϾਸ਼˛ᅗ䗝ᢽ೼Փ⫼ㅔऩࠄ໡ᴖⱘ⠀ቅㅫ⊩䘡ग़ৃ㛑ⱘᷥぎ䯈ᯊ䘛
ࠄⱘ㄀ϔϾৃ᥹ফⱘᷥDŽὖ⬹ഄ䆆ˈID3 ⱘ᧰㋶ㄪ⬹Ў˄a˅Ӭ‫ܜ‬䗝ᢽ䕗ⷁⱘᷥ㗠ϡᰃ
䕗䭓ⱘˈ੠˄b˅䗝ᢽ䙷ѯֵᙃ๲Ⲟ催ⱘሲᗻ⾏ḍ㒧⚍䕗䖥ⱘᷥDŽ೼ ID3 ЁՓ⫼ⱘ䗝ᢽ
ሲᗻⱘਃথᓣ㾘߭੠ᅗ䘛ࠄⱘ⡍ᅮ䆁㒗ḋ՟П䯈ᄬ೼ⴔᖂ཭ⱘⳌѦ԰⫼ˈ⬅Ѣ䖭ϔ⚍ˈ
ᕜ䲒‫⹂ޚ‬ഄࠏߦߎ ID3 ⱘᔦ㒇‫أ‬㕂DŽ✊㗠៥Ӏৃҹ䖥Ԑഄᡞᅗⱘᔦ㒇‫أ‬㕂ᦣ䗄Ўϔ⾡
ᇍⷁⱘ‫އ‬ㄪᷥⱘ‫أ‬དDŽ

䖥Ԑⱘ ID3 ㅫ⊩ᔦ㒇‫أ‬㕂˖䕗ⷁⱘᷥ↨䕗䭓ⱘӬ‫ܜ‬

џᅲϞˈ៥Ӏৃҹᛇ䈵ϔϾ㉏ԐѢ ID3 ⱘㅫ⊩ˈᅗ㊒⹂ഄ‫݋‬᳝䖭⾡ᔦ㒇‫أ‬㕂DŽ㗗


㰥ϔ⾡ㅫ⊩ˈᅗҢϔϾぎⱘᷥᓔྟᑓᑺӬ‫˄ܜ‬breadth first˅᧰㋶䗤⏤໡ᴖⱘᷥˈ‫ܜ‬㗗㰥
᠔᳝⏅ᑺЎ 1 ⱘᷥˈ✊ৢ᠔᳝⏅ᑺЎ 2 ⱘˈĂĂDŽϔᮺᅗᡒࠄњϔϾϢ䆁㒗᭄᥂ϔ㟈ⱘ
‫އ‬ㄪᷥˈᅗ䖨ಲ᧰㋶⏅ᑺⱘ᳔ᇣⱘϔ㟈ᷥ˄՟བˈ‫݋‬᳔᳝ᇥ㒧⚍ⱘᷥ˅DŽ䅽៥Ӏ⿄䖭⾡
ᑓᑺӬ‫᧰ܜ‬㋶˄breadth first search˅ㅫ⊩Ў BFS-ID3DŽBFS-ID3 ᇏᡒ᳔ⷁⱘ‫އ‬ㄪᷥˈ಴
ℸ㊒⹂ഄ‫݋‬᳝Ā䕗ⷁⱘᷥ↨䕗䭓ⱘᕫࠄӬ‫ܜ‬āⱘ‫أ‬㕂DŽID3 ৃ㹿ⳟ԰ BFS-ID3 ⱘϔϾ᳝
ᬜ䖥ԐˈᅗՓ⫼ϔ⾡䋾ှⱘਃথᓣ᧰㋶ӕ೒থ⦄᳔ⷁⱘᷥˈ㗠ϡ⫼䖯㸠ᅠᭈⱘᑓᑺӬ‫ܜ‬
᧰㋶ᴹ䘡ग़‫؛‬䆒ぎ䯈DŽ

಴Ў ID3 Փ⫼ֵᙃ๲Ⲟਃথᓣ㾘߭੠Ā⠀ቅāㄪ⬹ˈᅗࣙ৿↨ BFS-ID3 ᳈໡ᴖⱘ


‫أ‬㕂DŽᇸ݊ᰃˈᅗᑊ䴲ᘏᰃᡒ᳔ⷁⱘϔ㟈ᷥˈ㗠ᰃؒ৥Ѣ䙷ѯֵᙃ๲Ⲟ催ⱘሲᗻ᳈䴴䖥
ḍ㒧⚍ⱘᷥDŽ

ID3 ᔦ㒇‫أ‬㕂ⱘ᳈䌈ߛ䖥Ԑ˖䕗ⷁⱘᷥ↨䕗䭓ⱘᕫࠄӬ‫ܜ‬DŽ䙷ѯֵᙃ๲Ⲟ催ⱘሲᗻ
᳈䴴䖥ḍ㒧⚍ⱘᷥᕫࠄӬ‫ܜ‬DŽ

3.6.1 䲆ᇐ‫څ‬㖤ૂՎ䘿‫څ‬㖤

೼ ID3 ㅫ⊩੠㄀ 2 ゴ䅼䆎ⱘ‫׭‬䗝⍜䰸ㅫ⊩ᰒ⼎ߎⱘᔦ㒇‫أ‬㕂П䯈᳝ϔϾ᳝䍷ⱘϡ


ৠDŽϟ䴶㗗㰥ϔϟ䖭ϸ⾡ᮍ⊩Ёᇍ‫؛‬䆒ぎ䯈᧰㋶ⱘᏂᓖ˖
z ID3 ⱘ᧰㋶㣗ೈᰃϔϾᇂ᮪Ⲻ‫؛‬䆒ぎ䯈˄՟བˈ㛑㸼⼎ӏԩ᳝䰤ⱘ⾏ᬷؐߑ᭄ⱘ
ぎ䯈˅DŽԚᅗуᖱᓋ൦᧰㋶䖭Ͼぎ䯈ˈҢㅔऩⱘ‫؛‬䆒ࠄ໡ᴖⱘ‫؛‬䆒ˈⳈࠄ䘛ࠄ
㒜ℶᴵӊ˄՟བˈᅗথ⦄њϔϾϢ᭄᥂ϔ㟈ⱘ‫؛‬䆒˅DŽᅗⱘᔦ㒇‫أ‬㕂ᅠܼᰃ᧰
㋶ㄪ⬹ᥦᑣ‫؛‬䆒ⱘ㒧ᵰDŽᅗⱘ‫؛‬䆒ぎ䯈≵᳝ᓩܹ乱໪ⱘ‫أ‬㕂DŽ
z বൟぎ䯈‫׭‬䗝⍜䰸ㅫ⊩ⱘ᧰㋶㣗ೈᰃуᇂ᮪Ⲻ‫؛‬䆒ぎ䯈˄ेϔϾҙ㛑㸼⼎┰೼
ৃᬭᥜὖᗉᄤ䲚ⱘぎ䯈˅DŽԚᅗᖱᓋ൦᧰㋶䖭Ͼぎ䯈ˈᶹᡒ᠔᳝Ϣ䆁㒗᭄᥂ϔ
㟈ⱘ‫؛‬䆒DŽᅗⱘᔦ㒇‫أ‬㕂ᅠܼᰃ‫؛‬䆒㸼⼎ⱘ㸼䖒㛑࡯ⱘ㒧ᵰDŽᅗⱘ᧰㋶ㄪ⬹≵
᳝ᓩܹ乱໪ⱘ‫أ‬㕂DŽ

ㅔऩഄ䆆ˈID3 ⱘᔦ㒇‫أ‬㕂ᴹ㞾ᅗⱘᩒ㍘ㆌ⮛ˈ㗠‫׭‬䗝⍜䰸ㅫ⊩ⱘᔦ㒇‫أ‬㕂ᴹ㞾ᅗ
ᇍᩒ㍘グ䰪ⱘᅮНDŽ

ID3 ⱘᔦ㒇‫أ‬㕂ᰃᇍᶤ⾡‫؛‬䆒˄՟བˈᇍѢ䕗ⷁⱘ‫؛‬䆒˅㚰䖛݊Ҫ‫؛‬䆒ⱘϔ⾡Վ䘿
δpreferenceε
ˈᅗᇍ᳔㒜ৃ߫Вⱘ‫؛‬䆒≵᳝⹀ᗻ䰤ࠊȾ䖭⾡㉏ൟⱘ‫أ‬㕂䗮ᐌ㹿⿄ЎՎ䘿
‫څ‬㖤δpreference biasε
˄៪িᩒ㍘‫څ‬㖤δsearch biasε˅DŽⳌডˈ‫׭‬䗝⍜䰸ㅫ⊩ⱘ‫أ‬㕂ᰃᇍ
ᕙ㗗㰥‫؛‬䆒ⱘϔ⾡䲆ᇐ˄restriction˅ DŽ䖭⾡ᔶᓣⱘ‫أ‬㕂䗮ᐌ㹿⿄Ў䲆ᇐ‫څ‬㖤˄៪㗙ি䈣
䀶‫څ‬㖤˄language bias˅ ˅DŽ

བᵰ䳔㽕ᶤ⾡ᔶᓣⱘᔦ㒇‫أ‬㕂ᴹҢ䆁㒗᭄᥂Ё⊯࣪˄㾕㄀ 2 ゴ˅ˈ䙷М៥Ӏ䆹Ӭ‫ܜ‬
㗗㰥ા⾡ᔶᓣⱘᔦ㒇‫أ‬㕂ਸ਼˖ᰃӬ䗝‫أ‬㕂䖬ᰃ䰤ᅮ‫أ‬㕂˛

䗮ᐌˈӬ䗝‫أ‬㕂↨䰤ᅮ‫أ‬㕂᳈ড়Т䳔㽕ˈ಴Ўᅗ‫ܕ‬䆌ᄺд఼Ꮉ԰೼ᅠᭈⱘ‫؛‬䆒ぎ䯈
Ϟˈ䖭ֱ䆕њ᳾ⶹⱘⳂᷛߑ᭄㹿ࣙ৿೼‫ݙ‬DŽⳌডⱘˈ䰤ᅮ‫أ‬㕂ϹḐഄ䰤ࠊњ‫؛‬䆒䲚ড়ⱘ
┰೼ぎ䯈ˈ䗮ᐌϡᰃ៥ӀᏠᳯⱘˈ಴Ўᅗৠᯊᓩܹњᡞ᳾ⶹⱘⳂᷛߑ᭄ᥦ䰸೼໪ⱘৃ㛑
ᗻDŽ

䡈Ѣ ID3 䞛⫼㒃㊍ⱘӬ䗝‫أ‬㕂㗠‫׭‬䗝⍜䰸ㅫ⊩䞛⫼㒃㊍ⱘ䰤ᅮ‫أ‬㕂ˈϔѯᄺд㋏
㒳㓐ড়њ䖭ϸ㗙DŽ՟བˈ㗗㰥㄀ 1 ゴᦣ䗄ⱘϟẟ⿟ᑣⱘ՟ᄤDŽ݊Ёˈᄺдࠄⱘ䆘Ԅߑ᭄
㹿㸼⼎Ўϔѯ೎ᅮⱘẟⲬ⡍ᕕⱘ㒓ᗻ㒘ড়ˈᄺдㅫ⊩䇗ᭈ䖭Ͼ㒓ᗻ㒘ড়ⱘখ᭄ᴹ᳔དഄ
ᢳড়⦄᳝ⱘ䆁㒗᭄᥂DŽ䖭䞠ˈՓ⫼㒓ᗻߑ᭄ᴹ㸼⼎䆘Ԅߑ᭄ⱘ‫އ‬ᅮህᓩܹњ䰤ᅮ‫أ‬㕂˄䴲
㒓ᗻⱘ䆘Ԅߑ᭄ϡৃ㛑㹿㸼⼎៤䖭⾡ᔶᓣ˅DŽৠᯊˈ䗝ᢽ⡍ᅮখ᭄ⱘ䇗ᭈᮍ⊩˄LMS ㅫ
⊩˅ᓩܹњϔϾӬ䗝‫أ‬㕂ˈᅗ⑤㞾᠔᳝ৃ㛑খ᭄ؐぎ䯈Ϟⱘ乎ᑣ᧰㋶DŽ

3.6.2 ѰӶѾՎ‫ٽⲺ⸣ݾ‬䇴ϋ

ID3 ㅫ⊩ЁӬ䗝䕗ⷁ‫އ‬ㄪᷥⱘᔦ㒇‫أ‬㕂ˈᰃϡᰃҢ䆁㒗᭄᥂Ё⊯࣪ⱘৃ䴴෎⸔˛૆
ᄺᆊӀҹঞ݊Ҫᄺ㗙Ꮖ㒣ᇍ䖭ḋⱘ䯂乬ѝ䆎޴ϾϪ㑾њˈ㗠Ϩ䖭Ͼѝ䆎㟇Ҟ䖬᳾㾷‫އ‬DŽ
࿕ᒝg༹ഢྚ໻㑺೼ 1320 ᑈᦤߎ㉏Ԑⱘ䆎⚍ķˈᰃ᳔ᮽ䅼䆎䖭Ͼ䯂乬ⱘҎПϔˈ᠔ҹ䖭
Ͼ‫أ‬㕂㒣ᐌ㹿⿄ЎĀ༹ഢྚࠗߔā˄Occam’s razor˅DŽ

༹ഢྚࠗߔ˖Ӭ‫ܜ‬䗝ᢽᢳড়᭄᥂ⱘ᳔ㅔऩ‫؛‬䆒DŽ

ᔧ✊㒭ߎϔϾᔦ㒇‫أ‬㕂ⱘৡᄫϡㄝѢ䆕ᯢњᅗDŽЎҔМᑨ䆹Ӭ‫ܜ‬䗝ᢽ䕗ㅔऩⱘ‫؛‬䆒
ਸ਼˛䇋⊼ᛣ⾥ᄺᆊӀ᳝ᯊԐТг䙉ᕾ䖭Ͼᔦ㒇‫أ‬㕂DŽ՟བ⠽⧚ᄺᆊӬ‫ܜ‬䗝ᢽ㸠᯳䖤ࡼㅔ
ऩⱘ㾷䞞ˈ㗠ϡ⫼໡ᴖⱘ㾷䞞DŽЎҔМ˛ϔ⾡㾷䞞ᰃⷁ‫؛‬䆒ⱘ᭄䞣ᇥѢ䭓‫؛‬䆒˄෎Ѣㅔ
ऩⱘখ᭄㒘ড়˅ˈ᠔ҹᡒࠄϔϾⷁⱘ‫؛‬䆒ԚৠᯊᅗϢ䆁㒗᭄᥂ᢳড়ⱘৃ㛑ᗻ䕗ᇣDŽⳌডˈ
ᐌᐌ᳝ᕜ໮䴲ᐌ໡ᴖⱘ‫؛‬䆒ᢳড়ᔧࠡⱘ䆁㒗᭄᥂ˈԚै᮴⊩ℷ⹂ഄ⊯࣪ࠄৢᴹⱘ᭄᥂DŽ
՟བ㗗㰥‫އ‬ㄪᷥ‫؛‬䆒DŽ500 Ͼ㒧⚍ⱘ‫އ‬ㄪᷥ↨ 5 Ͼ㒧⚍ⱘ‫އ‬ㄪᷥ໮ᕫ໮DŽབᵰ㒭ᅮϔϾ
20 Ͼ䆁㒗ḋ՟ⱘ䲚ড়ˈৃҹ乘ᳳ㛑໳ᡒࠄᕜ໮ 500 Ͼ㒧⚍ⱘ‫އ‬ㄪᷥϢ䆁㒗᭄᥂ϔ㟈ˈ
㗠བᵰϔϾ 5 㒧⚍ⱘ‫އ‬ㄪᷥৃҹᅠ㕢ഄᢳড়䖭ѯ᭄᥂߭ᰃߎТᛣ໪ⱘDŽ᠔ҹ៥ӀӮⳌֵ
5 Ͼ㒧⚍ⱘᷥϡ໾ৃ㛑ᰃ㒳䅵Ꮋড়ˈ಴㗠Ӭ‫ܜ‬䗝ᢽ䖭Ͼ‫؛‬䆒ˈ㗠ϡ䗝ᢽ 500 Ͼ㒧⚍ⱘDŽ

ḍ᥂᳈⏅ܹⱘߚᵤˈৃҹথ⦄Ϟ䴶ⱘ㾷䞞᳝ϔϾЏ㽕ⱘೄ䲒DŽЎҔМ៥Ӏϡড䯂˖
Փ⫼ৠḋⱘ᥼⧚ˈᑨ䆹Ӭ‫ܜ‬䗝ᢽࣙ৿ᙄད᳝ 17 Ͼ৊ᄤ㒧⚍੠ 11 Ͼ䴲৊ᄤ㒧⚍ⱘ‫އ‬ㄪ
ᷥ˛䖭ỉᷥ೼ḍ㒧⚍Փ⫼‫އ‬ㄪሲᗻA1ˈ✊ৢҹ᭄ᄫ乎ᑣ⌟䆩ሲᗻA2ⳈࠄA11DŽ䖭ḋⱘ‫އ‬
ㄪᷥⳌᔧᇥˈ಴ℸ˄⫼੠Ϟ䴶ৠḋⱘ᥼⧚˅ˈᡒࠄ݊ЁПϔϢӏᛣ᭄᥂䲚ϔ㟈ⱘ‫ܜ‬偠ৃ
㛑ᗻгᕜᇣDŽ䖭䞠ⱘೄ䲒೼ѢৃҹᅮНᕜ໮ᇣⱘ‫؛‬䆒䲚ড়üü݊Ёⱘ໻໮᭄Ⳍᔧ᰺⍽䲒
㾷DŽ䙷Мˈ៥Ӏḍ᥂ҔМⳌֵ᳝ⷁᦣ䗄˄short description˅ⱘ‫އ‬ㄪᷥ㒘៤ⱘᇣ‫؛‬䆒䲚ড়
ህ↨݊Ҫӫ໮ৃᅮНⱘᇣ‫؛‬䆒䲚ড়᳈䗖ᔧਸ਼˛

Ϟ䴶ⱘ༹ഢྚࠗߔॳ߭ⱘ㾷䞞ⱘ㄀ѠϾ䲒乬ᰃˈ‫؛‬䆒ⱘ໻ᇣᰃ⬅ᄺд㗙‫ݙ‬ ‫ݙ‬䚼Փ⫼ⱘ
⡍ᅮ㸼⼎‫އ‬ᅮⱘDŽ᠔ҹϸϾᄺд఼Փ⫼ϡৠⱘ‫ݙ‬䚼㸼⼎Ӯᕫࠄϡৠⱘ‫؛‬䆒ˈϸ㗙জ䛑⫼
༹ഢྚࠗߔॳ߭ᕫࠄⳌѦ⶯Ⳓⱘ㒧䆎ʽ՟བˈབᵰ៥ӀᅮНሲᗻ XYZˈᅗᇍѢ㹿೒ 3-1
ⱘ‫އ‬ㄪᷥߚ㉏Ўℷ՟ⱘᅲ՟ㄝѢⳳˈⳌডЎ‫ˈ؛‬䙷МϔϾᄺд఼ህৃҹᡞ೒ 3-1 Ё‫އ‬ㄪ
ᷥ㸼⼎ⱘߑ᭄㸼⼎Ўা᳝ϔϾ‫އ‬ㄪ㒧⚍ⱘᷥDŽѢᰃˈϸϾᄺд఼བᵰϔϾՓ⫼њ XYZ
ሲᗻᦣ䗄ᅗⱘᅲ՟ˈ㗠঺ϔϾাՓ⫼ OutlookǃTemperatureǃHumidity ੠ Wind ሲᗻˈԚ
䛑ᑨ⫼༹ഢྚࠗߔॳ߭ˈ䙷М㒧ᵰᅗӀӮҹϡৠⱘᮍᓣ⊯࣪DŽ

ҹϞ䇈ᯢˈᇍѢৠϔ༫䆁㒗ḋ՟ˈᔧϸϾᄺд఼ҹϡৠ‫ݙ‬䚼㸼⼎ᮍᓣ⧚㾷੠Փ⫼䖭
ѯḋ՟ᯊˈӮѻ⫳ϸϾϡৠⱘ‫؛‬䆒DŽ෎Ѣ䖭ϔ⚍ˈԐТ៥Ӏᑨᅠܼᢉࠊ༹ഢྚࠗߔॳ߭DŽ
ϡ䖛ˈ䅽៥Ӏⳟϔⳟϟ䴶䖭Ͼഎ᱃ˈᑊߚᵤાϔϾ‫ݙ‬䚼㸼⼎ӮҢ㞾✊䗝ᢽ੠䖯࣪Ё㜅乪
㗠ߎDŽᛇ䈵ϔϾ⬅Ҏ䗴ⱘᄺд agent 㒘៤ⱘ㕸ԧˈ䖭Ͼ㕸ԧᰃ⬅῵ᢳⱘ䖯࣪䖛⿟ѻ⫳ⱘˈ
䖯࣪䖛⿟ࣙᣀ agent ⱘ㐕Ⅺǃবᓖ੠㞾✊䗝ᢽDŽ‫؛‬ᅮ䖭Ͼ䖯࣪䖛⿟㛑໳ϔҷ᥹ϔҷഄᬍ
ব䖭ѯ agent ⱘᛳⶹ㋏㒳ˈ⬅ℸᬍবᅗӀ⫼ᴹᛳⶹϪ⬠ⱘ఼ᅬⱘ‫ݙ‬䚼ሲᗻDŽߎѢ䆎䆕ⱘ
㗗㰥ˈ៥Ӏг‫؛‬ᅮ䖭ѯᄺд agent 䞛⫼ϔϾϡӮ㹿䖯࣪᠔ᬍবⱘ೎ᅮⱘㅫ⊩˄↨བ ID3˅
DŽ
᳝⧚⬅᥼ᮁˈ䱣ⴔᯊ䯈ⱘ⌕䗱ˈ䖯࣪Ӯѻ⫳᳈དⱘ‫ݙ‬䚼㸼⼎ˈՓ agent 㛑ᛜࡴ៤ࡳഄ⫳
ᄬ೼ᅗӀⱘ⦃๗ЁDŽ‫؛‬ᅮ agent ⱘ៤ࡳձ䌪Ѣᅗ㊒⹂⊯࣪ⱘ㛑࡯ˈ᠔ҹ៥Ӏৃҹᳳᳯˈ
䖯࣪ѻ⫳ⱘ‫ݙ‬䚼㸼⼎ᇍӏԩᄺдㅫ⊩੠ᔦ㒇‫أ‬㕂䛑᳝ᕜདⱘᗻ㛑DŽབᵰᶤϾ agent ⾡㕸
䞛⫼њᏺ༹᳝ഢྚࠗߔᔦ㒇‫أ‬㕂ⱘᄺдㅫ⊩ˈ䙷М៥Ӏᳳᳯ䖯࣪Ӯѻ⫳䗖ড়༹ഢྚࠗߔ

ķ
ᰒ✊ᰃ೼ࠂ㚵乏ᯊᛇࠄⱘDŽ
ㄪ⬹ⱘ‫ݙ‬䚼㸼⼎DŽ䖭Ͼ䆎⚍ⱘ㊒傧೼Ѣˈ䖯࣪ѻ⫳ⱘ‫ݙ‬䚼㸼⼎Փᕫᄺдㅫ⊩ⱘᔦ㒇‫أ‬㕂
៤Ў㞾៥ᅲ⦄ⱘ乘㿔˄self-fulfilling prophecy˅ˈা಴Ўᅗᬍব‫ݙ‬䚼㸼⼎↨ᬍবᄺдㅫ⊩
᳈ᆍᯧDŽ

᱖ᯊˈ៥Ӏᬒϟ݇Ѣ༹ഢྚࠗߔⱘѝ䆎DŽ㄀ 6 ゴ៥ӀӮ‫ᦤ⃵ݡ‬䍋䖭Ͼ䆱乬ˈ䙷䞠ᇚ
䅼䆎᳔ᇣᦣ䗄䭓ᑺ˄Minimum Description Length˅ॳ߭ˈᅗᰃ঺ϔ⠜ᴀⱘ༹ഢྚࠗߔˈ
ᅗৃ⫼䋱৊ᮃḚᶊᴹ㾷䞞DŽ

3.7 ߩㆌṇᆜҖⲺᑮ㿷䰤从

‫އ‬ㄪᷥᄺдⱘᅲ䰙䯂乬ࣙᣀ⹂ᅮ‫އ‬ㄪᷥ๲䭓ⱘ⏅ᑺ˗໘⧚䖲㓁ؐⱘሲᗻ˗䗝ᢽϔϾ
䗖ᔧⱘሲᗻㄯ䗝ᑺ䞣ᷛ‫˗ޚ‬໘⧚ሲᗻؐϡᅠᭈⱘ䆁㒗᭄᥂˗໘⧚ϡৠҷӋⱘሲᗻ˗ҹঞ
ᦤ催䅵ㅫᬜ⥛DŽϟ䴶៥Ӏ䅼䆎↣ϔϾ䯂乬ˈᑊ䩜ᇍ䖭ѯ䯂乬ᠽሩ෎ᴀⱘ ID3 ㅫ⊩DŽџ
ᅲϞˈЎњ㾷‫݊އ‬Ё໮᭄ⱘ䯂乬ˈ ID3 ㅫ⊩Ꮖ㒣㹿ᠽሩњˈᠽሩৢⱘ㋏㒳㹿ᬍৡЎ C4.5
˄Quinlan 1993˅DŽ

3.7.1 䚵‫ރ‬䗽ᓜᤕਾδOverfittingεᮦᦤ

㸼 3-1 ᦣ䗄ⱘㅫ⊩๲䭓ᷥⱘ↣ϔϾߚᬃⱘ⏅ᑺˈⳈࠄᙄད㛑ᇍ䆁㒗ḋ՟ᅠ㕢ഄߚ
㉏DŽ✊㗠䖭Ͼㄪ⬹ᑊ䴲ᘏᰃ㸠ᕫ䗮ⱘˈџᅲϞˈᔧ᭄᥂Ё᳝ాໄˈ៪䆁㒗ḋ՟ⱘ᭄䞣໾
ᇥҹ㟇Ѣϡ㛑ѻ⫳Ⳃᷛߑ᭄ⱘ᳝ҷ㸼ᗻⱘ䞛ḋᯊˈ䖭Ͼㄪ⬹֓Ӯ䘛ࠄೄ䲒DŽ೼ҹϞӏϔ
⾡ᚙ‫މ‬থ⫳ᯊˈ䖭Ͼㅔऩⱘㅫ⊩ѻ⫳ⱘᷥӮ䖛ᑺᢳড়䆁㒗ḋ՟DŽ

ᇍѢϔϾ‫؛‬䆒ˈᔧᄬ೼݊Ҫⱘ‫؛‬䆒ᇍ䆁㒗ḋ՟ⱘᢳড়↨ᅗᏂˈԚџᅲϞ೼ᅲ՟ⱘᭈ
ϾߚᏗ˄гህᰃࣙ৿䆁㒗䲚ড়ҹ໪ⱘᅲ՟˅Ϟ㸼⦄ⱘै᳈དᯊˈ៥Ӏ䇈䖭Ͼ‫؛‬䆒䖛ᑺᢳ
ড়˄overfit˅䆁㒗ḋ՟DŽ

定义: 㒭ᅮϔϾ‫؛‬䆒ぎ䯈 HˈϔϾ‫؛‬䆒 hHˈབᵰᄬ೼݊Ҫⱘ‫؛‬䆒 h´HˈՓ


ᕫ೼䆁㒗ḋ՟Ϟ h ⱘ䫭䇃⥛↨ h´ᇣˈԚ೼ᭈϾᅲ՟ߚᏗϞ h´ⱘ䫭䇃⥛↨ h ᇣˈ䙷М
ህ䇈‫؛‬䆒 h 䖛ᑺᢳড়˄overfit˅䆁㒗᭄᥂DŽ

೒ 3-6 ⬏ߎњ೼‫އ‬ㄪᷥᄺдⱘϔϾ‫݌‬ൟᑨ⫼Ё䖛ᑺᢳড়ⱘᕅડDŽ೼䖭Ͼ՟ᄤЁˈID3
ㅫ⊩⫼ᴹᄺдાϔϾ⮙Ҏᙷ᳝ᶤ⾡㊪ሓ⮙DŽ䖭ᐙ೒ⱘ῾䕈㸼⼎೼‫އ‬ㄪᷥ߯ᓎ䖛⿟Ёᷥⱘ
㒧⚍ᘏ᭄ˈ㒉䕈㸼⼎‫އ‬ㄪᷥ԰ߎⱘ乘⌟ⱘ㊒ᑺDŽᅲ㒓ᰒ⼎‫އ‬ㄪᷥ೼䆁㒗ḋ՟Ϟⱘ㊒ᑺˈ
㰮㒓ᰒ⼎೼ϔ༫⣀ゟⱘ⌟䆩ḋ՟˄≵᳝㹿ࣙᣀ೼䆁㒗ḋ՟Ё˅Ϟ⌟䞣ߎⱘ㊒ᑺDŽৃҹⳟ
ߎˈ䱣ⴔᷥⱘ๲䭓ˈ೼䆁㒗ḋ՟Ϟⱘ㊒ᑺᰃऩ䇗ϞछⱘDŽ✊㗠ˈ೼⣀ゟⱘ⌟䆩ḋ՟Ϟ⌟
ߎⱘ㊒ᑺ‫ܜ‬Ϟछৢϟ䰡DŽབ೒᠔⼎ˈᔧᷥ䍙䖛໻㑺 25 Ͼ㒧⚍ᯊˈᇍᷥ䖯ϔℹ㊒㒚࣪ሑ
ㅵৃҹᦤ催ᅗ೼䆁㒗᭄᥂Ϟⱘ㊒ᑺˈै䰡Ԣњᅗ೼⌟䆩ḋ՟Ϟⱘ㊒ᑺDŽ

插图——原书页码:67

Accuracy – ㊒ᑺ

Size of tree(number of nodes) – ᷥⱘ㾘῵˄㒧⚍᭄˅

On training data –೼䆁㒗᭄᥂Ϟ


On test data – ೼⌟䆩᭄᥂Ϟ

೒ 3-6 ‫އ‬ㄪᷥᄺдЁⱘ䖛ᑺᢳড়DŽ

䱣ⴔ ID3 ㅫ⊩๲ࡴᮄⱘ㒧⚍๲䭓‫އ‬ㄪᷥˈ೼䆁㒗ḋ՟Ϟⱘ㊒ᑺᰃऩ䇗ϞछⱘDŽ✊㗠ˈ೼⣀ゟѢ䆁㒗ḋ
՟ⱘ⌟䆩ḋ՟Ϟˈ㊒ᑺ‫ܜ‬Ϟछˈ✊ৢϟ䰡DŽᅲ偠䖭Ͼ೒᠔䳔ⱘ䕃ӊ੠᭄᥂ৃҹ䗮䖛㔥ഔ
http://www.cs.cmu.edu/~tom/mlbook.html ᕫࠄDŽ

ᰃҔМॳ಴ᇐ㟈 h ↨ hc᳈དഄᢳড়䆁㒗ḋ՟ˈԚᇍѢৢᴹⱘᅲ՟ै㸼⦄᳈Ꮒਸ਼˛䖭
⾡ᚙ‫މ‬থ⫳ⱘϔ⾡ৃ㛑ॳ಴ᰃ䆁㒗ḋ՟৿᳝䱣ᴎ䫭䇃៪ాໄDŽВ՟䇈ᯢˈ㗗㰥೼㸼 3-2
ⱘᴀᴹℷ⹂ⱘḋ՟Ёࡴܹϔᴵ䆁㒗ℷ՟ˈԚै㹿䇃ᷛ⼎Ўড՟ˈབϟ˖

<Outlook=SunnyˈTemperature=HotˈHumidity=NormalˈWind=StrongˈPlayTennis=No>

ᇍѢᴀᴹ≵᳝䫭䇃ⱘ᭄᥂ˈID3 ⫳៤೒ 3-1 㸼⼎ⱘ‫އ‬ㄪᷥDŽ✊㗠ˈ๲ࡴ䖭Ͼϡℷ⹂


ⱘḋ՟ᇐ㟈 ID3 ᓎゟϔϾ᳈໡ᴖⱘᷥDŽ⹂ߛഄ䆆ˈᮄⱘḋ՟Ӯ㹿ᥦ߫ࠄ೒ 3-1 㸼⼎ⱘᷥ
ⱘᎺ䍋㄀ѠϾ৊ᄤ㒧⚍ˈϢҹࠡⱘℷ՟ D9 ੠ D11 ᥦ೼ϔ䍋DŽ಴Ўᮄⱘḋ՟㹿ᷛ䆄Ўড
՟ˈ᠔ҹ ID3 Ӯ೼䖭Ͼ㒧⚍ϟ䴶䖯ϔℹ᧰㋶᳈໮ⱘ㒚㡖DŽᔧ✊া㽕ᮄⱘ䫭䇃ḋ՟Ϣॳ
ᴹ䖭Ͼ㒧⚍ⱘϸϾḋ՟᳝ӏԩᏂᓖˈID3 Ӯ៤ࡳᡒࠄϔϾᮄⱘ‫އ‬ㄪሲᗻᴹᡞᮄⱘḋ՟Ң
ҹࠡⱘϸϾℷ՟ЁߚᓔDŽ䖭ḋⱘ㒧ᵰᰃ ID3 Ӯ䕧ߎϔϾ‫އ‬ㄪᷥ(h)ˈᅗ↨೒ 3-1 Ёॳᴹ
ⱘᷥ˄h嘔˅᳈໡ᴖDŽᔧ✊ˈh Ӯᅠ㕢ഄᢳড়䆁㒗ḋ՟䲚ˈ㗠䕗ㅔऩⱘ h嘔ϡӮDŽ✊㗠ˈ⬅
Ѣᮄⱘ‫އ‬ㄪ㒧⚍াᰃᢳড়䆁㒗ḋ՟Ёాໄⱘ㒧ᵰˈ៥Ӏৃҹᮁᅮ೼প㞾ৠϔᅲ՟ߚᏗⱘ
ৢ㓁᭄᥂Ϟˈh嘔Ӯ㚰䖛 hDŽ

Ϟ䴶ⱘ՟ᄤⓨ⼎њ䆁㒗ḋ՟Ёⱘ䱣ᴎాໄབԩᇐ㟈䖛ᑺᢳড়DŽџᅲϞˈᔧ䆁㒗᭄᥂
≵᳝ాໄᯊˈ䖛ᑺᢳড়г᳝ৃ㛑থ⫳ˈ⡍߿ᰃᔧᇥ䞣ⱘḋ՟㹿݇㘨ࠄ৊ᄤ㒧⚍ᯊDŽ䖭⾡
ᚙ‫މ‬ϟˈᕜৃ㛑ߎ⦄Ꮋড়ⱘ㾘ᕟᗻˈՓᕫϔѯሲᗻᙄᎻৃҹᕜདഄߚࡆḋ՟ˈԚैϢᅲ
䰙ⱘⳂᷛߑ᭄ᑊ᮴݇㋏DŽϔᮺ䖭ḋⱘᎻড়ⱘ㾘ᕟᗻᄬ೼ˈህ᳝䖛ᑺᢳড়ⱘ亢䰽DŽ

䖛ᑺᢳড়ᇍѢ‫އ‬ㄪᷥᄺд੠݊Ҫᕜ໮ᄺдㅫ⊩ᰃϔϾ䞡㽕ⱘᅲ䏉ೄ䲒DŽ՟བˈ೼ϔ
⃵݇Ѣ ID3 ㅫ⊩ⱘᅲ偠ⷨおЁ˄Mingers 1989b˅
ˈᇍѢ 5 ⾡ᏺ᳝ాໄ੠ϡ⹂ᅮ᭄᥂ⱘϡ
ৠᄺдӏࡵˈҎӀথ⦄೼໮᭄䯂乬Ё䖛ᑺᢳড়Փ‫އ‬ㄪᷥⱘ㊒ᑺ䰡Ԣњ 10-25%DŽ

᳝޴⾡䗨ᕘ⫼ᴹ䙓‫އܡ‬ㄪᷥᄺдЁⱘ䖛ᑺᢳড়DŽᅗӀৃ㹿ߚЎϸ㉏˖
z ঞᮽ‫ذ‬ℶ๲䭓ᷥ⊩ˈ೼ ID3 ㅫ⊩ᅠ㕢ߚ㉏䆁㒗᭄᥂Пࠡ‫ذ‬ℶ๲䭓ᷥ˗
z ৢׂ࠾⊩˄post-prune˅ˈे‫ܕ‬䆌ᷥ䖛ᑺᢳড়᭄᥂ˈ✊ৢᇍ䖭Ͼᷥৢׂ࠾DŽ

ሑㅵ㄀ϔ⾡ᮍ⊩ৃ㛑ⳟ䍋ᴹ᳈Ⳉ᥹ˈԚᰃᇍ䖛ᑺᢳড়ⱘᷥ䖯㸠ৢׂ࠾ⱘ㄀Ѡ⾡ᮍ⊩
㹿䆕ᯢ೼ᅲ䏉Ё᳈៤ࡳDŽ䖭ᰃ಴Ў೼㄀ϔ⾡ᮍ⊩Ё㊒⹂ഄԄ䅵ԩᯊ‫ذ‬ℶ๲䭓ᷥᕜೄ䲒DŽ

᮴䆎ᰃ䗮䖛ঞᮽ‫ذ‬ℶ䖬ᰃৢׂ࠾ᴹᕫࠄℷ⹂໻ᇣⱘᷥˈϔϾ݇䬂ⱘ䯂乬ᰃՓ⫼ҔМ
ḋⱘ‫߭ޚ‬ᴹ⹂ᅮ᳔㒜ℷ⹂ᷥⱘ໻ᇣDŽ㾷‫އ‬䖭Ͼ䯂乬ⱘᮍ⊩ࣙᣀ˖
z Փ⫼Ϣ䆁㒗ḋ՟៾✊ϡৠⱘϔ༫ߚ⾏ⱘḋ՟ˈᴹ䆘Ԅ䗮䖛ৢׂ࠾ᮍ⊩ҢᷥϞׂ
࠾㒧⚍ⱘᬜ⫼DŽ
z Փ⫼᠔᳝ৃ⫼᭄᥂䖯㸠䆁㒗ˈԚ䖯㸠㒳䅵⌟䆩ᴹԄ䅵ᠽሩ˄៪ׂ࠾˅ϔϾ⡍ᅮ
ⱘ㒧⚍ᰃ৺᳝ৃ㛑ᬍ୘೼䆁㒗䲚ড়໪ⱘᅲ՟Ϟⱘᗻ㛑DŽ՟བˈQuinlan ˄1986˅
Փ⫼ϔ⾡वᮍ˄chi-square˅⌟䆩ᴹԄ䅵䖯ϔℹᠽሩ㒧⚍ᰃ৺㛑ᬍ୘೼ᭈϾᅲ՟
ߚᏗϞⱘᗻ㛑ˈ䖬ᰃҙҙᬍ୘њ೼ᔧࠡⱘ䆁㒗᭄᥂Ϟⱘᗻ㛑DŽ
z Փ⫼ϔϾᯢ⹂ⱘᷛ‫ޚ‬ᴹ㸵䞣䆁㒗ḋ՟੠‫އ‬ㄪᷥ㓪ⷕⱘ໡ᴖᑺˈᔧ䖭Ͼ㓪ⷕⱘ䭓
ᑺ᳔ᇣᯊ‫ذ‬ℶ๲䭓ᷥDŽ䖭Ͼᮍ⊩෎Ѣϔ⾡ਃথᓣ㾘߭ˈ㹿⿄Ў᳔ᇣᦣ䗄䭓ᑺ
˄Minimum Description Length˅ⱘ‫ˈ߭ޚ‬៥Ӏᇚ೼㄀ 6 ゴЁ䅼䆎䖭⾡ᮍ⊩DŽ
Quinlan & Rivest˄1989˅੠ Mehta et al.˄1995˅г䅼䆎њ䖭⾡ᮍ⊩DŽ

Ϟ䴶ⱘ㄀ϔ⾡ᮍ⊩ᰃ᳔᱂䗮ⱘˈᅗᐌ㹿⿄Ў䇣㓹ૂ僂䇷䳼˄training and validation


set˅⊩DŽϟ䴶៥Ӏ䅼䆎䖭⾡ᮍ⊩ⱘϸϾЏ㽕ব⾡DŽ䖭⾡ᮍ⊩Ёˈৃ⫼ⱘ᭄᥂㹿ߚ៤ϸ
Ͼḋ՟䲚ড়˖ϔϾ䆁㒗䲚ড়⫼ᴹᔶ៤ᄺдࠄⱘ‫؛‬䆒ˈϔϾߚ⾏ⱘ偠䆕䲚ড়⫼ᴹ䆘Ԅ䖭Ͼ
‫؛‬䆒೼ৢ㓁᭄᥂Ϟⱘ㊒ᑺˈ⹂ߛഄ䇈ᰃ⫼ᴹ䆘Ԅׂ࠾䖭Ͼ‫؛‬䆒ⱘᕅડDŽ䖭Ͼᮍ⊩ⱘࡼᴎ
ᰃ˖ेՓᄺд఼ৃ㛑Ӯ㹿䆁㒗䲚ড়Ёⱘ䱣ᴎ䫭䇃੠Ꮋড়㾘ᕟᗻ᠔䇃ᇐˈԚ偠䆕䲚ড়ϡ໻
ৃ㛑㸼⦄ߎৠḋⱘ䱣ᴎ⊶ࡼDŽ᠔ҹˈ偠䆕䲚ড়ৃҹ⫼ᴹᇍ䖛ᑺᢳড়䆁㒗䲚Ёⱘ㰮‫؛‬⡍ᕕ
ᦤկϔϾ䰆ᡸẔ偠DŽᔧ✊ˈᕜ䞡㽕ⱘϔ⚍ˈ偠䆕䲚ড়ᑨ䆹䎇໳໻ˈҹ֓ᅗᴀ䑿ৃᦤկ‫݋‬
᳝㒳䅵ᛣНⱘᅲ՟ḋᴀDŽϔ⾡ᐌ㾕ⱘ‫⊩خ‬ᰃপߎৃ⫼ḋ՟ⱘϝߚПϔ⫼԰偠䆕䲚ড়ˈՓ
⫼঺໪ϝߚПѠ⫼԰䆁㒗䲚ড়DŽ

3.7.1.1 䭏䈥⦽䲃ք‫ࢠؤ‬

Փ⫼偠䆕䲚ড়ᴹ䰆ℶ䖛ᑺᢳড়ⱘ⹂ߛᮍ⊩ᰃҔМ˛ϔ⾡⿄ЎĀ䫭䇃⥛䰡Ԣׂ࠾
˄error-reduced pruning˅āⱘᮍ⊩˄Quinlan 1987˅ᰃ㗗㰥ᇚᷥϞⱘ↣ϔϾ㒧⚍԰Ўׂ࠾
ⱘ‫׭‬䗝ᇍ䈵DŽׂ࠾ϔϾ㒧⚍⬅ҹϟℹ偸㒘៤˖ߴ䰸ҹℸ㒧⚍Ўḍⱘᄤᷥ˗Փᅗ៤Ў৊ᄤ
㒧⚍˗ᡞ੠䆹㒧⚍݇㘨ⱘ䆁㒗ḋ՟ⱘ᳔ᐌ㾕ߚ㉏䌟㒭ᅗDŽҙᔧׂ࠾ৢⱘᷥᇍѢ偠䆕䲚ড়
ⱘᗻ㛑ϡᏂѢॳᴹⱘᷥᯊᠡߴ䰸䆹㒧⚍DŽ䖭ḋ֓Փ಴Ў䆁㒗䲚ড়ⱘᎻড়㾘ᕟᗻ㗠ࡴܹⱘ
㒧⚍ᕜৃ㛑㹿ߴ䰸ˈ಴ЎৠḋⱘᎻড়ϡ໻Ӯথ⫳೼偠䆕䲚ড়ЁDŽড໡ഄׂ࠾㒧⚍ˈ↣⃵
ᘏᰃ䗝পᅗⱘߴ䰸ৃҹ᳔໻ᦤ催‫އ‬ㄪᷥ೼偠䆕䲚ড়Ϟⱘ㊒ᑺⱘ㒧⚍DŽ㒻㓁ׂ࠾㒧⚍Ⳉࠄ
䖯ϔℹⱘׂ࠾ᰃ᳝ᆇⱘ˄гህᰃ䰡Ԣњ೼偠䆕䲚ড়Ϟⱘ㊒ᑺ˅DŽ

Ā䫭䇃⥛䰡Ԣׂ࠾āᇍ‫އ‬ㄪᷥ㊒ᑺⱘᕅડ㹿⬏೼೒ 3-7 ЁDŽ੠೒ 3-6 ϔḋˈ೒ 3-7


ᰒ⼎њ೼䆁㒗ḋ՟੠⌟䆩ḋ՟Ϟⱘ‫އ‬ㄪᷥ㊒ᑺDŽ೒ 3-7 Ё঺໪ϔᴵ㒓ᰒ⼎ⱘᰃ䱣ⴔᷥⱘ
ׂ࠾ˈᅗ೼⌟䆩ḋ՟Ϟⱘ㊒ᑺব࣪DŽᔧׂ࠾ᓔྟᯊˈᷥⱘ㾘῵᳔໻ˈᑊϨᅗ೼⌟䆩ḋ՟
Ϟⱘ㊒ᑺ᳔ᇣDŽ䱣ⴔׂ࠾ⱘ䖯㸠ˈ㒧⚍ⱘ᭄䞣ϟ䰡ˈԚ೼⌟䆩䲚ড়Ϟⱘ㊒ᑺϞछDŽ䖭䞠ˈ
ৃկՓ⫼ⱘ᭄᥂Ꮖ㒣㹿ߚ៤ 3 Ͼᄤ䲚˖䆁㒗ḋ՟ǃկׂ࠾ᷥ⫼ⱘ偠䆕ḋ՟੠ϔϾ⌟䆩ḋ
՟䲚ড়DŽ⌟䆩ḋ՟⫼ᴹᦤկ೼᳾ᴹⱘ᳾㾕ᅲ՟Ϟⱘ㊒ᑺⱘ᮴‫أ‬Ԅ䅵DŽ೒Ёᰒ⼎њ೼䆁㒗
䲚੠⌟䆩䲚Ϟⱘ㊒ᑺDŽ೼⫼԰ׂ࠾ⱘ偠䆕䲚ড়Ϟⱘ㊒ᑺ≵᳝⬏ߎᴹDŽ

བᵰ᳝໻䞣ⱘ᭄᥂ৃկՓ⫼ˈ䙷МՓ⫼ߚ⾏ⱘ᭄᥂䲚ড়ᴹᓩᇐׂ࠾ᰃϔϾ᳝ᬜⱘᮍ
⊩DŽ䖭Ͼᮍ⊩ⱘЏ㽕㔎⚍ᰃᔧ᭄᥂᳝䰤ᯊˈҢЁֱ⬭ϔ䚼ߚ⫼԰偠䆕䲚ড়䖯ϔℹ‫ޣ‬ᇥњ
䆁㒗ৃҹՓ⫼ⱘḋ՟DŽϟϔ㡖㒭ߎњ঺ϔ⾡ׂ࠾ᮍ⊩ˈ೼᭄᥂᳝䰤ⱘ䆌໮ᅲ䰙ᚙᔶϟˈ
䖭⾡ᮍ⊩ᕜ᳝ᬜDŽҎӀ䖬ᦤߎњ䆌໮݊ҪⱘᡔᴃDŽ՟བˈҹϡৠⱘᮍᓣ໮⃵ߚࡆৃկՓ
⫼ⱘ᭄᥂ˈ✊ৢᑇഛᕫࠄⱘ㒧ᵰDŽMingers˄1989b˅੠ Malerba et al.˄1995˅Ё᡹ਞњ
ᇍϡৠׂᷥ࠾ᮍ⊩ⱘ㒣偠䆘ԄDŽ

插图——原书页码:Page 70
Accuracy – ㊒ᑺ

Size of tree (number of nodes)- ᷥⱘ㾘῵˄㒧⚍᭄䞣˅

On training data-೼䆁㒗᭄᥂Ϟ

On test data-೼⌟䆩᭄᥂Ϟ

On test data(During pruning)- ೼⌟䆩᭄᥂Ϟ˄ׂ࠾ᳳ䯈˅

೒ 3-7 ‫އ‬ㄪᷥᄺдЁ䫭䇃⥛䰡Ԣׂ࠾ⱘᬜᵰ

䖭ᐙ೒ᰒ⼎њϢ೒ 3-6 ৠḋⱘ೼䆁㒗䲚੠⌟䆩䲚Ϟⱘ㊒ᑺ᳆㒓DŽ঺໪ˈᅗᰒ⼎њĀ䫭䇃⥛䰡Ԣׂ࠾ā


ᇍ ID3 ㅫ⊩ѻ⫳ⱘᷥⱘᕅડDŽ⊼ᛣ䱣ⴔᷥ㒧⚍ⱘ࠾䰸ˈ‫އ‬ㄪᷥ೼⌟䆩䲚ড়Ϟⱘ㊒ᑺϞछDŽ䖭䞠ˈկׂ
࠾⫼ⱘ偠䆕䲚ড়Ϣ䆁㒗੠⌟䆩䲚ড়䛑ᰃᅠܼϡৠⱘDŽ

3.7.1.2 㿺ࡏ੄‫ࢠؤ‬

ᅲ䏉Ёˈϔ⾡⫼ᴹথ⦄催㊒ᑺ‫؛‬䆒ⱘ䴲ᐌ៤ࡳⱘᮍ⊩ЎĀ㾘߭ৢׂ࠾˄rule
āDŽ䖭⾡ׂ࠾ᮍ⊩ⱘϔϾবԧ㹿⫼೼ C4.5 Ё˄Quinlan 1993˅ˈC4.5 ᰃҢॳ
post-pruning˅
ྟⱘ ID3 ㅫ⊩ⱘ⌒⫳ߎᴹⱘDŽ㾘߭ৢׂ࠾ࣙᣀϟ䴶ⱘℹ偸˖
1. Ң䆁㒗䲚ড়᥼ᇐߎ‫އ‬ㄪᷥˈ๲䭓‫އ‬ㄪᷥⳈࠄሑৃ㛑དഄᢳড়䆁㒗᭄᥂ˈ‫ܕ‬䆌䖛ᑺᢳ
ড়থ⫳DŽ
2. ᇚ‫އ‬ㄪᷥ䕀࣪ЎㄝӋⱘ㾘߭䲚ড়ˈᮍ⊩ᰃЎҢḍ㒧⚍ࠄ৊ᄤ㒧⚍ⱘ↣ϔᴵ䏃ᕘ߯ᓎ
ϔᴵ㾘߭DŽ
3. 䗮䖛ߴ䰸ӏԩ㛑ᇐ㟈Ԅ䅵㊒ᑺᦤ催ⱘࠡӊ˄preconditions˅ᴹׂ࠾˄⊯࣪˅↣ϔᴵ㾘
߭DŽ
4. ᣝ✻ׂ࠾䖛ⱘ㾘߭ⱘԄ䅵㊒ᑺᇍᅗӀ䖯㸠ᥦᑣ˗ᑊᣝ䖭ḋⱘ乎ᑣᑨ⫼䖭ѯ㾘߭ᴹߚ
㉏ৢᴹⱘᅲ՟DŽ

Ўњⓨ⼎ҹϞ䖛⿟ˈ‫⃵ݡ‬㗗㰥೒ 3-1 Ёⱘ‫އ‬ㄪᷥDŽ೼Ā㾘߭ৢׂ࠾āㅫ⊩ЁˈЎᷥЁⱘ


↣Ͼ৊ᄤ㒧⚍ѻ⫳ϔᴵ㾘߭DŽҢḍ㒧⚍ࠄ৊ᄤ㒧⚍䏃ᕘϞⱘ↣ϔϾሲᗻ⌟䆩៤ЎϔϾ㾘߭‫ܜ‬
㸠䆡˄ेࠡӊ˅ˈ৊ᄤ㒧⚍ⱘߚ㉏⿄Ў㾘߭ⱘ㒧䆎˄ेৢӊ˅ DŽ՟བˈ೒ 3-1 Ёᷥⱘ᳔Ꮊϔᴵ䏃
ᕘ㹿䕀ᤶ៤㾘߭˖

IF ˄Outlook=Sunny˅˄Humidity=High˅

THEN PlayTennis=No

᥹ϟᴹˈ䗮䖛ߴ䰸ϡӮ䰡ԢԄ䅵㊒ᑺⱘ‫ܜ‬㸠䆡ᴹׂ࠾↣ϔϾ㾘߭DŽ՟བᇍѢϞ䴶ⱘ
㾘߭ˈ㾘߭ৢׂ࠾ㅫ⊩Ӯ㗗㰥ߴ䰸‫ܜ‬㸠䆡˄Outlook=Sunny˅੠˄Humidity=High˅DŽᅗӮ
䗝ᢽ䖭ѯׂ࠾ℹ偸ЁՓԄ䅵㊒ᑺ᳔᳝໻ᦤछⱘℹ偸ˈ✊ৢ㗗㰥ׂ࠾㄀ѠϾࠡӊ԰Ў䖯ϔ
ℹⱘׂ࠾ℹ偸DŽབᵰᶤϾׂ࠾ℹ偸䰡ԢњԄ䅵㊒ᑺˈ䙷М䖭Ͼℹ偸ϡӮ㹿ᠻ㸠DŽ

བৠࠡ䴶ᦤߎⱘˈԄ䅵㾘߭㊒ᑺⱘϔ⾡ᮍ⊩ᰃՓ⫼Ϣ䆁㒗䲚੠ϡⳌѸⱘ偠䆕䲚ড়DŽ
঺ϔ⾡㹿 C4.5 Փ⫼ⱘᮍ⊩ᰃ෎Ѣ䆁㒗䲚ড়ᴀ䑿䆘Ԅᗻ㛑ˈԚՓ⫼ϔ⾡ֱᅜԄ䅵
˄pessimistic estimate˅ᴹᓹ㸹䆁㒗᭄᥂᳝߽Ѣᔧࠡ㾘߭ⱘԄ䅵‫أ‬㕂DŽ᳈‫⹂ޚ‬ഄ䆆ˈC4.5
䗮䖛ҹϟᮍ⊩䅵ㅫֱᅜԄ䅵ˈ‫ܜ‬䅵ㅫ㾘߭೼ᅗᑨ⫼ⱘ䆁㒗ḋ՟Ϟⱘ㊒ᑺˈ✊ৢ‫؛‬ᅮℸԄ
䅵㊒ᑺЎѠ乍ߚᏗˈᑊ䅵ㅫᅗⱘᷛ‫ޚ‬Ꮒ˄standard deviation˅DŽᇍѢϔϾ㒭ᅮⱘ㕂ֵऎ䯈ˈ
䞛⫼ϟ⬠Ԅ䅵԰Ў㾘߭ᗻ㛑ⱘᑺ䞣˄՟བˈᇍѢϔϾ 95%ⱘ㕂ֵऎ䯈ˈ㾘߭㊒ᑺ㹿ֱ
ᅜԄ䅵Ў˖೼䆁㒗䲚ড়Ϟⱘ㾖ᆳ㊒ᑺ‫ޣ‬এ 1.96 ЬԄ䅵ⱘᷛ‫ޚ‬Ꮒ˅DŽ䖭ḋ‫ⱘخ‬ᬜᵰᰃˈᇍ
Ѣ໻ⱘ᭄᥂䲚ˈֱᅜ乘⌟䴲ᐌ᥹䖥㾖ᆳ㊒ᑺ˄гህᰃᷛ‫ޚ‬Ꮒ䴲ᐌᇣ˅ˈ✊㗠䱣ⴔ᭄᥂䲚
ড়ⱘ‫ޣ‬ᇣˈᅗᓔྟ⾏㾖ᆳ㊒ᑺ䍞ᴹ䍞䖰DŽ㱑✊䖭⾡ਃথᓣᮍ⊩ϡᰃ㒳䅵᳝ᬜ˄statistically
valid˅ⱘˈԚᰃᏆ㒣থ⦄ᅗ೼ᅲ䏉Ёᰃ᳝⫼ⱘDŽ㄀ 5 ゴ䅼䆎њ㒳䅵᳝ᬜⱘ乘⌟ഛؐ੠㕂
ֵऎ䯈ⱘᮍ⊩DŽ

ЎҔМׂ࠾Пࠡ㽕ᡞ‫އ‬ㄪᷥ䕀࣪៤㾘߭䲚ਸ਼˛䖭ḋ‫خ‬Џ㽕᳝ϝϾད໘˖
z 䕀࣪Ў㾘߭䲚ৃҹऎߚ‫އ‬ㄪ㒧⚍Փ⫼ⱘϡৠϞϟ᭛DŽ಴Ў䌃こ‫އ‬ㄪ㒧⚍ⱘ↣ᴵ
ϡৠ䏃ᕘѻ⫳ϔᴵϡৠⱘ㾘߭ˈ᠔ҹᇍѢϡৠ䏃ᕘˈ݇ѢϔϾሲᗻ⌟䆩ⱘׂ࠾
‫އ‬ㄪৃҹϡৠDŽⳌডˈབᵰⳈ᥹ׂ࠾ᷥᴀ䑿ˈা᳝ϸϾ䗝ᢽˈ㽕Мᅠܼߴ䰸‫އ‬
ㄪ㒧⚍ˈ㽕Мֱ⬭ᅗⱘᴀᴹ⢊ᗕDŽ
z 䕀࣪Ў㾘߭䲚⍜䰸њḍ㒧⚍䰘䖥ⱘሲᗻ⌟䆩੠৊㒧⚍䰘䖥ⱘሲᗻ⌟䆩ⱘऎ߿DŽ
Ѣᰃ䙓‫ܡ‬њ䳊хⱘ䆄ᔩ䯂乬ˈ↨བ㢹ᰃḍ㒧⚍㹿ׂ࠾њԚֱ⬭ᅗϟ䴶ⱘ䚼ߚᄤ
ᷥᯊབԩ䞡ᮄ㒘㒛䖭ỉᷥDŽ
z 䕀࣪Ў㾘߭ᦤ催њৃ䇏ᗻDŽᇍѢҎᴹ䇈㾘߭ᘏᰃ᳈ᆍᯧ⧚㾷ⱘDŽ

3.7.2 ਾᒬ䘔㔣‫ٲ‬ኔᙝ

៥Ӏ᳔߱ⱘID3 ᅮН䰤ࠊЎপ⾏ᬷؐⱘሲᗻDŽ佪‫ˈܜ‬ᄺдࠄⱘ‫އ‬ㄪᷥ㽕乘⌟ⱘⳂᷛ
ሲᗻᖙ乏ᰃ⾏ᬷⱘDŽ݊⃵ˈᷥⱘ‫އ‬ㄪ㒧⚍ⱘሲᗻгᖙ乏ᰃ⾏ᬷⱘDŽৃҹㅔऩഄߴ䰸㄀Ѡ
Ͼ䰤ࠊˈҹ֓ᡞ䖲㓁ؐⱘ‫އ‬ㄪሲᗻࡴܹࠄ‫އ‬ㄪᷥЁDŽ䖭ৃҹ䗮䖛ࡼᗕഄᅮНᮄⱘ⾏ᬷؐ
ሲᗻᴹᅲ⦄ˈे‫ܜ‬ᡞ䖲㓁ؐሲᗻⱘؐඳߚࡆЎ⾏ᬷⱘऎ䯈䲚ড়DŽ՟བˈᇍѢ䖲㓁ؐⱘሲ
ᗻAˈㅫ⊩ৃࡼᗕഄ߯ᓎϔϾᮄⱘᏗᇨሲᗻAcˈབᵰA<cˈ䙷МЎAcⳳˈ৺߭Ў‫؛‬DŽଃ
ϔⱘ䯂乬ᰃབԩ䗝প᳔Շⱘ䯜ؐcDŽ

В՟ᴹ䇈ˈ‫؛‬ᅮ៥ӀᏠᳯ೼㸼 3-2 ⱘᄺдӏࡵЁࣙ৿䖲㓁ؐⱘሲᗻ Temperature ᴹ


ᦣ䗄䆁㒗ḋ՟DŽᇍѢϢ‫އ‬ㄪᷥⱘ⡍ᅮ㒧⚍݇㘨ⱘ䆁㒗ḋ՟ˈ䖯ϔℹ‫؛‬ᅮ݊ሲᗻ
Temperature ੠Ⳃᷛሲᗻ PlayTennis ⱘؐབϟ˖

Temperature: 40 48 60 72 80 90
PlayTennis: No No Yes Yes Yes No

ᇍሲᗻTempratureˈᑨ䆹ᅮНҔМḋⱘ෎Ѣ䯜ؐⱘᏗᇨሲᗻਸ਼˛᮴⭥ˈ៥ӀӮ䗝ᢽ
ѻ⫳᳔໻ֵᙃ๲Ⲟⱘ䯜ؐcDŽ佪‫ܜ‬ᣝ✻䖲㓁ሲᗻAᥦᑣḋ՟ˈ✊ৢ⹂ᅮⳂᷛߚ㉏ϡৠⱘ
Ⳍ䚏ᅲ՟ˈѢᰃ៥Ӏৃҹѻ⫳ϔ㒘‫׭‬䗝䯜ؐˈᅗӀⱘؐᰃⳌᑨⱘAؐП䯈ⱘЁ䯈ؐDŽৃ
ҹ䆕ᯢѻ⫳᳔໻ֵᙃ๲ⲞⱘcؐᖙᅮԡѢ䖭ḋⱘ䖍⬠Ё˄Fayyad 1991˅DŽ✊ৢৃҹ䗮䖛
䅵ㅫϢ↣Ͼ‫׭‬䗝䯜ؐ݇㘨ⱘֵᙃ๲Ⲟ䆘Ԅ䖭ѯ‫׭‬䗝ؐDŽ೼ᔧࠡⱘ՟ᄤЁˈ᳝ϸϾ‫׭‬䗝䯜
ؐˈᅗӀᇍᑨѢⳂᷛሲᗻPlayTennisব࣪ᯊሲᗻTemperatureⱘؐ˖ ˄48+60˅/2 ੠˄80+90˅
/2DŽ✊ৢ䅵ㅫ↣ϔϾ‫׭‬䗝ሲᗻüüTemperature>54 ੠Temperature>85ⱘֵᙃ๲Ⲟˈᑊ䗝ᢽ
᳔དⱘ˄Temperature>54˅DŽ⦄೼䖭Ͼࡼᗕ߯ᓎⱘᏗᇨሲᗻ֓ৃҹ੠݊Ҫ‫׭‬䗝ⱘ⾏ᬷؐሲ
ᗻϔৠĀゲѝāˈҹ⫼Ѣ๲䭓‫އ‬ㄪᷥDŽFayyad & Irani˄1993˅䅼䆎њ䖭⾡ᮍ⊩ⱘϔϾᠽ
ሩˈेᡞ䖲㓁ⱘሲᗻߚࡆ៤໮Ͼऎ䯈ˈ㗠ϡᰃ෎Ѣऩϔ䯜ؐⱘϸϾऎ䯈DŽUtgoff &
Brodley˄1991˅੠Murthy et al.˄1994˅䅼䆎њ䗮䖛ᇍ޴Ͼ䖲㓁ؐሲᗻⱘ㒓ᗻ㒘ড়ᅮН
䯜ؐখ᭄ⱘᮍ⊩DŽ
3.7.3 ኔᙝ䘿᤟ⲺެԌᓜ䠅ḽ߼

ֵᙃ๲Ⲟᑺ䞣ᄬ೼ϔϾ‫ݙ‬೼‫أ‬㕂ˈᅗ‫أ‬㹦‫݋‬᳝䕗໮ؐⱘሲᗻDŽВϔϾᵕッⱘ՟ᄤˈ
㗗㰥ሲᗻ Dateˈᅗ᳝໻䞣ⱘৃ㛑ؐ˄՟བ March 4,1979˅DŽ㽕ᰃ៥Ӏᡞ䖭Ͼሲᗻࡴࠄ㸼
3-2 ⱘ᭄᥂ЁˈᅗӮ೼᠔᳝ሲᗻЁ᳔᳝໻ⱘֵᙃ๲ⲞDŽ䖭ᰃ಴Ўऩ⣀ Date ህৃҹᅠܼ乘
⌟䆁㒗᭄᥂ⱘⳂᷛሲᗻDŽѢᰃ䖭ϾሲᗻӮ㹿䗝԰ᷥⱘḍ㒧⚍ⱘ‫އ‬ㄪሲᗻᑊᔶ៤ϔỉ⏅ᑺ
Ўϔ㑻Ԛै䴲ᐌᆑⱘᷥˈ䖭ỉᷥৃҹ⧚ᛇഄߚ㉏䆁㒗᭄᥂DŽᔧ✊ˈ䖭Ͼ‫އ‬ㄪᷥᇍѢৢᴹ
᭄᥂ⱘᗻ㛑ӮⳌᔧᏂˈ಴Ўሑㅵᅗᅠ㕢ഄߚࡆњ䆁㒗᭄᥂ˈԚᅗϡᰃϔϾདⱘ乘⌟఼
˄predicator˅
DŽ

ሲᗻ Date ߎњҔМ䯂乬њਸ਼˛ㅔऩഄ䆆ˈᰃ಴Ўᅗ໾໮ⱘৃ㛑ؐᖙ✊ᡞ䆁㒗ḋ՟
ߚࡆ៤䴲ᐌᇣⱘぎ䯈DŽ಴ℸˈⳌᇍ䆁㒗ḋ՟ˈᅗӮ᳝䴲ᐌ催ⱘֵᙃ๲ⲞˈሑㅵᇍѢ᳾㾕
ᅲ՟ᅗᰃϔϾ䴲ᐌᏂⱘⳂᷛߑ᭄乘⌟఼DŽ

䙓‫ܡ‬䖭Ͼϡ䎇ⱘϔ⾡ᮍ⊩ᰃ⫼݊Ҫᑺ䞣ˈ㗠ϡᰃֵᙃ๲Ⲟˈᴹ䗝ᢽ‫އ‬ㄪሲᗻDŽϔϾ
ৃҹ䗝ᢽⱘᑺ䞣ᷛ‫ޚ‬ᰃ๲Ⲟ↨⥛˄gain ratio˅˄Quinlan 1986˅DŽ๲Ⲟ↨⥛䗮䖛ࡴܹϔϾ
⿄԰ߚ㺖ֵᙃ˄split information˅ⱘ乍ᴹᚽ㔮㉏Ԑ Date ⱘሲᗻˈߚ㺖ֵᙃ⫼ᴹ㸵䞣ሲ
ᗻߚ㺖᭄᥂ⱘᑓᑺ੠ഛࣔᗻ˖

c
| Si | |S |
SplitInformation( S , A) { ¦ log 2 i ˄3.5˅
i 1 | S | |S|

݊ЁS1ࠄScᰃcϾؐⱘሲᗻAߚࡆS㗠ᔶ៤ⱘcϾḋ՟ᄤ䲚DŽ⊼ᛣߚ㺖ֵᙃᅲ䰙Ϟህᰃ
S݇ѢሲᗻAⱘ৘ؐⱘ➉DŽ䖭Ϣ៥Ӏࠡ䴶ᇍ➉ⱘՓ⫼ϡৠˈ೼䙷䞠៥Ӏা㗗㰥S݇Ѣᄺд
ࠄⱘᷥ㽕乘⌟ⱘⳂᷛሲᗻⱘؐⱘ➉DŽ

๲Ⲟ↨⥛ᑺ䞣ᰃ⫼ࠡ䴶ⱘ๲Ⲟᑺ䞣੠䖭䞠ⱘߚ㺖ֵᙃᑺ䞣ᴹ݅ৠᅮНⱘˈे˖

Gain( S , A)
GainRatio( S , A) { ˄3.6˅
SplitInformation( S , A)

䇋⊼ᛣˈߚ㺖ֵᙃ乍䰏⹡䗝ᢽؐЎഛࣔߚᏗⱘሲᗻDŽ՟བˈ㗗㰥ϔϾ৿᳝nϾḋ՟
ⱘ䲚ড়㹿ሲᗻAᕏᑩߚࡆ˄䆥⊼˖ߚ៤n㒘ˈेϔϾḋ՟ϔ㒘˅DŽ䖭ᯊߚ㺖ֵᙃⱘؐЎlog2nDŽ
ⳌডˈϔϾᏗᇨሲᗻBߚࡆৠḋⱘnϾᅲ՟ˈབᵰᙄདᑇߚϸञˈ䙷Мߚ㺖ֵᙃᰃ 1DŽབ
ᵰሲᗻA੠Bѻ⫳ৠḋⱘֵᙃ๲Ⲟˈ䙷Мḍ᥂๲Ⲟ↨⥛ᑺ䞣ˈᯢᰒBӮᕫߚ᳈催DŽ

Փ⫼๲Ⲟ↨⥛ҷ᳓๲Ⲟᴹ䗝ᢽሲᗻѻ⫳ⱘϔϾᅲ䰙䯂乬ᰃˈᔧᶤϾSi᥹䖥S˄|Si|||S|˅
ᯊߚ↡ৃ㛑Ў 0 ៪䴲ᐌᇣDŽབᵰᶤϾሲᗻᇍѢSⱘ᠔᳝ḋ՟᳝޴Тৠḋⱘؐˈ䖭ᯊ㽕М
ᇐ㟈๲Ⲟ↨⥛᳾ᅮНˈ㽕Мᰃ๲Ⲟ↨⥛䴲ᐌ໻DŽЎњ䙓‫ܡ‬䗝ᢽ䖭⾡ሲᗻˈ៥Ӏৃҹ䞛⫼
䖭ḋϔѯਃথᓣ㾘߭ˈ↨བ‫ܜ‬䅵ㅫ↣Ͼሲᗻⱘ๲Ⲟˈ✊ৢҙᇍ䙷ѯ๲Ⲟ催䖛ᑇഛؐⱘሲ
ᗻᑨ⫼๲Ⲟ↨⥛⌟䆩˄Quinlan 1986˅
DŽ

䰸њֵᙃ๲ⲞˈLopez de Mantaras˄1991˅ҟ㒡њ঺ϔ⾡Ⳉ᥹䩜ᇍϞ䗄䯂乬㗠䆒䅵
ⱘᑺ䞣ˈᅗᰃ෎Ѣ䎱⾏ⱘ˄distance-based˅DŽ䖭Ͼᑺ䞣ᷛ‫ޚ‬෎Ѣ᠔ᅮНⱘϔϾ᭄᥂ߦߚ
䯈ⱘ䎱⾏ሎᑺDŽ↣Ͼሲᗻⱘ䆘Ԅḍ᥂ᅗѻ⫳ⱘߦߚϢ⧚ᛇߦߚ˄гህᰃᅠ㕢ߚ㉏䆁㒗᭄
᥂ⱘߦߚ˅䯈ⱘ䎱⾏DŽ✊ৢ䗝ᢽߦߚ᳔᥹䖥ᅠ㕢ߦߚⱘሲᗻDŽLopez de Mantaras ˄1991˅
ᅮНњ䖭Ͼ䎱⾏ᑺ䞣ˈ䆕ᯢњᅗϡ‫أ‬৥᳝໻䞣ؐⱘሲᗻˈᑊ᡹ਞњ݊ᅲ偠ⷨおˈ䇈ᯢ䖭
⾡ᮍ⊩ѻ⫳ⱘ‫އ‬ㄪᷥⱘ乘⌟㊒ᑺϢ๲Ⲟ⊩੠๲Ⲟ↨⥛⊩ᕫࠄⱘ≵᳝ᯢᰒⱘᏂ߿DŽ㗠Ϩ䖭
⾡䎱⾏ᑺ䞣䙓‫ܡ‬њ๲Ⲟ↨⥛ᑺ䞣ⱘᅲ䰙ೄ䲒ˈ೼Ҫⱘᅲ偠ЁˈᇍѢሲᗻؐϾ᭄Ꮒᓖ䴲ᐌ
໻ⱘ᭄᥂䲚ˈ䖭⾡ᮍ⊩ѻ⫳њᬜᵰᕜདⱘ䕗ᇣⱘᷥDŽ

ℸ໪ˈᄺ㗙Ӏ䖬ᦤߎњ໮⾡ሲᗻ䗝ᢽᑺ䞣˄՟བˈBreiman et al. 1984˗Mingers 1989a˗


Kearns & Mansour 1996˗Dietterich et al. 1996˅DŽMingers˄1989a˅ᦤկњᅲ偠ߚᵤˈ↨
䕗њ䩜ᇍϡৠ䯂乬ⱘ޴⾡䗝ᢽᑺ䞣ⱘ᳝ᬜᑺDŽҪ᡹ਞњՓ⫼ϡৠሲᗻ䗝ᢽᑺ䞣ѻ⫳ⱘ᳾
ׂ࠾‫އ‬ㄪᷥⱘ໻ᇣⱘᰒ㨫ᏂᓖDŽ✊㗠೼Ҫⱘᅲ偠Ёˈϡৠⱘሲᗻ䗝ᢽᑺ䞣ᇍ᳔㒜㊒ᑺⱘ
ᕅડᇣѢৢׂ࠾ⱘ⿟ᑺ੠ᮍ⊩ᇍ᳔㒜㊒ᑺⱘᕅડDŽ

3.7.4 ༺⨼㕰ቇኔᙝ‫Ⲻٲ‬䇣㓹ṭׁ

೼ᶤѯᚙ‫މ‬ϟˈৃկՓ⫼ⱘ᭄᥂ৃ㛑㔎ᇥᶤѯሲᗻⱘؐDŽ՟བˈ೼एᄺ乚ඳ៥ӀᏠ
ᳯḍ᥂໮乍࣪偠ᣛᷛ乘⌟ᙷ㗙ⱘ㒧ᵰˈ✊㗠ৃ㛑ҙ᳝䚼ߚᙷ㗙‫݋‬᳝偠㸔㒧ᵰDŽ೼䖭⾡ᚙ
‫މ‬ϟˈ㒣ᐌ䳔㽕ḍ᥂ℸሲᗻؐᏆⶹⱘ݊Ҫᅲ՟ˈᴹԄ䅵䖭Ͼ㔎ᇥⱘሲᗻؐDŽ

㗗㰥ҹϟᚙ‫ˈމ‬Ўњ䆘Ԅሲᗻ A ᰃ৺ᰃ‫އ‬ㄪ㒧⚍ n ⱘ᳔Շ⌟䆩ሲᗻˈ㽕䅵ㅫ‫އ‬ㄪ


ᷥ೼䆹㒧⚍ⱘֵᙃ๲Ⲟ Gain(S, A)DŽ‫؛‬ᅮ<x, c(x)>ᰃ S ЁⱘϔϾ䆁㒗ḋ՟ˈᑊϨሲᗻ A
ⱘؐ A(x)᳾ⶹDŽ

໘⧚㔎ᇥሲᗻؐⱘϔ⾡ㄪ⬹ᰃ䌟㒭ᅗ㒧⚍ n ⱘ䆁㒗ḋ՟Ё䆹ሲᗻⱘ᳔ᐌ㾕ؐDŽ঺ϔ
⾡ㄪ⬹ᰃৃҹ䌟㒭ᅗ㒧⚍ n ⱘ㹿ߚ㉏Ў c(x)ⱘ䆁㒗ḋ՟Ё䆹ሲᗻⱘ᳔ᐌ㾕ؐDŽ✊ৢՓ⫼
䖭ϾԄ䅵ؐⱘ䆁㒗ḋ՟ህৃҹ㹿⦄᳝ⱘ‫އ‬ㄪᷥᄺдㅫ⊩Փ⫼њDŽMingers˄1989a˅Ёߚ
ᵤњ䖭Ͼㄪ⬹DŽ

㄀Ѡ⾡⿡ᖂ໡ᴖⱘㄪ⬹ᰃЎ A ⱘ↣Ͼৃ㛑ؐ䌟ϢϔϾὖ⥛ˈ㗠ϡᰃㅔऩഄᇚ᳔ᐌ
㾕ⱘؐ䌟㒭 A(x)DŽḍ᥂㒧⚍ n ⱘḋ՟Ϟ A ⱘϡৠؐⱘߎ⦄乥⥛ˈ䖭ѯὖ⥛ৃҹ㹿‫⃵ݡ‬
Ԅ䅵DŽ՟བˈ㒭ᅮϔϾᏗᇨሲᗻ Aˈབᵰ㒧⚍ n ࣙ৿ 6 ϾᏆⶹ A=1 ੠ 6 Ͼ A=0 ⱘḋ՟ˈ
䙷М A(x)=1 ⱘὖ⥛ᰃ 0.6ˈA(x)=0 ⱘὖ⥛ᰃ 0.4DŽѢᰃˈᅲ՟ x ⱘ 60%㹿ߚ䜡ࠄ A=1 ⱘ
ߚᬃˈ40%㹿ߚ䜡ࠄ঺ϔϾߚᬃDŽ䖭ѯ⠛↉ḋ՟˄fractional examples˅ⱘⳂⱘᰃ䅵ㅫֵ
ᙃ๲Ⲟˈ঺໪ˈབᵰ᳝㄀ѠϾ㔎ᇥؐⱘሲᗻᖙ乏㹿⌟䆩ˈ䖭ѯḋ՟ৃҹ೼ৢ㒻ⱘᷥߚᬃ
㹿䖯ϔℹ㒚ߚDŽϞ䗄ⱘḋ՟ⱘ⠛↉гৃҹ೼ᄺдПৢՓ⫼ˈ⫼ᴹߚ㉏㔎ᇥሲᗻⱘᮄᅲ՟DŽ
೼䖭⾡ᚙ‫މ‬ϟˈᮄᅲ՟ⱘߚ㉏ህᰃ᳔ৃ㛑ⱘߚ㉏ˈ䅵ㅫⱘᮍ⊩ᰃ䗮䖛೼ᷥⱘ৊㒧⚍ᇍᣝ
ϡৠᮍᓣߚ㉏ⱘᅲ՟⠛↉ⱘࡴᴗ∖੠DŽC4.5˄Quinlan 1993˅Փ⫼䖭⾡ᮍ⊩໘⧚㔎ᇥⱘ
ሲᗻؐDŽ

3.7.5 ༺⨼ԙԭуੂⲺኔᙝ

೼ᶤѯᄺдӏࡵЁˈᅲ՟ⱘሲᗻৃ㛑ϢҷӋⳌ݇DŽ՟བˈ೼ᄺдߚ㉏⮒⮙ᯊ៥Ӏৃ
㛑ҹ䖭ѯሲᗻᴹᦣ䗄ᙷ㗙˖ԧ⏽ǃ⌏㒘㒛ߛ⠛Ẕᶹǃ㛝᧣ǃ㸔⎆࣪偠㒧ᵰㄝDŽ䖭ѯሲᗻ
೼ҷӋᮍ䴶Ꮒ߿䴲ᐌ໻ˈϡ䆎ᰃ᠔䳔ⱘ䌍⫼䖬ᰃᙷ㗙㽕ᡓফⱘϡ䗖DŽᇍѢ䖭ḋⱘӏࡵˈ
៥ӀᇚӬ‫ܜ‬䗝ᢽሑৃ㛑Փ⫼ԢҷӋሲᗻⱘ‫އ‬ㄪᷥˈҙᔧ䳔㽕ѻ⫳ৃ䴴ⱘߚ㉏ᯊᠡձ䌪催
ҷӋሲᗻDŽ

䗮䖛ᓩܹϔϾҷӋ乍ࠄሲᗻ䗝ᢽᑺ䞣ˈৃҹՓ ID3 ㅫ⊩㗗㰥ሲᗻҷӋDŽ՟བˈ៥


Ӏৃҹ⫼ֵᙃ๲Ⲟ䰸ҹሲᗻⱘҷӋˈҹՓԢҷӋⱘሲᗻӮ㹿Ӭ‫ܜ‬䗝ᢽDŽ㱑✊䖭⾡ҷӋᬣ
ᛳᑺ䞣ϡֱ䆕ᡒࠄ᳔ӬⱘҷӋᬣᛳ‫އ‬ㄪᷥˈᅗӀ⹂ᅲՓ᧰㋶‫أ‬㕂ࠄ᳝߽ѢԢҷӋሲᗻDŽ

Tan & Schlimmer˄1990˅੠ Tan˄1993˅ᦣ䗄њϔ⾡䖭ḋⱘᮍ⊩ˈᑊᡞᅗᑨ⫼ࠄᴎ


఼ҎᛳⶹӏࡵЁDŽ೼䖭ϾӏࡵЁᴎ఼Ҏᖙ乏ḍ᥂䖭ѯ⠽ԧབԩ㛑㹿ᅗⱘᴎẄ᠟ᡧԣˈҢ
㗠ᄺӮߚ䕼ϡৠⱘ⠽ԧDŽ䖭⾡ᚙ‫މ‬ϟˈሲᗻᇍᑨѢᴎ఼Ҏ䑿Ϟⱘ⿏ࡼໄ㒇㦋ᕫⱘϡৠӴ
ᛳ఼䇏᭄DŽሲᗻⱘҷӋ䗮䖛ᅮԡ៪᪡԰ໄ㒇ᴹ㦋পሲᗻؐ᠔䳔ⱘ⾦᭄ᴹ㸵䞣DŽҪӀ䆕ᯢˈ
䗮䖛⫼ϟ䴶ⱘᑺ䞣ҷ᳓ֵᙃ๲Ⲟሲᗻ䗝ᢽᑺ䞣ˈᄺࠄњ᳈ࡴ᳝ᬜⱘ䆚߿ㄪ⬹ˈৠᯊ≵᳝
ᤳ༅ߚ㉏ⱘ㊒ᑺDŽ

Gain 2 ( S , A)
Cost ( A)

Nunez˄1988˅Ёᦣ䗄њϔ⾡᳝݇ⱘᮍ⊩ˈᑊᡞᅗᑨ⫼ࠄᄺдए⭫䆞ᮁ㾘߭ϞDŽ䖭
䞠ሲᗻᰃ‫݋‬᳝ϡৠҷӋⱘϡৠ⮛⢊੠࣪偠⌟䆩DŽᅗⱘ㋏㒳Փ⫼њ⿡ᖂ᳝⚍ϡৠⱘሲᗻ䗝
ᢽᑺ䞣˖

2 Gain ( S , A)  1
(Cost ( A)  1) w

݊Ё w[0ˈ1]ᰃϔϾᐌ᭄ˈ‫އ‬ᅮҷӋᇍֵᙃ๲ⲞⱘⳌᇍ䞡㽕ᗻDŽNunez˄1991˅䩜
ᇍϔ㋏߫ӏࡵ㒭ߎњ䖭ϸ⾡ᮍ⊩ⱘ䆩偠ᇍ↨DŽ

3.8 ቅ㔉ૂ㺛‫ݻ‬䈱⢟

䖭ϔゴⱘ㽕⚍ࣙᣀ˖
z ‫އ‬ㄪᷥᄺдЎὖᗉᄺд੠ᄺд݊Ҫ⾏ᬷؐⱘߑ᭄ᦤկњϔϾᅲ⫼ⱘᮍ⊩DŽID3
㋏߫ㅫ⊩Փ⫼Ңḍ৥ϟ๲䭓⊩᥼ᮁ‫އ‬ㄪᷥˈЎ↣Ͼ㽕ࡴܹᷥⱘᮄ‫އ‬ㄪߚᬃ䋾ှ
ഄ䗝ᢽ᳔དⱘሲᗻDŽ
z ID3 ㅫ⊩᧰㋶ᅠᭈⱘ‫؛‬䆒ぎ䯈˄гህᰃ䇈ˈ‫އ‬ㄪᷥぎ䯈㛑໳㸼⼎ӏԩᅮН೼⾏ᬷ
ؐᅲ՟Ϟⱘӏԩ⾏ᬷؐߑ᭄˅DŽ᠔ҹᅗ䙓‫ܡ‬њҙ㗗㰥᳝䰤ⱘ‫؛‬䆒䲚ড়ⱘᮍ⊩ⱘ
Џ㽕䯂乬˖Ⳃᷛߑ᭄ৃ㛑ϡ೼‫؛‬䆒ぎ䯈ЁDŽ
z 䱤৿೼ ID3 ㅫ⊩Ёⱘᔦ㒇‫أ‬㕂ࣙᣀӬ‫ܜ‬䗝ᢽ䕗ᇣⱘᷥˈгህᰃ䇈ˈᅗ䗮䖛ᇍ‫؛‬
䆒ぎ䯈ⱘ᧰㋶๲䭓ᷥˈՓᷥⱘ໻ᇣЎℷད㛑ߚ㉏Ꮖ᳝ⱘ䆁㒗ḋ՟DŽ
z 䖛ᑺᢳড়䆁㒗᭄᥂ᰃ‫އ‬ㄪᷥᄺдЁⱘ䞡㽕䯂乬DŽ಴Ў䆁㒗ḋ՟ҙҙᰃ᠔᳝ৃ㛑
ᅲ՟ⱘϔϾḋᴀˈ৥ᷥ๲ࡴߚᬃৃ㛑ᦤ催೼䆁㒗ḋ՟Ϟⱘᗻ㛑ˈԚै䰡Ԣ೼䆁
㒗ᅲ՟໪ⱘ݊Ҫᅲ՟Ϟⱘᗻ㛑DŽ಴ℸˈৢׂ࠾‫އ‬ㄪᷥⱘᮍ⊩ᇍѢ䙓‫އܡ‬ㄪᷥᄺ
дЁ˄੠݊ҪՓ⫼Ӭ䗝‫أ‬㕂ⱘᔦ㒇᥼⧚ᮍ⊩˅ⱘ䖛ᑺᢳড়ᰃᕜ䞡㽕ⱘDŽ
z ᇍѢ෎ᴀ ID3 ㅫ⊩ˈⷨお㗙Ꮖ㒣ᓔথњ໻䞣ⱘᠽሩDŽ݊Ёࣙᣀৢׂ࠾ⱘᮍ⊩˗
໘⧚ᅲ᭄ؐⱘሲᗻ˗ᆍ㒇㔎ᇥሲᗻؐⱘ䆁㒗ḋ՟˗ᔧ᳝њᮄⱘ䆁㒗ᅲ՟ᯊ䗦๲
㊒࣪‫އ‬ㄪᷥ˗Փ⫼ֵᙃ๲ⲞП໪ⱘ݊Ҫሲᗻ䗝ᢽᑺ䞣˗㗗㰥Ϣᅲ՟ሲᗻ݇㘨ⱘ
ҷӋDŽ

݇Ѣ‫އ‬ㄪᷥᄺдⱘ᳔ᮽⱘ㨫԰᳝ Hunt ⱘὖᗉᄺд㋏㒳˄Concept Learning Systemˈ


CLS˅˄Hunt et al. 1966˅ҹঞ Friedman ੠ Breiman ⱘ CART ㋏㒳˄Friedman 1977;Breiman
et al. 1984˅DŽQuinlan ⱘ ID3 ㋏㒳˄Quinlan 1979ˈ1983˅ᵘ៤њᴀゴ䅼䆎ⱘ෎⸔DŽ݇Ѣ
‫އ‬ㄪᷥᄺдⱘ݊Ҫᮽᳳ㨫԰ࣙᣀ ASSISTANT˄Kononenko et al. 1984˗Cestnik et al.
1987˅DŽ‫އ‬ㄪᷥᔦ㒇ㅫ⊩೼໮᭄䅵ㅫᴎᑇৄϞⱘᅲ⦄ৃҹଚϮᮍᓣᕫࠄDŽ

݇Ѣ‫އ‬ㄪᷥᔦ㒇ⱘ䖯ϔℹ㒚㡖ˈQuinlan˄1993˅ᰃϔᴀ㊒ᔽⱘ㨫԰ˈ݊Ё䅼䆎њ
ᕜ໮ᅲ䏉䯂乬ˈᑊᦤկњ C4.5 ㅫ⊩ⱘৃᠻ㸠ҷⷕDŽMingers˄1989a˅੠ Buntine & Niblett
˄1992˅ᦤկњ↨䕗ϡৠሲᗻ䗝ᢽᑺ䞣ⱘᅲ偠ⷨおDŽMingers˄1989b˅ᦤկњᇍϡৠׂ
࠾ㄪ⬹ⱘⷨおDŽ↨䕗‫އ‬ㄪᷥᄺд੠݊Ҫᄺдᮍ⊩ⱘ䆩偠ৃ೼ӫ໮ⱘ䆎᭛Ёᡒࠄˈࣙᣀ
˄Dietterich et al. 1995; Fisher & McKusick 1989; Quinlan 1988a; Shavlik et al. 1991;
Thrun et al. 1991; Weiss and Kapouleas 1989˅DŽ
д乬

3.1 ⬏ߎ㸼⼎ϟ䴶Ꮧᇨߑ᭄ⱘ‫އ‬ㄪᷥ˖

˄a˅Aš¬B

˄b˅A›[BšC]

˄c˅A XOR B

˄d˅[AšB] › [CšD]

3.2 㗗㰥ϟ䴶ⱘ䆁㒗ḋ՟䲚ড়˖

ᅲ՟ ߚ㉏ a1 a2
1 + T T
2 + T T
3 - T F
4 + F F
5 - F T
6 - F T

˄a˅䇋䅵ㅫ䖭Ͼ䆁㒗ḋ՟䲚ড়ᇍѢⳂᷛߑ᭄ߚ㉏ⱘ➉DŽ

˄b˅䇋䅵ㅫሲᗻa2Ⳍᇍ䖭ѯ䆁㒗ḋ՟ⱘֵᙃ๲ⲞDŽ

3.3 ߸ᮁҹϟੑ乬ⱘℷ䇃˖བᵰᷥ D2 ᰃҢᷥ D1 ࡴᎹⱘˈ䙷М D1 more-general-than D2DŽ


‫؛‬ᅮ D1 ੠ D2 ᰃ㸼⼎ӏᛣᏗᇨߑ᭄ⱘ‫އ‬ㄪᷥˈ㗠Ϩᔧ ID3 㛑ᡞ D1 ᠽሩ៤ D2 ᯊˈ䙷М
D2 ᰃ D1 ⱘࡴᎹDŽབᵰℷ⹂ˈ㒭ߎ䆕ᯢ˗བᵰ䫭䇃ˈВߎϔϾড՟DŽ˄more-general-than
㹿ᅮН೼㄀ 2 ゴЁDŽ˅

3.4 ID3 ҙᇏᡒϔϾϔ㟈ⱘ‫؛‬䆒ˈ㗠‫׭‬䗝⍜䰸ㅫ⊩ᇏᡒ᠔᳝ϔ㟈ⱘ‫؛‬䆒DŽ㗗㰥䖭ϸ⾡ᄺ


дㅫ⊩䯈ⱘᇍᑨ݇㋏DŽ

˄a˅‫؛‬ᅮ㒭ᅮ EnjoySport ⱘಯϾ䆁㒗ḋ՟ˈ⬏ߎ ID3 ᄺдⱘ‫އ‬ㄪᷥDŽ݊Ё EnjoySport


Ⳃᷛὖᗉ߫೼㄀ 2 ゴⱘ㸼 2-1 ЁDŽ

˄b˅ᄺдࠄⱘ‫އ‬ㄪᷥ੠Ңৠḋⱘḋ՟Փ⫼বൟぎ䯈ㅫ⊩ᕫࠄⱘবൟぎ䯈˄㾕㄀ 2
ゴ೒ 2-3˅䯈᳝ҔМ݇㋏˛ᷥㄝӋѢবൟぎ䯈ⱘϔϾ៤ਬ৫˛

˄c˅๲ࡴϟ䴶ⱘ䆁㒗ḋ՟ˈ䅵ㅫᮄⱘ‫އ‬ㄪᷥDŽ䖭ϔ⃵ˈᰒ⼎ߎ๲䭓ᷥⱘ↣ϔℹЁ
↣Ͼ‫׭‬䗝ሲᗻⱘֵᙃ๲ⲞDŽ

Sky Air-Temp Humidity Wind Water Forecast Enjoy-Sport?

Sunny Warm Normal Weak Warm Same No

˄d˅‫؛‬ᅮ៥ӀᏠᳯ䆒䅵ϔϾᄺд఼ˈᅗ᧰㋶‫އ‬ㄪᷥ‫؛‬䆒ぎ䯈˄㉏Ԑ ID3˅ᑊᇏᡒ
Ϣ᭄᥂ϔ㟈ⱘ᠔᳝‫؛‬䆒˄㉏Ԑ‫׭‬䗝⍜䰸˅DŽㅔऩഄ䇈ˈ៥ӀᏠᳯᑨ⫼‫׭‬䗝⍜䰸ㅫ⊩᧰㋶
‫އ‬ㄪᷥ‫؛‬䆒ぎ䯈DŽ‫ߎݭ‬㒣䖛㸼 2-1 ⱘ㄀ϔϾ䆁㒗ḋ՟ৢⱘ S ੠ G 䲚ড়DŽ⊼ᛣ S ᖙ乏ࣙ
৿Ϣ᭄᥂ϔ㟈ⱘ᳔⡍⅞ⱘ‫އ‬ㄪᷥˈ㗠 G ᖙ乏ࣙ৿᳔ϔ㠀ⱘDŽ䇈ᯢ䘛ࠄ㄀ѠϾ䆁㒗ḋ՟
ᯊ S ੠ G 䲚ড়ᰃབԩ㹿ᬍ䖯ⱘ˄ৃҹএᥝᦣ䗄ৠϔϾὖᗉⱘ䇁⊩ϡৠⱘᷥ˅DŽ೼ᡞ‫׭‬䗝
⍜䰸ㅫ⊩ᑨ⫼ࠄ‫އ‬ㄪᷥ‫؛‬䆒ぎ䯈ᯊˈ乘䅵Ӯ⺄ࠄҔМḋⱘೄ䲒˛
ㅢ4ㄖ  Ӱᐛ⾔㔅㖇㔒

人工神经网络(Artificial Neural Networks——ANNs)提供了一种普遍而且实


用的方法,来从样例中学习值为实数、离散或向量的函数。像反向传播 BP
(BackPropagation)这样的算法使用梯度下降来调节网络参数以最佳拟合由输入
-输出对组成的训练集合。ANN 学习对于训练数据中的错误鲁棒性很好,且已经成
功地应用到很多领域,例如视觉场景分析(interpreting visual scenes)、语音识别、
以及机器人控制等。

4.1 ㆶԁ

⾎㓿㖁㔌ᆖҐᯩ⌅ሩҾ䙬䘁ᇎᮠ٬ǃ⿫ᮓ٬ᡆੁ䟿٬Ⲵⴞḷ࠭ᮠᨀ‫׋‬Ҷа⿽励ἂᙗᖸᕪ
Ⲵᯩ⌅DŽሩҾḀӋ㊫රⲴ䰞仈ˈྲᆖҐ䀓䟺༽ᵲⲴ⧠ᇎц⭼ѝⲴՐᝏಘᮠᦞˈӪᐕ⾎㓿㖁㔌
ᱟⴞࡽ⸕䚃Ⲵᴰᴹ᭸ᆖҐᯩ⌅DŽֻྲˈᵜㄐ㾱᧿䘠Ⲵ৽ੁՐ᫝㇇⌅ᐢ൘ᖸཊᇎ䱵Ⲵ䰞仈ѝਆ
ᗇҶ᛺ӪⲴᡀ࣏ˈ∄ྲᆖҐ䇶࡛᡻߉ᆇㅖ˄LeCun et al. 1989˅ˈᆖҐ䇶࡛ਓ䈝˄Lang et al.
1990˅઼ᆖҐ䇶࡛Ӫ㝨˄Cottrell 1990˅DŽRumelhart et al.˄1994˅ѝᾲ㿸Ҷަᇎ䱵Ⲵᓄ⭘DŽ

4.1.1 ⭕⢟ᆜࣞᵰ

Ӫᐕ⾎㓿㖁㔌Ⲵ⹄ウ൘аᇊ〻ᓖкਇࡠҶ⭏⢙ᆖⲴ੟ਁˈഐѪ⭏⢙ⲴᆖҐ㌫㔏ᱟ⭡⴨ӂ
䘎᧕Ⲵ⾎㓿‫˄ݳ‬neuron˅㓴ᡀⲴᔲᑨ༽ᵲⲴ㖁㔌DŽ㘼Ӫᐕ⾎㓿㖁㔌о↔བྷփ⴨լˈᆳᱟ⭡а
㌫ࡇㆰঅঅ‫⴨ݳ‬ӂᇶ䳶䘎᧕ᶴᡀˈަѝ⇿ањঅ‫ݳ‬ᴹаᇊᮠ䟿Ⲵᇎ٬䗃‫˄ޕ‬ਟ㜭ᱟަԆঅ‫ݳ‬
Ⲵ䗃ࠪ˅ˈᒦӗ⭏অаⲴᇎᮠ٬䗃ࠪ˄ਟ㜭ᡀѪަԆᖸཊঅ‫Ⲵݳ‬䗃‫˅ޕ‬DŽ

ѪҶ࣐␡ሩ䘉⿽㊫∄Ⲵ䇔䇶ˈ䇙ᡁԜ㘳㲁аӋᶕ㠚⭏⢙ᆖⲴһᇎDŽֻྲˈᦞՠ䇑Ӫ㊫Ⲵ
བྷ㝁ᱟ⭡བྷ㓖 1011њ⾎㓿‫⴨ݳ‬ӂ䘎᧕㓴ᡀⲴᇶ䳶㖁㔌ˈᒣ൷⇿ањ⾎㓿‫ݳ‬оަԆ 104њ⾎㓿
‫⴨ݳ‬䘎DŽ⾎㓿‫Ⲵݳ‬⍫ᙗ䙊ᑨ㻛䙊ੁަԆ⾎㓿‫Ⲵݳ‬䘎᧕◰⍫ᡆᣁࡦDŽⴞࡽ⸕䚃ⲴᴰᘛⲴ⾎㓿‫ݳ‬
䖜ᦒᰦ䰤ᱟ൘ 10-3。㓗࡛——о䇑㇇ᵪⲴ䖜ᦒᰦ䰤 10-10。⴨∄ធᖸཊDŽ❦㘼Ӫ㊫㜭ཏԕ᛺Ӫ
Ⲵ䙏ᓖ‫༽ࠪڊ‬ᵲᓖ᛺ӪⲴߣㆆDŽֻྲˈ֐㾱䙊䗷㿶㿹䇔ࠪ㠚ᐡⲴ⇽Ӣབྷ㓖䴰㾱 10-1。DŽ⌘᜿
൘䘉 10-1。Ⲵ䰤䳄޵ˈ㻛◰ਁⲴ⾎㓿‫ݳ‬ᒿࡇн䮯ҾᮠⲮ↕ˈഐѪঅњ⾎㓿‫Ⲵݳ‬䖜ᦒ䙏ᓖᐢ⸕DŽ
䘉њһᇎ֯ᖸཊӪ᧘⍻ˈ⭏⢙⾎㓿㌫㔏Ⲵؑ᚟༴⨶㜭࣋аᇊᗇ⳺Ҿሩ࠶ᐳ൘བྷ䟿⾎㓿‫ݳ‬кⲴ
ؑ᚟㺘⽪Ⲵ儈ᓖᒦ㹼༴⨶DŽANN㌫㔏Ⲵањࣘᵪቡᱟ㧧ᗇ䘉⿽สҾ࠶ᐳ㺘⽪Ⲵ儈ᓖᒦ㹼㇇
⌅DŽབྷཊᮠⲴANN䖟Ԧ൘Ѣ㹼ᵪಘкԯⵏ࠶ᐳ༴⨶ˈ❦㘼ᴤᘛ⡸ᵜⲴ㇇⌅ҏᐢ㓿൘儈ᓖᒦ
㹼ᵪ઼⢩࡛ѪANNᓄ⭘䇮䇑Ⲵу⭘⺜Ԧкᇎ⧠DŽ

⭡Ҿ ANN ਚᱟаᇊ〻ᓖൠਇ⭏⢙⾎㓿㌫㔏Ⲵ੟ਁˈᡰԕ ANN ᒦᵚ⁑ᤏ⭏⢙⾎㓿㌫㔏


ѝⲴᖸཊ༽ᵲ⢩ᖱˈ㘼фᐢ㓿⸕䚃 ANN Ⲵᖸཊ⢩ᖱо⭏⢙㌫㔏ҏᱟна㠤ⲴDŽֻྲˈሩҾ
ᡁԜ㘳㲁Ⲵ ANNˈ⇿њঅ‫ݳ‬䗃ࠪঅаⲴнਈ٬ˈ❦㘼⭏⢙⾎㓿‫ݳ‬䗃ࠪⲴᱟ༽ᵲⲴᰦᒿ㜹ߢDŽ

䮯ᵏԕᶕˈӪᐕ⾎㓿㖁㔌亶ฏⲴ⹄ウ㘵࠶ѪєњഒփDŽањഒփⲴⴞḷᱟ֯⭘ ANN ⹄
ウ઼⁑ᤏ⭏⢙ᆖҐ䗷〻DŽਖањഒփⲴⴞḷᱟ㧧ᗇ儈᭸ⲴᵪಘᆖҐ㇇⌅ˈн㇑䘉⿽㇇⌅ᱟ੖
৽᱐Ҷ⭏⢙䗷〻DŽ൘ᵜҖѝᡁԜⲴ‫ޤ‬䏓ㅖਸਾаഒփˈᡰԕᡁԜнՊ޽ᢺ⌘᜿࣋⭘൘⭏⢙⁑
රкDŽ㤕㾱㧧ᗇ‫ޣ‬Ҿ֯⭘ ANN ⁑ᤏ⭏⢙㌫㔏Ⲵᴤཊؑ᚟䈧৲㘳 Churchland & Sejnowski
˄1992˅ˈZornetzer et al.˄1994˅ˈGabriel & Moore˄1990˅DŽ

4.2 ⾔㔅㖇㔒㺞⽰

Pomerleau˄1993˅Ⲵ ALVINN ㌫㔏ᱟ ANN ᆖҐⲴањިරᇎֻˈ䘉њ㌫㔏֯⭘ањ


ᆖҐࡠⲴ ANN ԕ↓ᑨⲴ䙏ᓖ൘儈䙏‫ޜ‬䐟к傮傦⊭䖖DŽANN Ⲵ䗃‫ޕ‬ᱟањ 30u32 ‫ۿ‬㍐Ⲵ㖁
Ṭˈ‫ۿ‬㍐ⲴӞᓖᶕ㠚ањᆹ㻵൘䖖䖶кⲴࡽੁᩴ‫ۿ‬ᵪDŽANN Ⲵ䗃ࠪᱟ䖖䖶㹼䘋ⲴᯩੁDŽ䘉
њ ANN 䙊䗷㿲ሏӪ㊫傮傦ᰦⲴ᫽㓥ભԔ䘋㹼䇝㓳ˈ䇝㓳䗷〻བྷ㓖 5 ࠶䫏DŽALVINN ⭘ᆖҐ
ࡠⲴ㖁㔌൘儈䙏‫ޜ‬䐟кԕ 70 㤡䟼ᰦ䙏ᡀ࣏ൠ傮傦Ҷ 90 㤡䟼˄൘࠶㹼‫ޜ‬䐟Ⲵᐖ䖖䚃㹼傦ˈ਼
ᰦᴹަԆ䖖䖶˅DŽ

മ 4-1 ⭫ࠪҶ ALVINN ㌫㔏Ⲵањ⡸ᵜѝ֯⭘䗷Ⲵ⾎㓿㖁㔌㺘⽪ˈ䘉ҏᱟᖸཊ ANN ㌫


㔏Ⲵިර㺘⽪ᯩᔿDŽ⾎㓿㖁㔌ᱮ⽪൘മⲴᐖ䗩ˈ䗃‫Ⲵޕ‬ᩴ‫ۿ‬ᵪമ‫ۿ‬൘ᆳⲴл䗩DŽ㖁㔌മѝ⇿
њ㔃⛩ሩᓄањ㖁㔌অ‫˄ݳ‬unit˅Ⲵ䗃ࠪˈ㘼Ӿлᯩ䘋‫ޕ‬㔃⛩Ⲵᇎ㓯Ѫަ䗃‫ޕ‬DŽਟԕⴻࡠˈ
‫ޡ‬ᴹഋњঅ‫᧕ⴤݳ‬Ӿമ‫᧕ۿ‬᭦ᡰᴹⲴ 30u32 њ‫ۿ‬㍐DŽ䘉ഋњঅ‫ݳ‬㻛〠ѪĀ䳀㯿āঅ‫ˈݳ‬ഐѪ
ᆳԜⲴ䗃ࠪӵ൘㖁㔌޵䜘ˈнᱟᮤњ㖁㔌䗃ࠪⲴа䜘࠶DŽ⇿њ䳀㯿অ‫ݳ‬ṩᦞ 960 њ䗃‫࣐Ⲵޕ‬
ᵳ઼䇑㇇ᗇࡠঅаⲴᇎᮠ٬䗃ࠪDŽ❦ਾ䘉ഋњ䳀㯿অ‫Ⲵݳ‬䗃ࠪ㻛⭘֌ㅜҼቲ 30 њĀ䗃ࠪঅ
‫ݳ‬āⲴ䗃‫ޕ‬DŽ⇿њ䗃ࠪঅ‫ݳ‬ሩᓄањ⢩ᇊⲴ傮傦ᯩੁˈ䘉Ӌঅ‫Ⲵݳ‬䗃ࠪߣᇊଚањ傮傦ᯩੁ
ᱟᴰᕪ⛸᧘㦀ⲴDŽ

插图——原书页码:84

sharp left-ᙕࢗᐖ䖜

sharp right-ᙕࢗਣ䖜

straight ahead-↓ࡽᯩ

30 Output units-30 њ䗃ࠪঅ‫ݳ‬

4 Hidden units-4 њ䳀㯿অ‫ݳ‬

30u32 sensor input retina-30u32 Րᝏಘ㿶㖁㟌䗃‫ޕ‬

മ 4-1 ᆖҐ傮傦⊭䖖Ⲵ⾎㓿㖁㔌

ALVINN ㌫㔏֯⭘৽ੁՐ᫝㇇⌅ᶕᆖҐ傮傦⊭䖖˄кമ˅ˈᆳⲴᴰ儈ᰦ䙏䗮ࡠ⇿ሿᰦ 70 㤡䟼DŽᐖ


മᱮ⽪Ҷᶕ㠚䖖ࡽᩴ‫ۿ‬ᵪⲴമ‫ۿ‬ᱟྲօ㻛᱐ሴࡠ 960 њ⾎㓿㖁㔌䗃‫ˈⲴޕ‬䘉Ӌ䗃‫ޕ‬৸ࡽ侸ࡠ 4 њ䳀
㯿অ‫޽ˈݳ‬䘎᧕ࡠ 30 њ䗃ࠪঅ‫ݳ‬DŽ㖁㔌䗃ࠪ㕆⸱Ҷ᧘㦀Ⲵ傮傦ᯩੁDŽਣമᱮ⽪Ҷ㖁㔌ѝањ䳀㯿
অ‫Ⲵݳ‬ᵳ٬DŽ䘋‫ޕ‬䘉њ䳀㯿অ‫ Ⲵݳ‬30u32 њᵳ٬ᱮ⽪൘བྷⲴ⸙䱥ѝˈⲭ㢢ⲴᯩṶ㺘⽪↓ᵳ٬㘼唁㢢
ⲴᯩṶ㺘⽪䍏ᵳ٬DŽӾ䘉њ䳀㯿অ‫ ࡠݳ‬30 њ䗃ࠪঅ‫Ⲵݳ‬ᵳ٬㻛⭫൘䘉њབྷ⸙䱥кᯩⲴ䖳ሿ⸙ᖒѝDŽ
Ӿ䘉Ӌ䗃ࠪᵳ٬ਟԕⴻࠪˈ◰⍫䘉њ䳀㯿অ‫ݳ‬Պ‫׳‬䘋ੁᐖ䖜DŽ

മ 4-1 ѝⲴਣ‫ח‬䜘࠶᧿㔈ⲴᱟаӋᆖҐᗇࡠⲴᵳ٬ˈᆳԜо䘉њ ANN Ⲵഋњ䳀㯿অ‫ݳ‬


ѻа⴨㚄㌫DŽл䶒Ⲵ唁ⲭᯩṬབྷ⸙䱥᧿䘠ⲴᱟӾ 30u32 ‫ۿ‬㍐䗃‫ࡠޕ‬䘉њ䳀㯿অ‫Ⲵݳ‬ᵳ٬DŽ䘉
䟼ˈⲭᯩṬ㺘⽪↓ᵳ٬ˈ唁ᯩṬ㺘⽪䍏ᵳ٬ˈᯩṬⲴབྷሿ㺘⽪ᵳⲴᮠ䟿DŽབྷ⸙䱥↓кᯩⲴ䖳
ሿⲴ⸙ᖒ㺘⽪Ӿ䘉њ䳀㯿অ‫ ࡠݳ‬30 њ䗃ࠪঅ‫Ⲵݳ‬ᵳDŽ

ALVINN Ⲵ㖁㔌㔃ᶴᱟᖸཊ ANN ѝⲴިර㔃ᶴDŽᡰᴹঅ‫࠶ݳ‬ቲӂ䘎ᖒᡀҶањᴹੁᰐ


⧟മDŽ䙊ᑨˈANN മⲴ㔃ᶴਟԕᴹᖸཊ⿽㊫ර——ᰐ⧟Ⲵᡆᴹ⧟ⲴˈᴹੁⲴᡆᰐੁⲴDŽᵜ
ㄐ䳶ѝ䇘䇪ԕ৽ੁՐ᫝㇇⌅Ѫส⹰Ⲵᴰᑨ㿱઼ᴰᇎ⭘Ⲵ ANN ᯩ⌅DŽ৽ੁՐ᫝㇇⌅‫ٷ‬ᇊ㖁㔌
ᱟањപᇊ㔃ᶴˈሩᓄањᴹੁമˈਟ㜭वਜ਼⧟DŽANN ᆖҐቡᱟѪമѝⲴ⇿аᶑ䗩䘹ਆᵳ
٬DŽቭ㇑Ḁ⿽㊫රⲴᗚ⧟ᱟ‫ݱ‬䇨ⲴˈབྷཊᮠⲴᇎ䱵ᓄ⭘䜭䟷⭘ᰐ⧟Ⲵࡽ侸㖁㔌ˈо ALVINN
֯⭘Ⲵ㖁㔌㔃ᶴ⴨լDŽ

4.3 䘸ਾ⾔㔅㖇㔒ᆜҖⲺ䰤从

ANN ᆖҐ䶎ᑨ䘲ਸҾ䘉ṧⲴ䰞仈˖䇝㓳䳶ਸѪਜ਼ᴹಚ༠Ⲵ༽ᵲՐᝏಘᮠᦞˈֻྲᶕ㠚
ᩴ‫ۿ‬ᵪ઼哖‫ݻ‬仾ⲴᮠᦞDŽᆳҏ䘲⭘Ҿ䴰㾱ᴤཊㅖਧ㺘⽪Ⲵ䰞仈ˈֻྲㅜ 3 ㄐ䇘䇪Ⲵߣㆆṁᆖ
Ґԫ࣑DŽ䘉⿽ᛵߥл ANN ઼ߣㆆṁᆖҐ㓿ᑨӗ⭏㋮ᓖབྷփ⴨ᖃⲴ㔃᷌DŽਟ৲㿱 Shavlik et al.
˄1991˅઼ Weiss and Kapouleas˄1989˅ѝ‫ޣ‬Ҿߣㆆṁ઼ ANN ᆖҐⲴᇎ傼∄䖳DŽ৽ੁՐ᫝
㇇⌅ᱟᴰᑨ⭘Ⲵ ANN ᆖҐᢰᵟDŽᆳ䘲ਸާᴹԕл⢩ᖱⲴ䰞仈˖
x ᇎֻᱟ⭘ᖸཊĀ኎ᙗ-٬āሩ㺘⽪ⲴDŽ㾱ᆖҐⲴⴞḷ࠭ᮠᱟᇊѹ൘ਟԕ⭘ੁ
䟿᧿䘠ⲴᇎֻѻкⲴˈੁ䟿⭡亴‫ݸ‬ᇊѹⲴ⢩ᖱ㓴ᡀˈֻྲ ALVINN ֻᆀѝ
Ⲵ‫ۿ‬㍐٬DŽ䘉Ӌ䗃‫ޕ‬኎ᙗѻ䰤ਟԕ儈ᓖ⴨‫ˈޣ‬ҏਟԕ⴨ӂ⤜・DŽ䗃‫ޕ‬٬ਟԕ
ᱟԫօᇎᮠDŽ
x ⴞḷ࠭ᮠⲴ䗃ࠪਟ㜭ᱟ⿫ᮓ٬ǃᇎᮠ٬ᡆ㘵⭡㤕ᒢᇎᮠ኎ᙗᡆ⿫ᮓ኎ᙗ㓴ᡀ
Ⲵੁ䟿DŽֻྲˈ൘ ALVINN ㌫㔏ѝ䗃ࠪⲴᱟ 30 њ኎ᙗⲴੁ䟿ˈ⇿ањ࠶䟿
ሩᓄањᔪ䇞Ⲵ傮傦ᯩੁDŽ⇿њ䗃ࠪ٬ᱟ 0 ઼ 1 ѻ䰤ⲴḀњᇎᮠˈሩᓄҾ൘
亴⍻⴨ᓄ傮傦ᯩੁᰦⲴ㖞ؑᓖ˄confidence˅DŽᡁԜҏਟԕ䇝㓳ањঅа㖁
㔌ˈ਼ᰦ䗃ࠪ㹼傦ᯩੁ઼ᔪ䇞Ⲵ࣐䙏ᓖˈ䘉ਚ㾱ㆰঅൠᢺ㕆⸱䘉є⿽䗃ࠪ亴
⍻Ⲵੁ䟿䘎᧕൘а䎧ቡਟԕҶDŽ
x 䇝㓳ᮠᦞਟ㜭वਜ਼䭉䈟DŽANN ᆖҐ㇇⌅ሩҾ䇝㓳ᮠᦞѝⲴ䭉䈟ᴹ䶎ᑨྭⲴ
励ἂᙗDŽ
x ਟᇩᗽ䮯ᰦ䰤Ⲵ䇝㓳DŽ㖁㔌䇝㓳㇇⌅䙊ᑨ∄‫ߣۿ‬ㆆṁᆖҐ䘉ṧⲴ㇇⌅䴰㾱ᴤ
䮯Ⲵ䇝㓳ᰦ䰤DŽ䇝㓳ᰦ䰤ਟ㜭Ӿࠐ。䫏ࡠࠐሿᰦˈ䘉㾱ⴻ㖁㔌ѝᵳ٬Ⲵᮠ䟿ǃ
㾱㘳㲁Ⲵ䇝㓳ᇎֻⲴᮠ䟿ǃԕ৺н਼ᆖҐ㇇⌅৲ᮠⲴ䇮㖞ㅹഐ㍐DŽ
x ਟ㜭䴰㾱ᘛ䙏≲ࠪⴞḷ࠭ᮠ٬DŽቭ㇑ ANN ⲴᆖҐᰦ䰤⴨ሩ䖳䮯ˈնሩᆖҐ
Ⲵ㖁㔌≲٬ˈԕ‫ׯ‬ᢺ㖁㔌ᓄ⭘ࡠਾ㔝Ⲵᇎֻˈ䙊ᑨᱟ䶎ᑨᘛ䙏ⲴDŽֻྲˈ
ALVINN ൘䖖䖶ੁࡽ㹼傦ᰦˈ⇿。ᓄ⭘ᆳⲴ⾎㓿㖁㔌㤕ᒢ⅑ˈԕнᯝൠᴤᯠ
傮傦ᯩੁDŽ
x Ӫ㊫㜭੖⨶䀓ᆖࡠⲴⴞḷ࠭ᮠᱟн䟽㾱ⲴDŽ⾎㓿㖁㔌ᯩ⌅ᆖҐࡠⲴᵳ٬㓿ᑨ
ᱟӪ㊫䳮ԕ䀓䟺ⲴDŽᆖࡠⲴ⾎㓿㖁㔌∄ᆖࡠⲴ㿴ࡉ䳮ҾՐ䗮㔉Ӫ㊫DŽ

䘉аㄐⲴަ։䜘࠶ᱟ䘉ṧ㓴㓷Ⲵ˖ᡁԜ‫ݸ‬䇘䇪䇝㓳অњঅ‫Ⲵݳ‬ᆖҐ㇇⌅ˈ਼ᰦӻ㓽㓴ᡀ
⾎㓿㖁㔌Ⲵࠐ⿽ѫ㾱অ‫ˈݳ‬वᤜᝏ⸕ಘ˄perceptron˅ǃ㓯ᙗঅ‫˄ݳ‬linear unit˅઼ sigmoid অ
‫˄ݳ‬sigmoid unit˅DŽ❦ਾ㔉ࠪ䇝㓳䘉Ӌঅ‫ݳ‬㓴ᡀⲴཊቲ㖁㔌Ⲵ৽ੁՐ᫝㇇⌅ˈᒦ㘳㲁ࠐња
㡜ᙗⲴ䰞仈ˈ∄ྲ ANN Ⲵ㺘ᖱ㜭࣋ǃ‫ٷ‬䇮オ䰤ᩌ㍒Ⲵᵜ䍘⢩ᖱǃ䗷ᓖᤏਸ䰞仈ǃԕ৺৽ੁ
Ր᫝㇇⌅ⲴਈփDŽᵜㄐҏ㔉ࠪҶањᓄ⭘৽ੁՐ᫝㇇⌅䇶࡛Ӫ㝨Ⲵ䈖㓶ֻᆀˈᒦᤷሬ䈫㘵ྲ
օਆᗇ䘉њֻᆀⲴᮠᦞ઼ԓ⸱ˈᒦ䘋а↕ᇎ傼䘉њᓄ⭘DŽ

4.4 ᝕⸛ಞ

а⿽㊫රⲴANN㌫㔏ᱟԕ㻛〠Ѫᝏ⸕ಘ˄perceptron˅Ⲵঅ‫ݳ‬Ѫส⹰Ⲵˈྲമ 4-2 ᡰ⽪DŽ


ᝏ⸕ಘԕањᇎᮠ٬ੁ䟿֌Ѫ䗃‫ˈޕ‬䇑㇇䘉Ӌ䗃‫Ⲵޕ‬㓯ᙗ㓴ਸˈ❦ਾྲ᷌㔃᷌བྷҾḀњ䰸٬
ቡ䗃ࠪ 1ˈ੖ࡉ䗃ࠪ-1DŽᴤ㋮⺞ൠˈྲ᷌䗃‫ޕ‬Ѫx1ࡠxnˈ䛓Ѹᝏ⸕ಘ䇑㇇Ⲵ䗃ࠪѪ˖

­1 if w0  w1 x1  w2 x 2    wn x n ! 0
o( x1 ,, x n ) ®
¯ 1 otherwise

ަѝ⇿ањwiᱟањᇎᮠᑨ䟿ˈᡆਛ‫ڊ‬ᵳ٬˄weight˅ˈ⭘ᶕߣᇊ䗃‫ޕ‬xiሩᝏ⸕ಘ䗃ࠪⲴ
䍑 ⥞ ⦷ DŽ 䈧 ⌘ ᜿ ˈ ᑨ 䟿 (-w0) ᱟ а њ 䰸 ٬ ˈ ᆳ ᱟ Ѫ Ҷ ֯ ᝏ ⸕ ಘ 䗃 ࠪ 1 ˈ 䗃 ‫ ࣐ Ⲵ ޕ‬ᵳ ઼

w1 x1  w2 x 2    wn x n ᗵ享䎵䗷Ⲵ䰸٬DŽ

插图——原书页码:87 к

മ 4-2 ᝏ⸕ಘ

ѪҶㆰॆ㺘⽪ˈᡁԜ‫ٷ‬ᜣᴹањ䱴࣐Ⲵᑨ䟿䗃‫ޕ‬x0=1ˈ䛓ѸᡁԜቡਟԕᢺк䗩Ⲵнㅹᔿ
& &
¦
n
߉Ѫ i 0
wi xi ! 0 ˈᡆԕੁ䟿ᖒᔿ߉Ѫ w ˜ x ! 0 DŽѪҶㆰ⸝䎧㿱ˈᡁԜᴹᰦՊᢺᝏ⸕ಘ࠭

ᮠ߉Ѫ˖
& & &
o( x ) sgn( w ˜ x )

ަѝˈ

­1 if y ! 0
sgn( y ) ®
¯ 1 otherwise

ᆖҐањᝏ⸕ಘ᜿ણ⵰䘹ᤙᵳw0, …, wnⲴ٬DŽᡰԕᝏ⸕ಘᆖҐ㾱㘳㲁Ⲵ‫ى‬䘹‫ٷ‬䇮オ䰤H
ቡᱟᡰᴹਟ㜭Ⲵᇎᮠ٬ᵳੁ䟿Ⲵ䳶ਸDŽ

& &
H {w | w  ƒ ( n 1) }
4.4.1 ᝕⸛ಞⲺ㺞ᖷ㜳࣑

ᡁԜਟԕᢺᝏ⸕ಘⴻ֌ᱟ n 㔤ᇎֻオ䰤˄ণ⛩オ䰤˅ѝⲴ䎵ᒣ䶒ߣㆆ䶒DŽሩҾ䎵ᒣ䶒а
‫Ⲵח‬ᇎֻˈᝏ⸕ಘ䗃ࠪ 1ˈሩҾਖа‫Ⲵח‬ᇎֻ䗃ࠪ-1ˈྲമ 4-3 ᡰ⽪DŽ䘉њߣㆆ䎵ᒣ䶒ᯩ〻
& &
ᱟ w ˜ x 0 DŽᖃ❦ˈḀӋ↓৽ṧֻ䳶ਸнਟ㜭㻛ԫа䎵ᒣ䶒࠶ࢢDŽ䛓Ӌਟԕ㻛࠶ࢢⲴ〠Ѫ
㓯ᙗਟ࠶˄linearly separable˅ṧֻ䳶ਸDŽ

插图——原书页码:87 л

മ 4-3 є䗃‫ޕ‬ᝏ⸕ಘ㺘⽪Ⲵߣㆆ䶒

˄a˅а㓴䇝㓳ṧ઼ֻањ㜭↓⺞࠶㊫䘉ӋṧֻⲴᝏ⸕ಘߣㆆ䶒DŽ˄b˅а㓴䶎㓯ᙗਟ࠶Ⲵ䇝㓳ṧֻ
˄ҏቡᱟн㜭⭘ԫаⴤ㓯↓⺞࠶㊫Ⲵṧֻ˅DŽx1઼x2ᱟᝏ⸕ಘⲴ䗃‫ޕ‬DŽĀ+ā㺘⽪↓ֻˈĀ-ā㺘⽪
৽ֻDŽ

অ⤜Ⲵᝏ⸕ಘਟԕ⭘ᶕ㺘⽪ᖸཊᐳቄ࠭ᮠDŽֻྲˈ‫ٷ‬ᇊ⭘ 1˄ⵏ˅઼-1˄‫˅ٷ‬㺘⽪ᐳቄ
٬ˈ䛓Ѹ֯⭘ањє䗃‫Ⲵޕ‬ᝏ⸕ಘᶕᇎ⧠о࠭ᮠ˄AND˅Ⲵа⿽ᯩ⌅ᱟ䇮㖞ᵳw0= -0.8 ᒦф
w1=w2=0.5DŽྲ᷌⭘䘉њᝏ⸕ಘᶕ㺘⽪ᡆ࠭ᮠ˄OR˅ˈ䛓Ѹਚ㾱᭩ਈᆳⲴ䰸٬w0=-0.3DŽһᇎ
кˈAND઼ORਟ㻛ⴻ֌m-of-n࠭ᮠⲴ⢩ֻ˖ҏቡᱟ㾱֯࠭ᮠ䗃ࠪѪⵏˈ䛓Ѹᝏ⸕ಘⲴnњ䗃
‫ޕ‬ѝ㠣ቁmњᗵ享ѪⵏDŽOR࠭ᮠሩᓄҾm=1ˈAND࠭ᮠሩᓄҾm=n.DŽԫ᜿m-of-n࠭ᮠਟԕᖸ
ᇩ᱃ൠ⭘ᝏ⸕ಘ㺘⽪ˈਚ㾱䇮㖞ᡰᴹ䗃‫Ⲵޕ‬ᵳѪ਼ṧⲴ٬˄ྲ 0.5˅ˈ❦ਾᦞ↔ᚠᖃൠ䇮㖞䰸
٬DŽ

ᝏ⸕ಘਟԕ㺘⽪ᡰᴹⲴ৏࿻ᐳቄ࠭ᮠ˄primitive boolean function˅˖оǃᡆǃо䶎˄NAND˅


઼ᡆ䶎˄NOR˅DŽ❦㘼нᒨⲴᱟˈаӋᐳቄ࠭ᮠᰐ⌅⭘অаⲴᝏ⸕ಘ㺘⽪ˈֻྲᔲᡆ࠭ᮠ
˄XOR˅ˈᆳᖃфӵᖃx1zx2ᰦ䗃ࠪѪ 1DŽ䈧⌘᜿മ 4-3˄b˅ѝ㓯ᙗнਟ࠶Ⲵ䇝㓳ṧᵜ䳶ሩᓄ
Ҿᔲᡆ࠭ᮠDŽ

ᝏ⸕ಘ㺘⽪оǃᡆǃо䶎ǃᡆ䶎Ⲵ㜭࣋ᱟᖸ䟽㾱ⲴˈഐѪᡰᴹⲴᐳቄ࠭ᮠ䜭ਟ㺘⽪Ѫส
Ҿ䘉Ӌ৏࿻࠭ᮠⲴӂ䘎অ‫Ⲵݳ‬Ḁњ㖁㔌DŽһᇎкˈӵ⭘єቲ␡ᓖⲴᝏ⸕ಘ㖁㔌ቡਟԕ㺘⽪ᡰ
ᴹⲴᐳቄ࠭ᮠˈ൘䘉Ӌ㖁㔌ѝ䗃‫ޕ‬㻛䘱ࡠཊњঅ‫ˈݳ‬䘉Ӌঅ‫Ⲵݳ‬䗃ࠪ㻛䗃‫ࡠޕ‬ㅜҼ㓗ˈҏᱟ
ᴰਾа㓗DŽа⿽ᯩ⌅ᱟ⭘᷀ਆ㤳ᔿ˄disjunctive normal form˅˄ҏቡᱟሩ䗃‫઼ޕ‬ᆳԜⲴ੖ᇊ
Ⲵ‫ݸ‬䘋㹼ਸਆˈ޽ሩ䘉㓴ਸਆᔿ䘋㹼᷀ਆ˅ᶕ㺘⽪ᐳቄ࠭ᮠDŽ⌘᜿ˈ㾱ᢺањ AND ᝏ⸕ಘ
Ⲵ䗃‫≲ޕ‬੖ᇊˈਚ㾱ㆰঅൠ᭩ਈ⴨ᓄ䗃‫ޕ‬ᵳⲴㅖਧDŽ

ഐѪ䰸٬অ‫Ⲵݳ‬㖁㔌ਟԕ㺘⽪བྷ䟿Ⲵ࠭ᮠˈ㘼অ⤜Ⲵঅ‫ݳ‬н㜭‫ࡠڊ‬䘉а⛩ˈᡰԕ䙊ᑨᡁ
Ԝᝏ‫ޤ‬䏓ⲴᱟᆖҐ䰸٬অ‫ݳ‬㓴ᡀⲴཊቲ㖁㔌DŽ

4.4.2 ᝕⸛ಞ䇣㓹⌋ࡏ

㲭❦ᡁԜⲴⴞⲴᱟᆖҐ⭡ཊњঅ‫ݳ‬ӂ䘎Ⲵ㖁㔌ˈնᡁԜ䘈ᱟӾྲօᆖҐঅњᝏ⸕ಘⲴᵳ
٬ᔰ࿻DŽ߶⺞ൠ䈤ˈ䘉䟼ⲴᆖҐԫ࣑ᱟߣᇊањᵳੁ䟿ˈᆳਟԕ֯ᝏ⸕ಘሩҾ㔉ᇊⲴ䇝㓳ṧ
ֻ䗃ࠪ↓⺞Ⲵ 1 ᡆ-1DŽ

ᐢ㓿⸕䚃ᴹࠐ⿽䀓ߣ䘉њᆖҐԫ࣑Ⲵ㇇⌅DŽ䘉䟼ᡁԜ㘳㲁є⿽˖ᝏ⸕ಘ⌅ࡉ઼ delta ⌅
ࡉ˄delta rule˅˄ᱟㅜ 1 ㄐѝ⭘ᶕᆖҐ䇴ՠ࠭ᮠⲴᴰሿ൷ᯩ⌅ LMS Ⲵањਈփ˅DŽ䘉є⿽㇇
⌅‫؍‬䇱᭦ᮋࡠਟ᧕ਇⲴ‫ٷ‬䇮ˈ൘н਼ⲴᶑԦл᭦ᮋࡠⲴ‫ٷ‬䇮⮕ᴹн਼DŽ䘉є⿽ᯩ⌅ሩҾ ANN
ᱟᖸ䟽㾱ⲴˈഐѪᆳԜᨀ‫׋‬ҶᆖҐཊњঅ‫ݳ‬ᶴᡀⲴ㖁㔌Ⲵส⹰DŽ

Ѫᗇࡠਟ᧕ਇⲴᵳੁ䟿ˈа⿽࣎⌅ᱟӾ䲿ᵪⲴᵳ٬ᔰ࿻ˈ❦ਾ৽༽ൠᓄ⭘䘉њᝏ⸕ಘࡠ
⇿њ䇝㓳ṧֻˈਚ㾱ᆳ䈟࠶㊫ṧֻቡ‫؞‬᭩ᝏ⸕ಘⲴᵳ٬DŽ䟽༽䘉њ䗷〻ˈⴤࡠᝏ⸕ಘ↓⺞࠶
㊫ᡰᴹⲴ䇝㓳ṧֻDŽ⇿а↕ṩᦞᝏ⸕ಘ䇝㓳⌅ࡉ˄perceptron training rule˅ᶕ‫؞‬᭩ᵳ٬ˈҏ
ቡᱟṩᦞл䶒Ⲵ⌅ࡉ‫؞‬᭩о䗃‫ޕ‬xiሩᓄⲴᵳwi:
wimwi+'wi

ަѝ
'wi =K(t-o)xi

䘉䟼 t ᱟᖃࡽ䇝㓳ṧֻⲴⴞḷ䗃ࠪˈo ᱟᝏ⸕ಘⲴ䗃ࠪˈKᱟањ↓Ⲵᑨᮠ〠ѪᆖҐ䙏
⦷˄learning rate˅DŽᆖҐ䙏⦷Ⲵ֌⭘ᱟ㕃઼⇿а↕䈳ᮤᵳⲴ〻ᓖDŽᆳ䙊ᑨ㻛䇮ѪањሿⲴᮠ
٬˄ֻྲ 0.1˅ˈ㘼фᴹᰦՊ֯ަ䲿⵰ᵳ䈳ᮤ⅑ᮠⲴ໎࣐㘼㺠߿DŽ

ѪӰѸ䘉њᴤᯠ⌅ࡉՊᡀ࣏᭦ᮋࡠ↓⺞Ⲵᵳ٬઒˛ѪҶᗇࡠⴤ㿲Ⲵᝏ㿹ˈ㘳㲁аӋ⢩
ֻDŽ‫ٷ‬ᇊ䇝㓳ṧᵜᐢ㻛ᝏ⸕ಘ↓⺞࠶㊫DŽ䘉ᰦˈ(t-o)ᱟ 0ˈ䘉֯'wiѪ 0ˈᡰԕ⋑ᴹᵳ٬㻛‫؞‬
᭩DŽ㘼ྲ᷌ᖃⴞḷ䗃ࠪᱟ+1 ᰦᝏ⸕ಘ䗃ࠪањ-1ˈ䘉⿽ᛵߥѪ֯ᝏ⸕ಘ䗃ࠪањ+1 㘼нᱟ
& &
-1ˈᵳ٬ᗵ享㻛‫؞‬᭩ԕ໎བྷ w ˜ x Ⲵ٬DŽֻྲˈྲ᷌xi>0ˈ䛓Ѹ໎བྷwiՊ֯ᝏ⸕ಘᴤ᧕䘁↓⺞
࠶㊫䘉њᇎֻDŽ⌘᜿䘉⿽ᛵߥл䇝㓳⌅ࡉՊ໎䮯wiˈഐѪ(t-o)ˈK઼xi䜭ᱟ↓ⲴDŽֻྲˈྲ᷌
xi=0.8ˈK=0.1ˈt=1ˈᒦфo= -1ˈ䛓Ѹᵳᴤᯠቡᱟ'wi =K(t-o)xi=0.1(1-(-1))0.8=0.16DŽਖаᯩ
䶒ˈྲ᷌t=-1 㘼o=1ˈ䛓Ѹ઼↓Ⲵxi‫ޣ‬㚄Ⲵᵳ٬Պ㻛߿ሿ㘼нᱟ໎བྷDŽ

һᇎкਟԕ䇱᰾ˈ൘ᴹ䲀⅑֯⭘ᝏ⸕ಘ䇝㓳⌅ࡉਾˈк䶒Ⲵ䇝㓳䗷〻Պ᭦ᮋࡠањ㜭↓
⺞࠶㊫ᡰᴹ䇝㓳ṧֻⲴᵳੁ䟿ˈࡽᨀᱟ䇝㓳ṧֻ㓯ᙗਟ࠶ˈᒦф֯⭘Ҷ‫࠶ݵ‬ሿⲴK ˄৲㿱
Minskey & Papert 1969˅DŽྲ᷌ᮠᦞнᱟ㓯ᙗਟ࠶Ⲵˈ䛓Ѹн㜭‫؍‬䇱᭦ᮋDŽ

4.4.3 ụᓜс䲃ૂ delta ⌋ࡏ

ቭ㇑ᖃ䇝㓳ṧֻ㓯ᙗਟ࠶ᰦˈᝏ⸕ಘ⌅ࡉਟԕᡀ࣏ൠ᢮ࡠањᵳੁ䟿ˈնྲ᷌ṧֻнᱟ
㓯ᙗਟ࠶ᰦᆳሶн㜭᭦ᮋDŽഐ↔ˈӪԜ䇮䇑Ҷਖањ䇝㓳⌅ࡉᶕ‫ݻ‬ᴽ䘉њн䏣ˈ〠Ѫ delta
⌅ࡉ˄delta rule˅DŽྲ᷌䇝㓳ṧᵜнᱟ㓯ᙗਟ࠶Ⲵˈ䛓Ѹ delta ⌅ࡉՊ᭦ᮋࡠⴞḷᾲᘥⲴᴰ֣
䘁լDŽ(how to converge?)

delta ⌅ࡉⲴ‫ޣ‬䭞ᙍᜣᱟ֯⭘ởᓖл䱽˄gradient descent˅ᶕᩌ㍒ਟ㜭ᵳੁ䟿Ⲵ‫ٷ‬䇮オ䰤ˈ


ԕ᢮ࡠᴰ֣ᤏਸ䇝㓳ṧֻⲴᵳੁ䟿DŽ䘉њ⌅ࡉᖸ䟽㾱ˈഐѪᆳᨀ‫׋‬Ҷ৽ੁՐ᫝㇇⌅Ⲵส⹰ˈ
㘼৽ੁՐ᫝㇇⌅㜭ཏᆖҐཊњঅ‫Ⲵݳ‬ӂ䘎㖁㔌DŽ䘉њ⌅ࡉ䟽㾱ᙗⲴਖањ৏ഐᱟˈሩҾवਜ਼
ཊ⿽н਼㊫රⲴ䘎㔝৲ᮠॆ‫ٷ‬䇮Ⲵ‫ٷ‬䇮オ䰤ˈởᓖл䱽ᱟᗵ享䙽শ䘉ṧⲴ‫ٷ‬䇮オ䰤Ⲵᡰᴹᆖ
Ґ㇇⌅Ⲵส⹰DŽ

ᴰྭᢺ delta 䇝㓳⌅ࡉ⨶䀓Ѫ䇝㓳ањᰐ䰸٬Ⲵᝏ⸕ಘˈҏቡᱟањ㓯ᙗঅ‫˄ݳ‬linear


unit˅ˈᆳⲴ䗃ࠪ o ྲл˖
& & &
o( x ) w˜ x (4.1)
Ҿᱟˈањ㓯ᙗঅ‫ݳ‬ሩᓄҾᝏ⸕ಘⲴㅜа䱦⇥ˈнᑖᴹ䰸٬DŽ

ѪҶ᧘ሬ㓯ᙗঅ‫Ⲵݳ‬ᵳ٬ᆖҐ⌅ࡉˈ‫ݸ‬ᤷᇊањᓖ䟿ḷ߶ᶕ㺑䟿‫ٷ‬䇮˄ᵳੁ䟿˅⴨ሩҾ
䇝㓳ṧֻⲴ䇝㓳䈟ᐞ˄training error˅
DŽቭ㇑ᴹᖸཊ࣎⌅ᇊѹ䘉њ䈟ᐞˈањᑨ⭘Ⲵ⢩࡛ᯩ‫ׯ‬
Ⲵᓖ䟿ḷ߶Ѫ˖

& 1
E ( w) ¦
2 dD
(t d  od ) 2 ˄4.2˅

ަѝDᱟ䇝㓳ṧֻ䳶ਸˈtdᱟ䇝㓳ṧֻdⲴⴞḷ䗃ࠪˈodᱟ㓯ᙗঅ‫ݳ‬ሩ䇝㓳ṧֻdⲴ䗃ࠪDŽ
&
൘䘉њᇊѹѝˈ E (w) ᱟⴞḷ䗃ࠪtd઼㓯ᙗঅ‫ݳ‬䗃ࠪodⲴᐞᔲⲴᒣᯩ൘ᡰᴹⲴ䇝㓳ṧֻк≲
&
઼ਾ޽䲔ԕ 2DŽ䘉䟼ᡁԜᢺEᇊѪ w Ⲵ࠭ᮠˈᱟഐѪ㓯ᙗঅ‫Ⲵݳ‬䗃ࠪo‫׍‬䎆Ҿ䘉њᵳੁ䟿DŽᖃ
❦Eҏ‫׍‬䎆Ҿ⢩ᇊⲴ䇝㓳ṧֻ䳶ਸˈնᡁԜ䇔ѪᆳԜ൘䇝㓳ᵏ䰤ᱟപᇊⲴˈᡰԕнᗵ哫✖ൠ
ᢺE߉Ѫ䇝㓳ṧֻⲴ࠭ᮠDŽㅜ 6 ㄐ㔉ࠪҶ䘹ᤙ䘉⿽EᇊѹⲴа⿽䍍ਦᯟ䇪䇱DŽ⺞࠷ൠ䇢ˈ൘
䛓䟼ᡁԜᤷࠪҶ൘аᇊᶑԦлˈሩҾ㔉ᇊⲴ䇝㓳ᮠᦞ֯EᴰሿॆⲴ‫ٷ‬䇮ҏቡᱟHѝᴰਟ㜭Ⲵ
‫ٷ‬䇮DŽ

4.4.3.1 ᖘ䊗ौ‫ٽ‬䇴グ䰪

ѪҶ⨶䀓ởᓖл䱽㇇⌅ˈᖒ䊑ൠ㺘⽪ᮤњ‫ٷ‬䇮オ䰤ᱟᴹᑞࣙⲴˈമ 4-4 ⭫ࠪҶवਜ਼ਟ㜭


ᵳੁ䟿Ⲵᮤњ‫ٷ‬䇮オ䰤઼ооᆳԜ⴨‫ޣ‬㚄ⲴE٬DŽ䘉䟼ˈ඀ḷ䖤w0ˈw1㺘⽪ањㆰঅⲴ㓯ᙗ
অ‫ݳ‬ѝєњᵳⲴਟ㜭Ⲵਆ٬DŽ㓥䖤ᤷࠪ⴨ሩҾḀപᇊⲴ䇝㓳ṧֻⲴ䈟ᐞEDŽഐ↔മѝⲴ䈟ᐞ
ᴢ䶒ᾲᤜҶ‫ٷ‬䇮オ䰤ѝ⇿ањᵳੁ䟿ⲴԱᵋᓖ˄desirability˅
˄ᡁԜԱᵋᗇࡠањާᴹᴰሿ䈟
ᐞⲴ‫ٷ‬䇮˅DŽྲ᷌㔉ᇊҶ⭘ᶕᇊѹEⲴᯩ⌅ˈ䛓ѸሩҾ㓯ᙗঅ‫ˈݳ‬䘉њ䈟ᐞᴢ䶒ᗵ❦ᱟާᴹ
অа‫ޘ‬ተᴰሿ٬Ⲵᣋ⢙䶒DŽᖃ❦ˈާփⲴᣋ⢙䶒ᖒ⣦‫׍‬䎆ҾާփⲴ䇝㓳ṧֻ䳶ਸDŽ

插图——原书页码:90

മ 4-4 н਼‫ٷ‬䇮Ⲵ䈟ᐞ

ሩҾᴹєњᵳ٬Ⲵ㓯ᙗঅ‫ٷˈݳ‬䇮オ䰤Hቡᱟw0,w1ᒣ䶒DŽ㓥䖤㺘⽪оപᇊⲴ䇝㓳ṧֻ䳶ਸ⴨ᓄⲴᵳ
ੁ䟿‫ٷ‬䇮Ⲵ䈟ᐞDŽ㇝ཤᱮ⽪Ҷ䈕⛩ởᓖⲴ⴨৽ᯩੁˈᤷࠪҶ൘w0ˈw1ᒣ䶒ѝ⋯䈟ᐞᴢ䶒ᴰ䲑ጝл䱽
ⲴᯩੁDŽ

ởᓖл䱽ᩌ㍒⺞ᇊањ֯ E ᴰሿॆⲴᵳੁ䟿Ⲵᯩ⌅ᱟӾањԫ᜿Ⲵࡍ࿻ᵳੁ䟿ᔰ࿻ˈ
❦ਾԕᖸሿⲴ↕Հ৽༽‫؞‬᭩䘉њੁ䟿DŽ൘⇿а↕ˈ᤹➗⋯䈟ᐞᴢ䶒ӗ⭏ᴰ䲑ጝл䱽Ⲵᯩੁ‫؞‬
᭩ᵳੁ䟿˄৲㿱മ 4-4˅
DŽ㔗㔝䘉њ䗷〻ⴤࡠࡠ䗮‫ޘ‬ተⲴᴰሿ䈟ᐞDŽ

4.4.3.2 ụᓜс䲃⌋ࡏⲺ᧞ሲ
&
ᡁԜᘾṧ㜭䇑㇇ࠪ⋯䈟ᐞᴢ䶒ᴰ䲑ጝл䱽Ⲵᯩੁ઒˛ਟԕ䙊䗷䇑㇇ E ⴨ሩੁ䟿 w Ⲵ⇿
&
њ࠶䟿Ⲵሬᮠᶕᗇࡠ䘉њᯩੁDŽ䘉њੁ䟿ሬᮠ㻛〠Ѫ E ሩҾ w Ⲵởᓖ˄gradient˅ˈ䇠֌
&
’E (w) DŽ
& ª wE wE wE º
’E ( w) « , , , » ˄4.3˅
¬ ww0 ww1 wwn ¼

&
⌘᜿ ’E (w) ᵜ䓛ᱟањੁ䟿ˈᆳⲴᡀઈᱟEሩ⇿њwiⲴ‫ٿ‬ሬᮠDŽ当梯度被解释为权空间

的一个向量时,它确定了使E最陡峭上升的方向。ᡰԕ䘉њੁ䟿Ⲵ৽ᯩੁ㔉ࠪҶᴰ䲑ጝл䱽
&
ⲴᯩੁDŽֻྲˈമ 4-4 ѝⲴ㇝ཤᱮ⽪Ҷw0ˈw1ᒣ䶒Ⲵањ⢩ᇊ⛩Ⲵ䍏ởᓖ  ’E (w) DŽ

ᰒ❦ởᓖ⺞ᇊҶ E ᴰ䲑ጝкॷⲴᯩੁˈ䛓Ѹởᓖл䱽Ⲵ䇝㓳⌅ࡉᱟ˖
& & &
w m w  'w
ަѝ
& &
'w K ’E (w) ˄4.4˅

䘉䟼Kᱟањ↓Ⲵᑨᮠਛ‫ڊ‬ᆖҐ䙏⦷ˈᆳߣᇊởᓖл䱽ᩌ㍒ѝⲴ↕䮯DŽަѝⲴ䍏ਧᱟഐ
ѪᡁԜᜣ㾱䇙ᵳੁ䟿ੁ E л䱽Ⲵᯩੁ〫ࣘDŽ䘉њ䇝㓳⌅ࡉҏਟԕ߉ᡀᆳⲴ࠶䟿ᖒᔿ˖
wimwi+'wi

ަѝ

wE
'wi K ˄4.5˅
wwi

wE &
䘉ṧᖸ␵ᾊˈᴰ䲑ጝⲴл䱽ਟԕ䙊䗷᤹∄ֻ ᭩ਈ w Ⲵ⇿а࠶䟿wiᶕᇎ⧠DŽ
wwi

㾱ᖒᡀањṩᦞㅹᔿ˄4.5˅䘝ԓᴤᯠᵳⲴᇎ⭘㇇⌅ˈᡁԜ䴰㾱ањ儈᭸Ⲵᯩ⌅൘⇿а
↕䇑㇇䘉њởᓖDŽᒨ䘀Ⲵᱟˈ䇑㇇䗷〻ᒦнഠ䳮DŽᡁԜਟԕӾ‫ޜ‬ᔿ˄4.2˅ѝ䇑㇇ E Ⲵᗞ࠶ˈ
wE
Ӿ㘼ᗇࡠ㓴ᡀ䘉њởᓖੁ䟿Ⲵ࠶䟿 DŽ䗷〻ྲл˖
wwi

wE w 1
wwi
¦
wwi 2 dD
(t d  od ) 2

1 w
¦
2 dD wwi
(t d  od ) 2

1 w
¦
2 dD
2(t d  od )
wwi
(t d  od )

w & &
¦ (t
d D
d  od )
wwi
(t d  w ˜ x d )
wE
wwi
¦ (t
d D
d  o d )( xid ) ˄4.6˅

ަѝxid㺘⽪䇝㓳ṧֻdⲴањ䗃‫࠶ޕ‬䟿xiDŽ⧠൘ᡁԜᴹҶањㅹᔿˈ㜭ཏ⭘㓯ᙗঅ‫Ⲵݳ‬
wE
䗃‫ޕ‬xidǃ䗃ࠪodǃԕ৺䇝㓳ṧֻⲴⴞḷ٬td㺘⽪ DŽᢺㅹᔿ˄4.6˅ԓ‫ޕ‬ㅹᔿ˄4.5˅‫ׯ‬ᗇࡠ
wwi

Ҷởᓖл䱽ᵳ٬ᴤᯠ⌅ࡉDŽ

'wi K ¦ (t d  od ) xid ˄4.7˅


d D

ᾲ㘼䀰ѻˈ䇝㓳㓯ᙗঅ‫Ⲵݳ‬ởᓖл䱽㇇⌅ྲл˖䘹ਆањࡍ࿻Ⲵ䲿ᵪᵳੁ䟿˗ᓄ⭘㓯ᙗ
অ‫ࡠݳ‬ᡰᴹⲴ䇝㓳ṧֻˈ❦ਾṩᦞ‫ޜ‬ᔿ˄4.7˅䇑㇇⇿њᵳ٬Ⲵ'wi˗䙊䗷࣐к'wiᶕᴤᯠ⇿
њᵳ٬ˈ❦ਾ䟽༽䘉њ䗷〻DŽ䘉њ㇇⌅㻛ᖂ㓣൘㺘˄4.1˅ѝDŽഐѪ䈟ᐞᴢ䶒ӵवਜ਼ањ‫ޘ‬
ተⲴᴰሿ٬ˈᡰԕᰐ䇪䇝㓳ṧᵜᱟ੖㓯ᙗਟ࠶ˈ䘉њ㇇⌅Պ᭦ᮋࡠާᴹᴰሿ䈟ᐞⲴᵳੁ䟿ˈ
ᶑԦᱟᗵ享֯⭘ањ䏣ཏሿⲴᆖҐ䙏⦷KDŽྲ᷌Kཚབྷˈởᓖл䱽ᩌ㍒ቡᴹ䎺䗷䈟ᐞᴢ䶒ᴰ
ሿ٬Ⲵড䲙ˈ㘼нᱟ‫⮉ڌ‬൘䛓а⛩DŽഐ↔ˈሩ↔㇇⌅Ⲵа⿽ᑨ⭘Ⲵ᭩䘋ᱟ䲿⵰ởᓖл䱽↕ᮠ
Ⲵ໎࣐䙀⑀߿ሿKⲴ٬DŽ

㺘 4-1 䇝㓳㓯ᙗঅ‫Ⲵݳ‬ởᓖл䱽㇇⌅

㾱ᇎ⧠ởᓖл䱽Ⲵ䲿ᵪ䘁լˈࡐ䲔ᔿ(T4.2)ˈᒦᢺᔿ(T4.1)ᴯᦒѪwi mwi +K(t-o)xiDŽ

Gradient-Descent(training_examples, K)
& &
training_examples ѝ⇿ањ䇝㓳ṧֻᖒᔿѪᒿ‫ <ڦ‬x , t>ˈަѝ x ᱟ䗃‫ޕ‬٬ੁ䟿ˈt ᱟⴞ
ḷ䗃ࠪ٬DŽKᱟᆖҐ䙏⦷˄ֻྲ 0.05˅ DŽ

z ࡍ࿻ॆ⇿њwiѪḀњሿⲴ䲿ᵪ٬

z 䙷ࡠ㓸→ᶑԦѻࡽˈ‫ڊ‬ԕл᫽֌˖

z ࡍ࿻ॆ⇿њ'wiѪ 0
&
z ሩҾ䇝㓳ṧֻ training_examples ѝⲴ⇿њ< x , t>ˈ‫˖ڊ‬
&
z ᢺᇎֻ x 䗃‫↔ࡠޕ‬অ‫ˈݳ‬䇑㇇䗃ࠪ o

z ሩҾ㓯ᙗঅ‫⇿Ⲵݳ‬њᵳwiˈ‫ڊ‬
'wi m'wi +K(t-o)xi ˄T4.1˅

z ሩҾ㓯ᙗঅ‫⇿Ⲵݳ‬њᵳwiˈ‫ڊ‬
wim wi +'wi ˄T4.2˅
4.4.3.3 ụᓜс䲃Ⲻ䳅ᵰ䘇ղ

ởᓖл䱽ᱟа⿽䟽㾱Ⲵ䙊⭘ᆖҐ㤳රDŽᆳᱟᩌ㍒ᓎབྷ‫ٷ‬䇮オ䰤ᡆᰐ䲀‫ٷ‬䇮オ䰤Ⲵа⿽ㆆ
⮕ˈᆳਟᓄ⭘Ҿ┑䏣ԕлᶑԦⲴԫօᛵߥ˖˄1˅‫ٷ‬䇮オ䰤वਜ਼䘎㔝৲ᮠॆⲴ‫ٷ‬䇮˄ֻྲˈа
њ㓯ᙗঅ‫Ⲵݳ‬ᵳ٬˅˗˄2˅䈟ᐞሩҾ䘉Ӌ‫ٷ‬䇮৲ᮠਟᗞDŽᓄ⭘ởᓖл䱽Ⲵѫ㾱ᇎ䐥䰞仈ᱟ˖
˄1˅ᴹᰦ᭦ᮋ䗷〻ਟ㜭䶎ᑨធ˄ᆳਟ㜭䴰㾱ᮠॳ↕Ⲵởᓖл䱽˅˗˄2˅ྲ᷌൘䈟ᐞᴢ䶒кᴹ
ཊњተ䜘ᶱሿ٬ˈ䛓Ѹн㜭‫؍‬䇱䘉њ䗷〻Պ᢮ࡠ‫ޘ‬ተᴰሿ٬DŽ

㕃䀓䘉Ӌഠ䳮Ⲵањᑨ㿱Ⲵởᓖл䱽ਈփ㻛〠Ѫ໎䟿ởᓖл䱽˄incremental gradient
descent˅ˈᡆ䲿ᵪởᓖл䱽˄stochastic gradient descent˅DŽ䢤Ҿ

‫ޜ‬ᔿ˄4.7˅㔉ࠪⲴởᓖл䱽䇝㓳⌅ࡉ൘ሩ D ѝⲴᡰᴹ䇝㓳ṧֻ≲઼ਾ䇑㇇ᵳ٬ᴤᯠˈ
䲿ᵪởᓖл䱽Ⲵᙍᜣᱟṩᦞ⇿њঅ⤜ṧֻⲴ䈟ᐞ໎䟿ൠ䇑㇇ᵳ٬ᴤᯠˈᗇࡠ䘁լⲴởᓖл䱽
ᩌ㍒DŽ‫؞‬᭩ਾⲴ䇝㓳⌅ࡉо‫ޜ‬ᔿ˄4.7˅㔉ࠪⲴ⴨լˈਚᱟ൘䘝ԓ䇑㇇⇿њ䇝㓳ṧֻᰦṩᦞ
л䶒Ⲵ‫ޜ‬ᔿᶕᴤᯠᵳ٬
'wi =K(t-o)xi ˄4.10˅

ަѝtˈoˈ઼xi࠶࡛ᱟⴞḷ٬ǃঅ‫ݳ‬䗃઼ࠪㅜiњ䇝㓳ṧֻⲴ䗃‫ޕ‬DŽ㾱‫؞‬᭩㺘 4-1 Ⲵởᓖ


л䱽㇇⌅ˈਚ㾱ㆰঅൠࡐ䲔˄T4.2˅ᔿᒦᢺᔿ˄T4.1˅ᴯᦒѪwi mwi +K(t-o)xiDŽⴻᖵ䲿ᵪở
&
ᓖл䱽Ⲵа⿽ᯩ⌅ᱟ㘳㲁Ѫ⇿њঅ⤜Ⲵ䇝㓳ṧֻdᇊѹн਼Ⲵ䈟ᐞ࠭ᮠEd( w )˖
& 1
E d ( w) (t d  o d ) 2 ˄4.11˅
2
ަѝtd઼odᱟ䇝㓳ṧֻdⲴⴞḷ䗃ࠪ٬઼অ‫ݳ‬䗃ࠪ٬DŽ䲿ᵪởᓖл䱽䘝ԓ䇑㇇䇝㓳ṧֻ䳶
&
DⲴ⇿њṧֻdˈ൘⇿⅑䘝ԓ䗷〻ѝ᤹➗‫ޣ‬ҾEd( w )Ⲵởᓖᶕ᭩ਈᵳ٬DŽ൘䘝ԓᡰᴹ䇝㓳ṧֻ
&
ᰦˈ䘉Ӌᵳ٬ᴤᯠⲴᒿࡇ㔉ࠪҶሩҾ৏ᶕⲴ䈟ᐞ࠭ᮠE( w )Ⲵởᓖл䱽Ⲵањਸ⨶䘁լDŽ䙊
䗷֯K˄ởᓖл䱽Ⲵ↕䮯˅Ⲵ٬䏣ཏሿˈਟԕ֯䲿ᵪởᓖл䱽ԕԫ᜿〻ᓖ᧕䘁Ҿⵏᇎởᓖл
䱽DŽḷ߶Ⲵởᓖл䱽઼䲿ᵪⲴởᓖл䱽ѻ䰤Ⲵ‫ޣ‬䭞४࡛ᱟ˖
x ൘ḷ߶Ⲵởᓖл䱽ѝˈᱟ൘ᵳ٬ᴤᯠࡽሩᡰᴹṧֻ≷ᙫ䈟ᐞˈ❦㘼൘䲿ᵪⲴ
ởᓖл䱽ѝˈᵳ٬ᱟ䙊䗷㘳ḕ⇿њ䇝㓳ᇎֻᶕᴤᯠⲴDŽ
x ൘ḷ߶Ⲵởᓖл䱽ѝᵳ٬ᴤᯠⲴ⇿а↕ሩཊњṧֻ≲઼ˈ䘉䴰㾱ᴤཊⲴ䇑
㇇DŽਖаᯩ䶒ˈഐѪ֯⭘ⵏ↓Ⲵởᓖˈḷ߶Ⲵởᓖл䱽ሩҾ⇿а⅑ᵳ٬ᴤᯠ
㓿ᑨ֯⭘∄䲿ᵪởᓖл䱽ᴹ䖳བྷⲴ↕䮯DŽ
&
x ྲ᷌E( w )ᴹཊњተ䜘ᶱሿ٬ˈ䲿ᵪⲴởᓖл䱽ᴹᰦਟ㜭䚯‫ݽ‬䲧‫ޕ‬䘉Ӌተ䜘
& &
ᶱሿ٬ˈഐѪᆳ֯⭘н਼Ⲵ’Ed( w )㘼нᱟ’E˄ w ˅ᶕᕅሬᩌ㍒DŽ

൘ᇎ䐥ѝˈᰐ䇪ᱟ䲿ᵪⲴ䘈ᱟḷ߶Ⲵởᓖл䱽ᯩ⌅䜭㻛ᒯ⌋ᓄ⭘DŽ

‫ ޜ‬ᔿ ˄ 4.10 ˅ ѝ Ⲵ 䇝 㓳 ⌅ ࡉ 㻛 〠 Ѫ ໎ 䟿 ⌅ ࡉ ˄ delta rule ˅ˈ ᡆ ᴹ ᰦ ਛ LMS ⌅ ࡉ


˄least-mean-square ᴰሿ൷ᯩ˅ǃAdaline ⌅ࡉǃᡆ Windrow-Hoff ⌅ࡉ˄ԕᆳⲴਁ᰾㘵ભ਽˅DŽ
൘ㅜ 1 ㄐѝ᧿䘠Ҷᆳ൘ᆖҐঊᔸ䰞仈Ⲵ䇴ՠ࠭ᮠѝⲴᓄ⭘ˈᖃᰦᡁԜ〠ᆳѪ LMS ᵳ٬ᴤᯠ
⌅ࡉDŽ⌘᜿‫ޜ‬ᔿ˄4.10˅Ⲵ໎䟿⌅ࡉо 4.4.2 㢲Ⲵᝏ⸕ಘ䇝㓳⌅ࡉ⴨լDŽһᇎкєњ㺘䗮ᔿ
& & &
ⴻ䎧ᶕᆼ‫ޘ‬а㠤DŽ❦㘼ᆳԜᱟн਼Ⲵˈ ഐѪ൘໎䟿⌅ࡉѝ o ᱟᤷ㓯ᙗঅ‫Ⲵݳ‬䗃ࠪ o( x )= w ˜ x ˈ
& & &
㘼ሩҾᝏ⸕ಘ⌅ࡉˈo ᱟᤷ䰸٬䗃ࠪ o( x )=sgn( w ˜ x )DŽ

ቭ㇑ᡁԜ㔉ࠪⲴ໎䟿⌅ࡉਟᆖҐ䶎䰸٬㓯ᙗঅ‫Ⲵݳ‬ᵳˈնᆳҏਟԕᯩ‫ׯ‬ൠ⭘ᶕ䇝㓳ᴹ䰸
& & & &
٬Ⲵᝏ⸕ಘঅ‫ݳ‬DŽ‫ٷ‬ᇊ o= w ˜ x ᱟк䶒Ⲵ䶎䰸٬㓯ᙗঅ‫Ⲵݳ‬䗃ࠪˈᒦф oc=sgn˄ w ˜ x ˅ᱟ o
㻛䰸٬ॆⲴ㔃᷌ˈо൘ᝏ⸕ಘѝаṧDŽ⧠൘ྲ᷌ᡁԜᐼᵋѪ oc䇝㓳ањᝏ⸕ಘ֯ަᤏਸⴞḷ
٬Ѫr1 Ⲵ䇝㓳ṧֻˈਟԕ֯⭘о䇝㓳 o аṧⲴⴞḷ٬઼䇝㓳ṧֻˈн䗷֯⭘໎䟿⌅ࡉDŽᖸ
᰾ᱮˈྲ᷌䶎䰸٬䗃ࠪ o 㜭ཏ㻛䇝㓳ࡠᆼ㖾ᤏਸ䘉Ӌ٬ˈ䛓Ѹ䰸٬䗃ࠪ oc ҏՊᤏਸᆳԜ˄ഐ
Ѫ sgn(1)=1ˈ઼ sgn(-1)=-1˅DŽণ֯н㜭ᆼ㖾ൠᤏਸⴞḷ٬ˈਚ㾱㓯ᙗঅ‫Ⲵݳ‬䗃ࠪާᴹ↓⺞Ⲵ
ㅖਧˈᴹ䰸٬Ⲵ oc٬Պ↓⺞ൠᤏਸⴞḷ٬r1DŽ❦㘼⌘᜿ˈ⭡Ҿ䘉њ䗷〻Պᗇࡠ֯㓯ᙗঅ‫ݳ‬䗃
ࠪⲴ䈟ᐞᴰሿॆⲴᵳ٬ˈ䘉Ӌᵳ٬н㜭‫؍‬䇱ҏ֯ᴹ䰸٬䗃ࠪ ocⲴ䈟࠶㊫ṧֻᮠᴰሿॆDŽ

4.4.4 ቅ㔉

ᡁԜᐢ㓿⹄ウҶ䘝ԓᆖҐᝏ⸕ಘᵳ٬Ⲵєњ⴨լⲴ㇇⌅DŽ䘉єњ㇇⌅䰤Ⲵ‫ޣ‬䭞ᐞᔲᱟᝏ
⸕ಘ䇝㓳⌅ࡉṩᦞ䰸٬ॆ˄thresholded˅Ⲵᝏ⸕ಘ䗃ࠪⲴ䈟ᐞᴤᯠᵳ٬˄4.4.2˅ˈ❦㘼໎䟿
⌅ࡉṩᦞ䗃‫Ⲵޕ‬䶎䰸٬ॆ˄unthresholded˅㓯ᙗ㓴ਸⲴ䈟ᐞᶕᴤᯠᵳ(4.4.3)DŽ

䘉єњ䇝㓳⌅ࡉ䰤Ⲵᐞᔲ৽᱐൘н਼Ⲵ᭦ᮋ⢩ᙗкDŽᝏ⸕ಘ䇝㓳⌅ࡉ㓿䗷ᴹ䲀⅑Ⲵ䘝ԓ
᭦ᮋࡠањ㜭⨶ᜣ࠶㊫䇝㓳ᮠᦞⲴ‫ٷ‬䇮ˈնᶑԦᱟ䇝㓳ṧֻ㓯ᙗਟ࠶DŽ໎䟿⌅ࡉ⑀䘁᭦ᮋࡠ
ᴰሿ䈟ᐞ‫ٷ‬䇮ˈਟ㜭䴰㾱ᰐ䲀Ⲵᰦ䰤ˈնᰐ䇪䇝㓳ṧֻᱟ੖㓯ᙗਟ࠶䜭Պ᭦ᮋDŽ‫ޣ‬Ҿԕк᭦
ᮋᙗⲴ䈖㓶䇱᰾ਟԕ৲㘳 Hertz et al.˄1991˅DŽ

ᆖҐᵳੁ䟿Ⲵㅜй⿽ਟ㜭ᯩ⌅ᱟ㓯ᙗ㿴ࡂ˄linear programming˅DŽ㓯ᙗ㿴ࡂᱟ䀓㓯ᙗн
& & & &
ㅹᔿᯩ〻㓴Ⲵа⿽䙊⭘Ⲵᴹ᭸ᯩ⌅DŽ⌘᜿⇿њ䇝㓳ṧֻሩᓄањᖒᔿѪ w ˜ x >0 ᡆ w ˜ x d0
ⲴнㅹᔿˈᒦфᆳԜⲴ䀓ቡᱟᡁԜᵏᵋⲴᵳੁ䟿DŽнᒨⲴᱟˈ䘉⿽ᯩ⌅ӵᖃ䇝㓳ṧֻ㓯ᙗਟ
࠶ᰦᴹ䀓ˈն Duda & Hart ˄1973ˈp.168˅ᔪ䇞Ҷа⿽ᴤᐗ࿉Ⲵᯩ⌅䘲ਸ䶎㓯ᙗਟ࠶Ⲵᛵ
ߥDŽᰐ䇪ྲօˈ䘉⿽㓯ᙗ㿴ࡂⲴᯩ⌅н㜭ᢙኅࡠ䇝㓳ཊቲ㖁㔌ˈ䘉ᱟᡁԜᴰ‫ޣ‬ᗳⲴDŽ⴨৽ˈ
↓ྲла㢲ᡰ䇘䇪ⲴˈสҾ໎䟿⌅ࡉⲴởᓖл䱽ᯩ⌅ਟԕㆰঅൠᢙኅࡠཊቲ㖁㔌DŽ

4.5 ཐቸ㖇㔒ૂਃੇՖ᫣㇍⌋

↓ྲ 4.4.1 㢲ᡰᤷࠪⲴˈঅњᝏ⸕ಘӵ㜭㺘⽪㓯ᙗߣㆆ䶒DŽ⴨৽ˈ৽ੁՐ᫝㇇⌅ᡰᆖҐ
Ⲵཊቲ㖁㔌㜭ཏ㺘⽪⿽㊫㑱ཊⲴ䶎㓯ᙗᴢ䶒DŽֻྲˈമ 4-5 ᧿䘠ҶањިරⲴཊቲ㖁㔌઼ᆳ
Ⲵߣㆆᴢ䶒DŽ䘉њ䈝丣䇶࡛ԫ࣑㾱४࠶ࠪ⧠൘Āh_dāкл᮷ѝⲴ 10 ⿽‫ݳ‬丣˄ֻྲˈĀhidāˈ
ĀhadāˈĀheadāˈĀhoodāㅹ˅DŽ䗃‫Ⲵޕ‬䈝丣ؑਧ⭘єњ৲ᮠ㺘⽪ˈᆳԜᱟ䙊䗷ሩ༠丣Ⲵ仁䉡
࠶᷀ᗇࡠⲴˈ䘉ṧᡁԜਟԕᯩ‫ׯ‬ൠ൘Ҽ㔤ᇎֻオ䰤ѝᱮ⽪ࠪߣㆆ䶒DŽྲമਟ㿱ˈཊቲ㖁㔌㜭
ཏ㺘⽪儈ᓖ䶎㓯ᙗⲴߣㆆ䶒ˈᆳ∄ࡽ䶒മ 4-3 ѝ⭫ࠪⲴঅњঅ‫Ⲵݳ‬㓯ᙗߣㆆ䶒㺘ᖱ㜭࣋ᴤ
ᕪDŽ

插图——原书页码:96 к

മ 4-5 ཊቲࡽ侸㖁㔌Ⲵߣㆆ४ฏ

䘉䟼ᱮ⽪Ⲵ㖁㔌ᱟ⭘ᶕ䇝㓳䇶࡛ 10 ⿽ࠪ⧠൘Āh_dā˄ֻྲĀhadāˈĀhidā˅䰤Ⲵ‫ݳ‬丣DŽ䘉њ㖁
㔌Ⲵ䗃‫⭡ޕ‬єњ৲ᮠ F1 ઼ F2 㓴ᡀˈᆳԜᱟ䙊䗷ሩ༠丣Ⲵ仁䉡࠶᷀ᗇࡠⲴDŽ㖁㔌Ⲵ 10 њ䗃ࠪሩᓄ
Ҿ 10 њਟ㜭Ⲵ‫ݳ‬丣DŽ䘉њ㖁㔌Ⲵ亴⍻ᱟަѝᴹᴰབྷ٬Ⲵ䗃ࠪDŽਣമ⭫ࠪҶᆖࡠⲴ㖁㔌ᡰԓ㺘Ⲵ儈
ᓖ䶎㓯ᙗߣㆆ䶒DŽമѝⲴ⛩㺘⽪⍻䈅ṧֻˈᆳԜо⭘ᶕ䇝㓳䘉њ㖁㔌Ⲵṧֻᱟᆼ‫ޘ‬н਼ⲴDŽ˄㓿䇨
ਟ᪈㠚 Haung & Lippmann˄1988˅˅

ᵜ㢲䇘䇪ྲօᆖҐ䘉ṧⲴཊቲ㖁㔌ˈ֯⭘Ⲵ㇇⌅઼ࡽ䶒䇘䇪Ⲵởᓖл䱽ᯩ⌅⴨լDŽ

4.5.1 ਥᗤ䰾‫ٲ‬ঋ‫ݹ‬

ᓄ䈕֯⭘ӰѸ㊫රⲴঅ‫ݳ‬ᶕ֌Ѫᶴᔪཊቲ㖁㔌Ⲵส⹰˛䎧ࡍᡁԜਟԕቍ䈅䘹ᤙࡽ䶒䇘
䇪Ⲵ㓯ᙗঅ‫ˈݳ‬ഐѪᡁԜᐢ㓿Ѫ䘉⿽অ‫ݳ‬ሬࠪҶањởᓖл䱽ᆖҐ⌅ࡉDŽ❦㘼ˈཊњ㓯ᙗঅ
‫Ⲵݳ‬䘎᧕ӽᰗӗ⭏㓯ᙗ࠭ᮠˈ㘼ᡁԜᴤᐼᵋ䘹ᤙ㜭ཏ㺘ᖱ䶎㓯ᙗ࠭ᮠⲴ㖁㔌DŽᝏ⸕ಘঅ‫ݳ‬ᱟ
ਖа⿽䘹ᤙˈնᆳⲴн䘎㔝䰸٬֯ᆳнਟᗞˈᡰԕн䘲ਸởᓖл䱽㇇⌅DŽᡁԜᡰ䴰㾱Ⲵᱟ䘉
ṧⲴঅ‫ˈݳ‬ᆳⲴ䗃ࠪᱟ䗃‫Ⲵޕ‬䶎㓯ᙗ࠭ᮠˈᒦф䗃ࠪᱟ䗃‫Ⲵޕ‬ਟᗞ࠭ᮠDŽа⿽ㆄṸᱟ sigmoid
অ‫˄ݳ‬sigmoid unit˅ˈ䘉ᱟа⿽䶎ᑨ㊫լҾᝏ⸕ಘⲴঅ‫ˈݳ‬նᆳสҾањᒣ━Ⲵਟᗞ䰸٬࠭
ᮠDŽ

插图——原书页码:96 л

മ 4-6 sigmoid 䰸٬অ‫ݳ‬

മ 4-6 ⭫ࠪҶ sigmoid অ‫ݳ‬DŽоᝏ⸕ಘ⴨լˈsigmoid অ‫ݸݳ‬䇑㇇ᆳⲴ䗃‫Ⲵޕ‬㓯ᙗ㓴ਸˈ


❦ਾᓄ⭘ањ䰸٬ࡠ↔㔃᷌DŽ❦㘼ˈሩҾ sigmoid অ‫ˈݳ‬䰸٬䗃ࠪᱟ䗃‫Ⲵޕ‬䘎㔝࠭ᮠDŽᴤ㋮
⺞ൠ䇢ˈsigmoid অ‫ݳ‬䘉ṧ䇑㇇ᆳⲴ䗃ࠪ˖
& &
o=V ( w ˜ x )

ަѝ
1
V ( y) ˄4.12˅
1  e y
V 㓿ᑨ㻛〠Ѫsigmoid࠭ᮠᡆ㘵ҏਟԕ〠Ѫlogistic࠭ᮠ˄logistic function˅DŽ⌘᜿ᆳⲴ䗃
ࠪ㤳തѪ 0 ࡠ 1ˈ䲿䗃‫ޕ‬অ䈳䙂໎˄৲㿱മ 4-6 ѝⲴ䰸٬࠭ᮠᴢ㓯˅DŽഐѪ䘉њ࠭ᮠᢺ䶎ᑨ
བྷⲴ䗃‫ޕ‬٬ฏ᱐ሴࡠањሿ㤳തⲴ䗃ࠪˈᆳ㓿ᑨ㻛〠Ѫsigmoidঅ‫Ⲵݳ‬ᥔ঻࠭ᮠ˄squashing
function˅DŽsigmoid࠭ᮠᴹањᴹ⭘Ⲵ⢩ᖱˈᆳⲴሬᮠᖸᇩ᱃ԕᆳⲴ䗃ࠪ㺘⽪[⺞࠷ൠ䇢ˈ

dV ( y )
=V(y)˜(1-V(y))]DŽᡁԜሶⴻࡠˈਾ䶒Ⲵởᓖл䱽ᆖҐ⌅ࡉ֯⭘Ҷ䘉њሬᮠDŽᴹᰦҏਟ
dy
ԕ֯⭘ަԆ᱃䇑㇇ሬᮠⲴਟᗞ࠭ᮠԓᴯVDŽֻྲˈsigmoid࠭ᮠᇊѹⲴe-y亩ᴹᰦ㻛ᴯᦒѪe-k˜yˈ
ަѝkѪḀњ↓ᑨᮠˈ⭘ᶕߣᇊ䘉њ䰸٬࠭ᮠⲴ䲑ጝᙗDŽৼᴢ↓࠷࠭ᮠtanhᴹᰦҏ⭘ᶕԓᴯ
sigmoid࠭ᮠ˄৲㿱㓳Ґ 4.8˅DŽ
4.5.2 ਃੇՖ᫣㇍⌋

ሩҾ⭡а㌫ࡇ⺞ᇊⲴঅ‫ݳ‬ӂ䘎ᖒᡀⲴཊቲ㖁㔌ˈ৽ੁՐ᫝㇇⌅ਟ⭘ᶕᆖҐ䘉њ㖁㔌Ⲵᵳ
٬DŽᆳ䟷⭘ởᓖл䱽ᯩ⌅䈅മᴰሿॆ㖁㔌䗃ࠪ٬઼ⴞḷ٬ѻ䰤Ⲵ䈟ᐞᒣᯩDŽ䘉а㢲㔉ࠪ৽ੁ
Ր᫝㇇⌅ˈла㢲᧘ሬࠪ৽ੁՐ᫝㇇⌅֯⭘Ⲵởᓖл䱽ᵳ٬ᴤᯠ⌅ࡉDŽ

ഐѪᡁԜ㾱㘳㲁ཊњ䗃ࠪঅ‫Ⲵݳ‬㖁㔌ˈ㘼нᱟ䊑ԕࡽਚ㘳㲁অњঅ‫ˈݳ‬ᡰԕᡁԜ‫ݸ‬䟽ᯠ
ᇊѹ䈟ᐞ Eˈԕ‫ׯ‬ሩᡰᴹ㖁㔌䗃ࠪⲴ䈟ᐞ≲઼DŽ

& 1
E( w ) { ¦ ¦ (t kd  okd ) 2
2 d D koutputs
˄4.13˅

ަѝoutputsᱟ㖁㔌䗃ࠪঅ‫Ⲵݳ‬䳶ਸˈtkd઼okdᱟо䇝㓳ṧֻd઼ㅜkњ䗃ࠪঅ‫Ⲵޣ⴨ݳ‬䗃ࠪ
٬DŽ

৽ੁՐ᫝㇇⌅䶒ѤⲴᆖҐ䰞仈ᱟᩌ㍒ањᐘབྷⲴ‫ٷ‬䇮オ䰤ˈ䘉њオ䰤⭡㖁㔌ѝᡰᴹঅ‫ݳ‬
Ⲵᡰᴹਟ㜭Ⲵᵳ٬ᇊѹDŽ䘉⿽ᛵߥਟԕ⭘ањ䈟ᐞᴢ䶒ᶕᖒ䊑㺘⽪ˈоമ 4-4 㺘⽪Ⲵ㓯ᙗঅ
‫Ⲵݳ‬䈟ᐞᴢ䶒⴨լDŽ䛓ᑵമѝⲴ䈟ᐞ㻛ᡁԜⲴᯠⲴ䈟ᐞᇊѹ E ᡰᴯԓˈᒦфオ䰤ѝⲴަԆ
㔤⧠൘ሩᓄ㖁㔌ѝоᡰᴹঅ‫Ⲵޣ⴨ݳ‬ᡰᴹᵳ٬DŽ઼䇝㓳অњঅ‫Ⲵݳ‬ᛵߥаṧˈởᓖл䱽ਟ㻛
⭘ᶕቍ䈅ራ᢮ањ‫ٷ‬䇮֯ E ᴰሿॆDŽ

ཊቲ㖁㔌Ⲵањѫ㾱н਼ᱟᆳⲴ䈟ᐞᴢ䶒ਟ㜭ᴹཊњተ䜘ᶱሿ٬ˈ㘼മ 4-4 㺘⽪Ⲵᣋ⢙


ᴢ䶒ӵᴹањᴰሿ٬DŽнᒨⲴᱟˈ䘉᜿ણ⵰ởᓖл䱽ӵ㜭‫؍‬䇱᭦ᮋࡠተ䜘ᶱሿ٬ˈ㘼ᵚᗵᗇ
ࡠ‫ޘ‬ተᴰሿⲴ䈟ᐞDŽቭ㇑ᴹ䘉њ䳌⺽ˈᐢ㓿ਁ⧠ሩҾᇎ䐥ѝᖸཊᓄ⭘৽ੁՐ᫝㇇⌅䜭ӗ⭏Ҷ
ࠪ㢢Ⲵ㔃᷌DŽ

㺘 4-2 वਜ਼єቲ sigmoid অ‫ࡽⲴݳ‬侸㖁㔌Ⲵ৽ੁՐ᫝㇇⌅˄䲿ᵪởᓖл䱽⡸ᵜ˅

Backpropagation(training_examples, K, nin, nout, nhidden)


& & &
trainning_exaples ѝ⇿ањ䇝㓳ṧֻᱟᖒᔿѪ< x , t >Ⲵᒿ‫ަˈڦ‬ѝ x ᱟ㖁㔌䗃
&
‫ޕ‬٬ੁ䟿ˈ t ᱟⴞḷ䗃ࠪ٬DŽ
KᱟᆖҐ䙏⦷˄ֻྲ 0.05˅DŽninᱟ㖁㔌䗃‫Ⲵޕ‬ᮠ䟿ˈnhiddenᱟ䳀㯿ቲঅ‫ݳ‬ᮠˈnoutᱟ
䗃ࠪঅ‫ݳ‬ᮠDŽ
Ӿঅ‫ݳ‬iࡠঅ‫ݳ‬jⲴ䗃‫ޕ‬㺘⽪Ѫxjiˈঅ‫ݳ‬iࡠঅ‫ݳ‬jⲴᵳ٬㺘⽪ѪwijDŽ
z ࡋᔪާᴹninњ䗃‫ˈޕ‬nhiddenњ䳀㯿অ‫ˈݳ‬noutњ䗃ࠪঅ‫Ⲵݳ‬㖁㔌
z ࡍ࿻ॆᡰᴹⲴ㖁㔌ᵳ٬ѪሿⲴ䲿ᵪ٬˄ֻྲ-0.05 ઼ 0.05 ѻ䰤Ⲵᮠ˅
z ൘䙷ࡠ㓸→ᶑԦࡽˈ‫ڊ‬
& &
z ሩҾ䇝㓳ṧֻ training_examples ѝⲴ⇿њ< x , t >ˈ‫ڊ‬
ᢺ䗃‫⋯ޕ‬㖁㔌ࡽੁՐ᫝
&
1ˊ ᢺᇎֻ x 䗃‫ޕ‬㖁㔌ˈᒦ䇑㇇㖁㔌ѝ⇿њঅ‫ݳ‬uⲴ䗃ࠪ
ouDŽ
֯䈟ᐞ⋯㖁㔌৽ੁՐ᫝
2ˊ ሩҾ㖁㔌Ⲵ⇿њ䗃ࠪঅ‫ݳ‬kˈ䇑㇇ᆳⲴ䈟ᐞ亩Gk
Gk mok(1-ok)(tk-ok) ˄T4.3˅
3ˊ ሩҾ㖁㔌Ⲵ⇿њ䳀㯿অ‫ݳ‬hˈ䇑㇇ᆳⲴ䈟ᐞ亩Gh
Gh moh(1-oh) ¦
wkhGk ˄T4.4˅
koutputs

4ˊ ᴤᯠ⇿њ㖁㔌ᵳ٬wji
wjim wji +'wji
ަѝ
'wji=KGjxji ˄T4.5˅

㺘 4-2 㔉ࠪҶ৽ੁՐ᫝㇇⌅DŽ䘉䟼᧿䘠Ⲵ㇇⌅䘲⭘Ҿवਜ਼єቲ sigmoid অ‫࠶Ⲵݳ‬ቲࡽ侸


㖁㔌ˈᒦф⇿аቲⲴঅ‫ݳ‬оࡽаቲⲴᡰᴹঅ‫⴨ݳ‬䘎DŽ䘉ᱟ৽ੁՐ᫝㇇⌅Ⲵ໎䟿ởᓖл䱽˄ᡆ
䲿ᵪởᓖл䱽˅⡸ᵜDŽ䘉䟼֯⭘Ⲵㅖਧоࡽа㢲֯⭘Ⲵаṧˈᒦ䘋㹼ҶྲлⲴᢙኅ˖
x 㖁㔌ѝ⇿њ㔃⛩㻛䍻Ҹањᒿਧ˄ֻྲањᮤᮠ˅ˈ䘉䟼Ⲵ㔃⛩㾱Ѹᱟ㖁㔌
Ⲵ䗃‫ˈޕ‬㾱Ѹᱟ㖁㔌ѝḀњঅ‫Ⲵݳ‬䗃ࠪDŽ
x xji㺘⽪㔃⛩iࡠঅ‫ݳ‬jⲴ䗃‫ˈޕ‬ᒦфwji㺘⽪ሩᓄⲴᵳ٬DŽ
x Gn㺘⽪оঅ‫ݳ‬n⴨‫ޣ‬㚄Ⲵ䈟ᐞ亩DŽᆳⲴ䀂㢢оࡽ䶒䇘䇪Ⲵdelta䇝㓳⌅ࡉѝⲴ
wE
(t-o)⴨լDŽਾ䶒ᡁԜਟԕⴻࡠGn =  DŽ
wnet n

൘㺘 4-2 Ⲵ㇇⌅Ⲵᔰ࿻ˈᔪ・ањާᴹᵏᵋᮠ䟿Ⲵ䳀অ‫઼ݳ‬䗃ࠪঅ‫Ⲵݳ‬㖁㔌ˈᒦࡍ࿻ॆ
ᡰᴹ㖁㔌Ⲵᵳ٬ѪሿⲴ䲿ᵪᮠDŽ㔉ᇊҶ䘉њപᇊⲴ㖁㔌㔃ᶴˈ㇇⌅Ⲵѫᗚ⧟ቡሩ䇝㓳ṧֻ䘋
㹼৽༽Ⲵ䘝ԓDŽሩҾ⇿ањ䇝㓳ṧֻˈᆳᓄ⭘ⴞࡽⲴ㖁㔌ࡠ䘉њṧֻˈ䇑㇇ሩҾ䘉њṧֻ㖁
㔌䗃ࠪⲴ䈟ᐞˈ❦ਾᴤᯠ㖁㔌ѝᡰᴹⲴᵳ٬DŽሩ䘉ṧⲴởᓖл䱽↕僔䘋㹼䘝ԓˈⴤࡠ㖁㔌Ⲵ
ᙗ㜭䗮ࡠਟ᧕ਇⲴ㋮ᓖ˄㓿ᑨᱟкॳ⅑ˈཊ⅑֯⭘਼ṧⲴ䇝㓳ṧֻ˅DŽ

䘉䟼Ⲵởᓖл䱽ᵳᴤᯠ⌅ࡉ˄㺘 4-2 ѝⲴ‫ޜ‬ᔿ[T4.5]˅оdelta䇝㓳⌅ࡉ˄‫ޜ‬ᔿ[4.10]˅⴨


լDŽቡ䊑delta⌅ࡉˈᆳ‫➗׍‬ԕлй㘵Ⲵ҈〟ᶕᴤᯠ⇿ањᵳ˖ᆖҐ䙏⦷Kǃ䈕ᵳ٬ᓄ⭘Ⲵ䗃
‫ޕ‬٬xjiǃ઼䘉њঅ‫ݳ‬䗃ࠪⲴ䈟ᐞDŽᜏаⲴн਼ᱟdelta⌅ࡉѝⲴ䈟ᐞ亩˄t-o˅㻛ᴯᦒᡀањᴤ
༽ᵲⲴ䈟ᐞ亩GjDŽ൘ 4.5.3 㢲Ⲵሩᵳᴤᯠ⌅ࡉⲴ᧘ሬѻਾᡁԜሶ㔉ࠪGjⲴ߶⺞ᖒᔿDŽѪҶⴤ㿲
ൠ⨶䀓ᆳˈ‫ݸ‬㘳㲁㖁㔌Ⲵ⇿ањ䗃ࠪঅ‫ݳ‬kⲴGk˄൘㇇⌅Ⲵ‫ޜ‬ᔿ[T4.3]ѝ˅˅ᱟᘾṧ䇑㇇ⲴDŽ
ᖸㆰঅˈGkоdelta⌅ࡉѝⲴ˄tk-ok˅⴨լˈն҈кҶsigmoidᥔ঻࠭ᮠⲴሬᮠok(1-ok)DŽ⇿њ䳀
㯿অ‫ݳ‬hⲴGhⲴ٬ާᴹ⴨լⲴᖒᔿ˄㇇⌅Ⲵ‫ޜ‬ᔿ[T4.4]˅DŽ❦㘼ˈഐѪ䇝㓳ṧֻӵሩ㖁㔌Ⲵ䗃
ࠪᨀ‫׋‬Ҷⴞḷ٬tkˈᡰԕ㕪ቁⴤ᧕Ⲵⴞḷ٬ᶕ䇑㇇䳀㯿অ‫Ⲵݳ‬䈟ᐞ٬DŽഐ↔䟷ਆԕл䰤᧕࣎
⌅䇑㇇䳀㯿অ‫Ⲵݳ‬䈟ᐞ亩˖ሩਇ䳀㯿অ‫ݳ‬hᖡ૽Ⲵ⇿ањঅ‫Ⲵݳ‬䈟ᐞGk䘋㹼࣐ᵳ≲઼ˈ⇿њ
䈟ᐞGkᵳ٬ѪwkhˈwkhቡᱟӾ䳀㯿অ‫ݳ‬hࡠ䗃ࠪঅ‫ݳ‬kⲴᵳ٬DŽ䘉њᵳ٬࡫⭫Ҷ䳀㯿অ‫ݳ‬hሩҾ
䗃ࠪঅ‫ݳ‬kⲴ䈟ᐞᓄĀ䍏䍓āⲴ〻ᓖDŽ

㺘 4-2 ѝⲴ㇇⌅䲿⵰⇿њ䇝㓳ṧֻⲴࠪ⧠䙂໎ൠᴤᯠᵳDŽ䘉а⛩оởᓖл䱽Ⲵ䲿ᵪ䘁լ
㇇⌅а㠤DŽ㾱ਆᗇ䈟ᐞEⲴⵏᇎởᓖˈ䴰㾱൘‫؞‬᭩ᵳ٬ѻࡽሩᡰᴹ䇝㓳ṧֻⲴGjxji٬≲઼DŽ

൘ިරⲴᓄ⭘ѝˈ৽ੁՐ᫝㇇⌅Ⲵᵳ٬ᴤᯠ䘝ԓՊ㻛䟽༽кॳ⅑DŽᴹᖸཊ㓸→ᶑԦਟԕ
⭘ᶕ‫→ڌ‬䘉њ䗷〻DŽа⿽ᯩ⌅ᱟ൘䘝ԓⲴ⅑ᮠࡠҶањപᇊ٬ᰦ‫˗→ڌ‬ᡆᖃ൘䇝㓳ṧֻкⲴ
䈟ᐞ䱽ࡠḀњ䰸٬ԕлᰦ˗ᡆ൘࠶⿫Ⲵ傼䇱ṧֻ䳶ਸкⲴ䈟ᐞㅖਸḀњḷ߶ᰦDŽ㓸→ࡔᦞⲴ
䘹ᤙᱟᖸ䟽㾱ⲴˈഐѪཚቁⲴᗚ⧟ਟ㜭⋑ᴹᴹ᭸ൠ䱽վ䈟ᐞˈ㘼ཚཊⲴᗚ⧟Պሬ㠤ሩ䇝㓳ᮠ
ᦞⲴ䗷ᓖᤏਸDŽ൘ 4.6.5 㢲ѝᡁԜՊᴤ䈖㓶ൠ䇘䇪䘉њ䰞仈DŽ

4.5.2.1 ໔ࣖߨ䠅δMomentumε亯

ഐѪ৽ੁՐ᫝㇇⌅Ⲵᓄ⭘ྲ↔ᒯ⌋ˈᡰԕᐢ㓿ᔰਁࠪҶᖸཊ৽ੁՐ᫝㇇⌅ⲴਈփDŽަѝ
ᴰᑨ㿱Ⲵᱟ‫؞‬᭩㇇⌅ѝ‫ޜ‬ᔿ˄T4.5˅Ⲵᵳ٬ᴤᯠ⌅ࡉˈ֯ㅜ n ⅑䘝ԓⲴᵳ٬ᴤᯠ䜘࠶ൠ‫׍‬䎆
Ҿਁ⭏൘ㅜ n-1 ⅑䘝ԓᰦⲴᴤᯠˈণᢺ‫ޜ‬ᔿ˄T4.5˅ᦒѪྲлⲴᖒᔿ˖
 'wji n KGjxjiD'wji n̢  ˄˅

䘉䟼'wji(n)ᱟ㇇⌅ѫᗚ⧟ѝⲴㅜn⅑䘝ԓ䘋㹼Ⲵᵳ٬ᴤᯠˈᒦф 0dD<1 ᱟањ〠Ѫ冲量


˄momentum˅ⲴᑨᮠDŽ⌘᜿䘉њ‫ޜ‬ᔿਣ‫Ⲵח‬ㅜа亩ቡᱟ৽ੁՐ᫝㇇⌅Ⲵ‫ޜ‬ᔿ˄T4.5˅ѝⲴ
ᵳ٬ᴤᯠDŽਣ䗩ⲴㅜҼ亩ᱟᯠⲴˈ㻛〠Ѫߢ䟿亩DŽѪҶ⨶䀓䘉њߢ䟿亩Ⲵ֌⭘ˈ䇮ᜣởᓖл
䱽Ⲵᩌ㍒䖘䘩ቡྭ‫ۿ‬ањ˄ᰐߢ䟿Ⲵ˅⨳┊л䈟ᐞᴢ䶒DŽDⲴ֌⭘ᱟ໎࣐ߢ䟿֯䘉њ⨳Ӿа
⅑䘝ԓࡠла⅑䘝ԓᰦԕ਼ṧⲴᯩੁ┊ࣘDŽߢ䟿ᴹᰦՊ֯䘉њ⨳┊䗷䈟ᐞᴢ䶒Ⲵተ䜘ᶱሿ
٬˗ᡆ֯ަ┊䗷䈟ᐞᴢ䶒кⲴᒣඖ४ฏˈྲ᷌⋑ᴹߢ䟿䘉њ⨳ᴹਟ㜭൘䘉њ४ฏ‫→ڌ‬DŽᆳҏ
ާᴹ൘ởᓖнਈⲴ४ฏ䙀⑀໎བྷᩌ㍒↕䮯Ⲵ᭸᷌ˈӾ㘼ਟԕ࣐ᘛ᭦ᮋDŽ

4.5.2.2 ᆜҖԱᝅⲺᰖ⧥㖇㔒

㺘 4-2 㔉ࠪⲴ৽ੁՐ᫝㇇⌅Ⲵᇊѹӵ䘲⭘ҾєቲⲴ㖁㔌DŽ❦㘼䛓䟼㔉ࠪⲴ㇇⌅ਟԕㆰঅ
ൠ᧘ᒯࡠԫ᜿␡ᓖⲴࡽ侸㖁㔌DŽ‫ޜ‬ᔿ˄T4.5˅Ⲵᵳ٬ᴤᯠ⌅ࡉ‫؍‬ᤱнਈˈᜏаⲴਈॆᱟ䇑㇇
G٬Ⲵ䗷〻DŽᾲᤜൠ䈤ˈㅜmቲⲴঅ‫ݳ‬rⲴGr٬ᱟ⭡ᴤ␡Ⲵm+1 ቲⲴG٬ṩᦞлᔿ䇑㇇Ⲵ˖
Gr =or(1- or) ¦
sm 1ቲ
wsrGs ˄4.19˅

⌘᜿䘉њ‫ޜ‬ᔿо㺘 4-2 ㇇⌅Ⲵㅜ 3 ↕⴨਼ˈ䘉䟼㾱䈤᰾ⲴᱟሩҾ㖁㔌ѝⲴԫ᜿ᮠ䟿Ⲵ䳀


㯿অ‫ˈݳ‬䈕↕僔㾱㻛䟽༽ᖸཊ䙽DŽ

ྲ᷌᧘ᒯࡠԫօᴹੁᰐ⧟㔃ᶴҏаṧⲴㆰঅˈ㘼н䇪㖁㔌ѝⲴঅ‫ݳ‬ᱟ੖䊑ᡁԜ㠣↔Ѫ→
‫ٷ‬ᇊⲴ䛓ṧ㻛㔏аൠᧂࡇ൘ቲкDŽሩҾ㖁㔌অ‫⋑ݳ‬ᴹ᤹↔ᧂࡇⲴᛵߥˈ䇑㇇ԫ᜿޵䜘অ‫˄ݳ‬ҏ
ቡᱟᡰᴹ䶎䗃ࠪঅ‫Ⲵ˅ݳ‬GⲴ⌅ࡉᱟ˖

Gr =or(1- or) ¦
sDownStream (r )
wsrGs ˄4.20˅

ަѝ DownStream(r)ᱟ൘㖁㔌ѝঅ‫ ݳ‬r Ⲵ・ণл⑨˄immediately downstream˅অ‫Ⲵݳ‬䳶


ਸˈᡆ㘵䈤䗃‫ޕ‬ѝवᤜ r Ⲵ䗃ࠪⲴᡰᴹঅ‫ݳ‬DŽ4.5.3 㢲ᡁԜ㾱᧘ሬⲴቡᱟ䘉⿽ᵳ٬ᴤᯠ⌅ࡉ
Ⲵа㡜ᖒᔿDŽ

4.5.3 ਃੇՖ᫣⌋ࡏⲺ᧞ሲ

䘉а㢲㔉ࠪ৽ੁՐ᫝㇇⌅Ⲵᵳ٬䈳ᮤ⌅ࡉⲴ᧘ሬˈྲ᷌ᱟㅜа䙽䰵䈫ਟԕ䐣䗷䘉а㢲ˈ
㘼нཡ䘎㔝ᙗDŽ

䘉䟼ᡁԜ㾱䀓ߣⲴ䰞仈ᱟ᧘ሬࠪ㺘 4-2 ㇇⌅֯⭘Ⲵ䲿ᵪởᓖл䱽⌅ࡉDŽഎᗶ‫ޜ‬ᔿ˄4.11˅ˈ


䲿ᵪⲴởᓖл䱽㇇⌅䘝ԓ༴⨶䇝㓳ṧֻˈ⇿⅑༴⨶ањDŽሩҾ⇿њ䇝㓳ṧֻdˈ࡙⭘‫ޣ‬Ҿ䘉
њṧֻⲴ䈟ᐞEdⲴởᓖ‫؞‬᭩ᵳ٬DŽᦒਕ䈍䈤ˈሩҾ⇿ањ䇝㓳ṧֻdˈ⇿њᵳwji㻛໎࣐'wjiDŽ

wE d
'wji=  K ˄4.21˅
ww ji

ަѝˈEdᱟ䇝㓳ṧֻdⲴ䈟ᐞˈ䙊䗷ሩ㖁㔌ѝᡰᴹ䗃ࠪঅ‫઼≲Ⲵݳ‬ᗇࡠ

& 1
Ed( w ) { ¦ (t k  ok ) 2
2 koutputs
䘉䟼outputsᱟ㖁㔌ѝ䗃ࠪঅ‫Ⲵݳ‬䳶ਸˈtkᱟঅ‫ݳ‬kሩҾ䇝㓳ṧֻdⲴⴞḷ٬ˈokᱟ㔉ᇊ䇝
㓳ṧֻdᰦঅ‫ݳ‬kⲴ䗃ࠪ٬DŽ

䲿ᵪởᓖл䱽⌅ࡉⲴ᧘ሬᾲᘥкᱟ᱃៲Ⲵˈն䴰㾱⮉᜿ᖸཊлḷ઼ਈ䟿DŽᡁԜሶ䚥ᗚമ
4-6 ѝᡰ⭫ࠪⲴㅖਧˈ໎࣐ањлḷ j ⭘ᶕ㺘⽪㖁㔌ѝⲴㅜ j њঅ‫ާˈݳ‬փྲл˖
x xji=অ‫ݳ‬jⲴㅜiњ䗃‫ޕ‬
x wji=оঅ‫ݳ‬jⲴㅜiњ䗃‫ޣ⴨ޕ‬㚄Ⲵᵳ٬
x netj=¦iwjixji˄অ‫ݳ‬jⲴ䗃‫࣐Ⲵޕ‬ᵳ઼˅
x oj=অ‫ݳ‬j䇑㇇ࠪⲴ䗃ࠪ
x tj=অ‫ݳ‬jⲴⴞḷ䗃ࠪ
x V=sigmoid ࠭ᮠ
x outputs=㖁㔌ⲴᴰਾаቲⲴঅ‫ݳ‬䳶ਸ
x DownStream(j)=অ‫・Ⲵݳ‬ণ䗃‫˄ޕ‬immediate inputs˅ѝवਜ਼অ‫ ݳ‬j 䗃ࠪⲴঅ
‫ݳ‬䳶ਸ

wE d
⧠൘ᡁԜሬࠪ Ⲵањ㺘⽪ˈԕ‫ׯ‬ᇎ⧠‫ޜ‬ᔿ˄4.21˅ѝࠪ⧠Ⲵ䲿ᵪⲴởᓖл䱽⌅ࡉDŽ
ww ji

俆‫⌘ˈݸ‬᜿ᵳ٬wjiӵ㜭䙊䗷netjᖡ૽㖁㔌ⲴަԆ䜘࠶DŽᡰԕˈᡁԜਟԕ֯⭘䬮ᔿ㿴ࡉ˄chain
rule˅ᗇࡠ

wE d wE d wnet j
=
ww ji wnet j ww ji

wE d
= xji ˄4.22˅
wnet j

wE d
ᐢ⸕ㅹᔿ˄4.22˅ˈᡁԜ࢙лⲴԫ࣑ቡᱟѪ ሬࠪањᯩ‫Ⲵׯ‬㺘⽪DŽᡁԜ‫⅑׍‬㘳㲁
wnet j

є⿽ᛵߥ˖а⿽ᛵߥᱟঅ‫ ݳ‬j ᱟ㖁㔌Ⲵањ䗃ࠪঅ‫ˈݳ‬ਖа⿽ᛵߥᱟ j ᱟањ޵䜘অ‫ݳ‬DŽ

ᛵߥ 1˖䗃ࠪঅ‫Ⲵݳ‬ᵳ٬䇝㓳⌅ࡉDŽቡ䊑wjiӵ㜭䙊䗷netjᖡ૽ަ։Ⲵ㖁㔌аṧˈnetjӵ㜭
䙊䗷ojᖡ૽ަ։Ⲵ㖁㔌DŽᡰԕᡁԜਟԕ޽⅑֯⭘䬮ᔿ㿴ࡉᗇࠪ

wE d wE d wo j
= ˄4.23˅
wnet j wo j wnet j

俆‫ݸ‬ӵ㘳㲁ㅹᔿ˄4.23˅Ⲵㅜа亩

wE d w 1
= ¦ (t k  o k ) 2
wo j wo j 2 koutputs

w
䲔Ҷᖃ k=j ᰦˈᡰᴹ䗃ࠪঅ‫ ݳ‬k Ⲵሬᮠ (t k  o k ) 2 Ѫ 0DŽᡰԕᡁԜнᗵሩཊњ䗃ࠪ
wo j
অ‫ˈ઼≲ݳ‬ਚ䴰Ԕ k=jDŽ

wE d w 1
(t j  o j ) 2
wo j wo j 2
1 w (t j  o j )
2(t j  o j )
2 wo j
= (-tj-oj) ˄4.24˅

wo j
᧕лᶕ㘳㲁ㅹᔿ˄4.23˅ⲴㅜҼ亩DŽᰒ❦oj=V˄netj˅ˈሬᮠ ቡᱟsigmoid࠭ᮠⲴሬ
wnet j

ᮠˈ㘼ᡁԜᐢ㓿ᤷࠪ䗷sigmoid࠭ᮠⲴሬᮠѪV(netj)(1-V(netj))DŽᡰԕˈ

wo j wV (net j )
wnet j wnet j ˄4.25˅
o j (1  o j )

ᢺ㺘䗮ᔿ˄4.24˅઼˄4.25˅ԓ‫˄ޕ‬4.23˅ˈᡁԜᗇࡠ

wE d
= -(tj-oj)oj(1-oj) ˄4.26˅
wnet j

❦ਾоㅹᔿ˄4.21˅઼˄4.22˅ਸᒦˈᡁԜ‫᧘ׯ‬ሬࠪҶ䗃ࠪঅ‫Ⲵݳ‬䲿ᵪởᓖл䱽⌅ࡉ˖

wE d
'wji=  K =K˄tj-oj˅oj˄1-oj˅xji ˄4.27˅
ww ji

⌘᜿䘉њ䇝㓳⌅ࡉᚠᚠᱟ㺘 4-2 ㇇⌅ѝⲴ˄T4.3˅઼˄T4.5˅Ⲵᵳ٬ᴤᯠ⌅ࡉDŽ↔ཆˈ

wE d
ᡁԜਟԕਁ⧠ᔿ˄T4.3˅ѝⲴGkо  ٬⴨ㅹDŽ൘䘉а㢲Ⲵަ։䜘࠶ᡁԜሶ֯⭘Giᶕ㺘
wnet k

wE d
⽪ԫ᜿অ‫ݳ‬iⲴ  DŽ
wnet i

ᛵߥ 2˖䳀㯿অ‫Ⲵݳ‬ᵳ٬䇝㓳⌅ࡉDŽሩҾ㖁㔌ѝⲴ޵䜘অ‫ݳ‬ᡆ㘵䈤䳀㯿অ‫Ⲵݳ‬ᛵߥˈ᧘
ሬwjiᗵ享㘳㲁wji䰤᧕ൠᖡ૽㖁㔌䗃ࠪˈӾ㘼ᖡ૽EdDŽ⭡Ҿ䘉њ৏ഐˈᡁԜਁ⧠ᇊѹ㖁㔌ѝঅ
‫ݳ‬jⲴᡰᴹ・ণл⑨˄immediately downstream˅অ‫Ⲵݳ‬䳶ਸ˄ҏቡᱟ・ণ䗃‫ޕ‬ѝवਜ਼অ‫ݳ‬j
Ⲵ䗃ࠪⲴᡰᴹঅ‫˅ݳ‬ᱟᴹ⭘ⲴDŽᡁԜ⭘DownStream(j)㺘⽪䘉ṧⲴঅ‫ݳ‬䳶ਸDŽ⌘᜿netjਚ㜭䙊
䗷Downstream(j)ѝⲴঅ‫ݳ‬ᖡ૽㖁㔌䗃ࠪ˄޽ᖡ૽Ed˅DŽᡰԕਟԕྲл᧘ሬ
wE d wE d wnet k
wnet j
¦
kDownStream ( j ) wnet j wnet j

wnet k
¦
kDownStream ( j )
Gk
wnet j
wnet k wo j
¦
kDownStream ( j )
Gk
wo j wnet j
(4.28)

wo j
¦
kDownStream ( j )
 G k wkj
wnet j
¦
kDownStream ( j )
 G k wkj o j (1  o j )

wE d
䟽ᯠ㓴㓷਴亩ᒦ֯⭘Gj㺘⽪  ˈᡁԜᗇࡠ
wnet j

Gj o j (1  o j ) ¦G w
k kj
kDownstream ( j )


'wji = K Gj xji

кᔿቡᱟ⭡‫ޜ‬ᔿ˄4.20˅ᗇࡠⲴа㡜⌅ࡉˈ⭘ᶕᴤᯠԫ᜿ᴹੁᰐ⧟㖁㔌㔃ᶴ޵䜘অ‫Ⲵݳ‬
ᵳ٬DŽ⌘᜿㺘 4-2 Ⲵᔿ˄T4.4˅ӵᱟ䘉њ⌅ࡉᖃ Downstream(j)=outputs ᰦⲴањ⢩ֻDŽ

4.6 ਃੇՖ᫣㇍⌋Ⲻ䈪᱄

4.6.1 ᭬ᮑᙝૂቶ䜞ᶷቅ‫ٲ‬

↓ྲࡽ䶒ᡰ᧿䘠Ⲵˈ৽ੁՐ᫝㇇⌅ᇎ⧠Ҷа⿽ሩਟ㜭Ⲵ㖁㔌ᵳ٬オ䰤Ⲵởᓖл䱽ᩌ㍒ˈ
ᆳ䘝ԓൠ߿ሿ䇝㓳ṧֻⲴⴞḷ٬઼㖁㔌䗃ࠪ䰤Ⲵ䈟ᐞDŽഐѪሩҾཊቲ㖁㔌ˈ䈟ᐞᴢ䶒ਟ㜭ਜ਼
ᴹཊњн਼Ⲵተ䜘ᶱሿ٬ˈởᓖл䱽ਟ㜭䲧‫ޕ‬䘉Ӌተ䜘ᶱሿ٬ѝⲴањDŽഐ↔ˈሩҾཊቲ㖁
㔌ˈ৽ੁՐ᫝㇇⌅ӵ㜭‫؍‬䇱᭦ᮋࡠ䈟ᐞ E ⲴḀњተ䜘ᶱሿ٬ˈнаᇊ᭦ᮋࡠ‫ޘ‬ተⲴᴰሿ䈟
ᐞDŽ

ቭ㇑㕪ѿሩ᭦ᮋࡠ‫ޘ‬ተᴰሿ䈟ᐞⲴ‫؍‬䇱ˈ৽ੁՐ᫝㇇⌅൘ᇎ䐥ѝᱟ䶎ᑨᴹ᭸Ⲵ࠭ᮠ䙬䘁
㇇⌅DŽሩҾᖸཊᇎ䱵Ⲵᓄ⭘ˈӪԜਁ⧠ተ䜘ᶱሿ٬Ⲵ䰞仈⋑ᴹᜣ䊑Ⲵ䛓Ѹѕ䟽DŽѪҶሩ䘉њ
䰞仈ᴹаӋⴤ㿲Ⲵ䇔䇶ˈ㘳㲁ਜ਼ᴹབྷ䟿ᵳ٬Ⲵ㖁㔌ˈᆳሩᓄ⵰㔤ᮠ䶎ᑨ儈Ⲵオ䰤ѝⲴ䈟ᐞᴢ
䶒˄⇿њᵳ٬а㔤˅DŽᖃởᓖл䱽䲧‫⴨ޕ‬ሩḀњᵳⲴተ䜘ᶱሿ٬ᰦˈ⴨ሩަԆⲴᵳ䘉䟼ᵚᗵ
ᱟተ䜘ᶱሿ٬DŽһᇎкˈ㖁㔌Ⲵᵳ䎺ཊˈ䈟ᐞᴢ䶒Ⲵ㔤ᮠ䎺ཊˈҏቡ䎺ਟ㜭Ѫởᓖл䱽ᨀ‫׋‬
ᴤཊⲴĀ䘳䙨䐟㓯āˈ䇙ởᓖл䱽⿫ᔰ⴨ሩ䈕অњᵳ٬Ⲵተ䜘ᶱሿ٬༴DŽ

ሩተ䜘ᶱሿ٬ⲴㅜҼ⿽㿲⛩ᱟˈ㘳㲁䲿⵰䇝㓳ѝ䘝ԓ⅑ᮠⲴ໎࣐㖁㔌ᵳ٬Ⲵ╄ॆᯩᔿDŽ
⌘᜿൘㇇⌅ѝˈྲ᷌ᢺ㖁㔌Ⲵᵳ٬ࡍ࿻ॆѪ᧕䘁Ҿ 0 Ⲵ٬ˈ䛓Ѹ൘ᰙᵏⲴởᓖл䱽↕僔ѝˈ
㖁㔌ሶ㺘⧠Ѫањ䶎ᑨᒣ━Ⲵ࠭ᮠˈ䘁լѪ䗃‫Ⲵޕ‬㓯ᙗ࠭ᮠDŽ䘉ᱟഐѪ sigmoid ࠭ᮠᵜ䓛൘
ᵳ٬䶐䘁 0 ᰦ᧕䘁㓯ᙗ˄㿱മ 4-6 ѝⲴ sigmoid ࠭ᮠᴢ㓯˅
DŽӵᖃᵳ٬ᐢ㓿໎䮯Ҷаᇊᰦ䰤
ѻਾˈᆳԜ᡽Պࡠ䗮ਟԕ㺘⽪儈ᓖ䶎㓯ᙗ㖁㔌࠭ᮠⲴ〻ᓖDŽᡆ䇨ਟԕᵏᖵ൘ᵳオ䰤Ⲵ䘉њ४
ฏᆈ൘ᴤཊⲴተ䜘ᶱሿ٬ˈ䘉ṧਟԕ㺘⽪ᴤ༽ᵲⲴ࠭ᮠDŽҏਟᐼᵋᖃᵳࡠ䗮䘉а⛩ᰦᆳԜᐢ
㓿䏣ཏ䶐䘁‫ޘ‬ተᴰሿ٬ˈণ‫ׯ‬ᆳᱟ䘉њ४ฏⲴተ䜘ᶱሿ٬ҏᱟਟԕ᧕ਇⲴDŽ

ቭ㇑ᴹк䶒Ⲵ䇴䇪ˈӪԜሩ⭘ ANN 㺘⽪Ⲵ༽ᵲ䈟ᐞᴢ䶒Ⲵởᓖл䱽⨶䀓ᗇ䘈нཏˈ䘈


н⸕䚃ᴹօᯩ⌅㜭⺞࠷ൠ亴⍻ተ䜘ᶱሿ٬ӰѸᰦ‫ى‬Պሬ㠤ഠ䳮DŽ⭘ᶕ㕃䀓ተ䜘ᶱሿ٬䰞仈Ⲵ
аӋᑨ㿱Ⲵ੟ਁᔿ㿴ࡉवᤜ˖
x 䊑‫ޜ‬ᔿ˄4.18˅᧿䘠Ⲵ䛓ṧѪởᓖᴤᯠ⌅ࡉ࣐ањߢ䟿亩DŽߢ䟿ᴹᰦਟԕᑖ
ࣘởᓖл䱽䗷〻ˈߢ䗷⤝ゴⲴተ䜘ᴰл٬˄❦㘼৏ࡉкᆳҏਟԕᑖࣘởᓖл
䱽䗷〻ߢ䗷⤝ゴⲴ‫ޘ‬ተᴰሿ٬ࡠަԆተ䜘ᶱሿ٬ʽ˅DŽ
x ֯⭘䲿ᵪⲴởᓖл䱽㘼нᱟⵏ↓Ⲵởᓖл䱽DŽṩᦞ 4.4.3.3 ሿ㢲䇘䇪Ⲵˈởᓖ
л䱽Ⲵ䲿ᵪ䘁լሩҾ⇿њ䇝㓳ṧֻ⋯ањн਼Ⲵ䈟ᐞᴢ䶒ᴹ᭸л䱽ˈᆳ‫׍‬䶐
䘉ӋởᓖⲴᒣ൷ᶕ䙬䘁ሩҾᮤњ䇝㓳䳶ਸⲴởᓖDŽ䘉Ӌн਼Ⲵ䈟ᐞᴢ䶒䙊ᑨ
ᴹн਼Ⲵተ䜘ᶱሿ٬ˈ䘉֯ᗇл䱽䗷〻нཚਟ㜭䲧‫ޕ‬ԫањተ䜘ᶱሿ٬DŽ
x ֯⭘਼ṧⲴᮠᦞ䇝㓳ཊњ㖁㔌ˈն⭘н਼Ⲵ䲿ᵪᵳ٬ࡍ࿻ॆ⇿њ㖁㔌DŽྲ᷌
н਼Ⲵ䇝㓳䗷〻ӗ⭏н਼Ⲵተ䜘ᶱሿ٬ˈ䛓Ѹሩ࠶⿫Ⲵ傼䇱䳶ਸᙗ㜭ᴰྭⲴ
㖁㔌㻛䘹ᤙDŽᡆ㘵‫⮉؍‬ᡰᴹⲴ㖁㔌ˈᒦфᢺᆳԜᖃ֌ањ㖁㔌ĀငઈՊāˈ
ᆳԜⲴ䗃ࠪᱟ⇿њ㖁㔌䗃ࠪⲴᒣ൷٬˄ਟ㜭࣐ᵳ˅DŽ

4.6.2 ࢃ侾㖇㔒Ⲻ㺞ᖷ㜳࣑

ӰѸ㊫රⲴ࠭ᮠਟԕ֯⭘ࡽ侸㖁㔌ᶕ㺘⽪઒˛ᖃ❦䘉њ䰞仈ⲴㆄṸ‫׍‬䎆Ҿ㖁㔌Ⲵᇭᓖ
઼␡ᓖDŽቭ㇑ⴞࡽሩଚа᯿࠭ᮠਟԕ⭘ଚ⿽㊫රⲴ㖁㔌᧿䘠䘈⸕䚃ᗇᖸቁˈնᐢ㓿⸕䚃Ҷй
ња㡜ᙗⲴ㔃䇪˖
x ᐳቄ࠭ᮠDŽԫօᐳቄ࠭ᮠਟԕ㻛ާᴹєቲঅ‫Ⲵݳ‬㖁㔌߶⺞㺘⽪ˈቭ㇑ሩҾᴰ
ൿⲴᛵߥˈᡰ䴰䳀㯿অ‫Ⲵݳ‬ᮠ䟿䲿⵰㖁㔌䗃‫ޕ‬ᮠ䟿Ⲵ໎࣐ᤷᮠ㓗໎䮯DŽѪҶ
䈤᰾䘉ᱟྲօᇎ⧠Ⲵˈ㘳㲁л䶒㺘⽪ԫօᐳቄ࠭ᮠⲴ䙊⭘ᯩṸ˖ሩҾ⇿ањ
ਟ㜭Ⲵ䗃‫ੁޕ‬䟿ˈࡋᔪн਼Ⲵ䳀㯿অ‫ˈݳ‬ᒦ䇮㖞ᆳⲴᵳ٬֯ᖃфӵᖃ䘉њ⢩
ᇊⲴੁ䟿䗃‫ࡠޕ‬㖁㔌ᰦ䈕অ‫ݳ‬㻛◰⍫DŽ䘉ṧቡӗ⭏ҶањሩҾԫօ䗃‫ޕ‬ӵᴹ
ањঅ‫ݳ‬㻛◰⍫Ⲵ䳀㯿ቲDŽ᧕лᶕᢺ䗃ࠪঅ‫ݳ‬ᇎ⧠Ѫањᡆ䰘ˈӵ⭡ᡰᐼᵋ
Ⲵ䗃‫⁑ޕ‬ᔿ◰⍫DŽ
x 䘎㔝࠭ᮠDŽԫօᴹ⭼Ⲵ䘎㔝࠭ᮠਟԕ⭡ањєቲⲴ㖁㔌ԕԫ᜿ሿⲴ䈟ᐞ˄൘
ᴹ䲀Ⲵ㤳ᮠл˅䙬䘁˄Cybenko 1989˗Hornik et al. 1989˅DŽ䘉њ⨶䇪䘲⭘Ҿ
䳀㯿ቲ֯⭘ sigmoid অ‫ݳ‬ǃ䗃ࠪቲ֯⭘˄䶎䰸٬Ⲵ˅㓯ᙗঅ‫Ⲵݳ‬㖁㔌DŽᡰ䴰
Ⲵ䳀㯿অ‫ݳ‬ᮠ䟿‫׍‬䎆Ҿ㾱䙬䘁Ⲵ࠭ᮠDŽ
x ԫ᜿࠭ᮠDŽԫ᜿࠭ᮠਟԕ㻛ањᴹйቲঅ‫Ⲵݳ‬㖁㔌ԕԫ᜿㋮ᓖ䙬䘁˄Cybenko
1988˅DŽоࡽ䶒⴨਼ˈ䗃ࠪቲ֯⭘㓯ᙗঅ‫ˈݳ‬єњ䳀㯿ቲ֯⭘ sigmoid অ‫ˈݳ‬
⇿аቲᡰ䴰Ⲵঅ‫ݳ‬ᮠ䟿а㡜н⺞ᇊDŽ䘉а㔃䇪Ⲵ䇱᰾ᯩ⌅Ѫ˖俆‫ݸ‬䈤᰾ԫօ
࠭ᮠਟԕ㻛䇨ཊተ䜘ॆ࠭ᮠⲴ㓯ᙗ㓴ਸ䙬䘁ˈ䘉Ӌተ䜘࠭ᮠⲴ٬䲔ҶḀњሿ
㤳തཆ䜭Ѫ 0˗❦ਾ䈤᰾єቲⲴ sigmoid অ‫ݳ‬䏣ԕӗ⭏㢟ྭⲴተ䜘䙬䘁DŽ

䘉Ӌ㔃䇪㺘᰾ᴹ䲀␡ᓖⲴࡽ侸㖁㔌Ѫ৽ੁՐ᫝㇇⌅ᨀ‫׋‬Ҷ䶎ᑨᴹ㺘ᖱ࣋Ⲵ‫ٷ‬䇮オ䰤DŽ❦
㘼䇠տл䶒а⛩ᱟ䟽㾱Ⲵ˖ởᓖл䱽ᱟӾањࡍ࿻Ⲵᵳ٬ᔰ࿻Ⲵˈഐ↔ᩌ㍒㤳ത䟼Ⲵ㖁㔌ᵳ
ੁ䟿ਟ㜭нवਜ਼ᡰᴹⲴᵳੁ䟿DŽHertz et al.˄1991˅ᨀ‫׋‬Ҷк䶒㔃䇪Ⲵᴤ䈖㓶Ⲵ䇘䇪DŽ
4.6.3 ‫ٽ‬䇴グ䰪ᩒ㍘ૂᖈ㓩‫څ‬㖤

ᢺ৽ੁՐ᫝㇇⌅Ⲵ‫ٷ‬䇮オ䰤ᩌ㍒઼ަԆᆖҐ㇇⌅䟷ਆⲴᩌ㍒⴨∄䖳ᖸᴹ᜿ѹDŽሩҾ৽ੁ
Ր᫝㇇⌅ˈ㖁㔌ᵳⲴ⇿а⿽ਟ㜭䍻٬䜭㺘⽪Ҷањਕ⌅н਼Ⲵ‫ٷ‬䇮ˈ৏ࡉк䜭൘ᆖҐಘⲴ㘳
㲁㤳ത޵DŽᦒਕ䈍䈤ˈ䘉њ‫ٷ‬䇮オ䰤ᱟ n њ㖁㔌ᵳ٬Ⲵ n 㔤⅗∿オ䰤DŽ⌘᜿䘉њオ䰤ᱟ䘎㔝
Ⲵˈ䘉оߣㆆṁᆖҐ઼ަԆสҾ⿫ᮓ㺘⽪Ⲵᯩ⌅Ⲵ‫ٷ‬䇮オ䰤ᆼ‫ޘ‬н਼DŽ‫ٷ‬䇮オ䰤Ⲵ䘎㔝ᙗԕ
৺䈟ᐞ E ‫ޣ‬Ҿ‫ٷ‬䇮Ⲵ䘎㔝৲ᮠਟᗞ䘉єњһᇎˈሬ㠤Ҷањ㢟ᇊѹⲴ䈟ᐞởᓖˈѪᴰ֣‫ٷ‬
䇮Ⲵᩌ㍒ᨀ‫׋‬Ҷањ䶎ᑨᴹ⭘Ⲵ㔃ᶴDŽ䘉њ㔃ᶴоสҾㅖਧⲴᾲᘥᆖҐ㇇⌅ⲴĀа㡜ࡠ⢩↺
ᒿāᩌ㍒Ⲵ㔃ᶴˈᡆ ID3 ઼ C4.5 ㇇⌅ѝሩߣㆆṁⲴㆰঅࡠ༽ᵲᒿᩌ㍒ᡰ⭘Ⲵ㔃ᶴ䜭ᆼ‫ޘ‬н
਼DŽ

৽ੁՐ᫝㇇⌅Ӿ㿲⍻ᮠᦞѝ⌋ॆⲴᖂ㓣‫ٿ‬㖞ᱟӰѸ઒˛㋮⺞ൠ࡫⭫৽ੁՐ᫝ᆖҐⲴᖂ
㓣‫ٿ‬㖞ᱟᴹ䳮ᓖⲴˈഐѪᆳ‫׍‬䎆Ҿởᓖл䱽ᩌ㍒઼ᵳオ䰤㾶ⴆਟ㺘ᖱ࠭ᮠオ䰤ⲴᯩᔿⲴ⴨ӂ
֌⭘ᙗDŽ❦㘼ˈਟԕᢺ䘉а‫ٿ‬㖞㋇⮕ൠ࡫⭫Ѫ在数据点之间平滑插值˄smooth interpolation
between data points˅DŽྲ᷌㔉ᇊєњ↓ֻˈᆳԜѻ䰤⋑ᴹ৽ֻˈ৽ੁՐ᫝㇇⌅Պ‫ੁٮ‬Ҿᢺ䘉
є⛩ѻ䰤Ⲵ⛩ҏḷ䇠Ѫ↓ֻDŽֻྲˈ൘മ 4-5 ⭫ࠪⲴߣㆆ䶒ѝਟԕⴻࡠ䘉а⛩ˈ䇝㓳ṧֻⲴ
⢩ᇊṧᵜӗ⭏Ҷᒣ━ਈॆⲴߣㆆ४ฏDŽ

4.6.4 䳆㰅ቸ㺞⽰

৽ੁՐ᫝㇇⌅Ⲵањ䘧ӪⲴ⢩ᙗᱟˈᆳ㜭ཏ൘㖁㔌޵䜘Ⲵ䳀㯿ቲਁ⧠ᴹ⭘Ⲵѝ䰤㺘⽪DŽ
ഐѪ䇝㓳ṧֻӵवਜ਼㖁㔌䗃‫઼ޕ‬䗃ࠪˈᵳ٬䈳㢲Ⲵ䗷〻ਟԕ㠚⭡ൠ䇮㖞ᵳ٬ˈᶕᇊѹ൘ᴰሿ
ॆ䈟ᐞᒣᯩ E ѝᴰᴹ᭸Ⲵԫօ䳀㯿অ‫ݳ‬㺘⽪DŽ䘉㜭ཏᕅሬ৽ੁՐ᫝㇇⌅ᇊѹᯠⲴ䳀㯿ቲ⢩
ᖱˈ䘉Ӌ⢩ᖱ൘䗃‫ޕ‬ѝ⋑ᴹ᰾⺞㺘⽪ࠪᶕˈնত㜭ᦅ᥹䗃‫ޕ‬ᇎֻѝоᆖҐⴞḷ࠭ᮠᴰ⴨‫Ⲵޣ‬
⢩ᖱDŽ

ֻྲˈ㘳㲁മ 4-7 ᡰ⽪Ⲵ㖁㔌DŽ䘉䟼ˈ8 њ㖁㔌䗃‫ޕ‬о 3 њ䳀㯿অ‫⴨ݳ‬䘎ˈ3 њ䳀㯿অ


‫ݳ‬৸‫⅑׍‬䘎᧕ࡠ 8 њ䗃ࠪঅ‫ݳ‬DŽ⭡Ҿ䘉ṧⲴ㔃ᶴˈ3 њ䳀㯿অ‫ݳ‬ᗵ享䟽ᯠ㺘⽪ 8 њ䗃‫ޕ‬٬ˈ
ԕḀ⿽ᯩᔿᦅ᥹䗃‫ޣ⴨Ⲵޕ‬⢩ᖱˈԕ‫ׯ‬䘉њ䳀㯿ቲⲴ㺘⽪ਟԕ㻛䗃ࠪঅ‫⭘ݳ‬ᶕ䇑㇇↓⺞Ⲵⴞ
ḷ٬DŽ

插图——原书页码:107

Inputs-䗃‫ޕ‬

Outputs-䗃ࠪ

Input-䗃‫ޕ‬٬

Output-䗃ࠪ٬

Hidden Values-䳀㯿٬

മ 4-7 ᆖҐࡠⲴ䳀㯿ቲ㺘⽪
䘉њ 8u3u8 Ⲵ㖁㔌㻛䇝㓳ԕᆖҐᚂㅹ࠭ᮠˈ֯⭘മѝᡰ⽪Ⲵ 8 њ䇝㓳ṧֻDŽ൘ 5000 䖞˄epochs˅
䇝㓳ѻਾˈ3 њ䳀㯿অ‫⭘֯ݳ‬മਣ‫Ⲵח‬㕆⸱ᯩᔿᶕ㕆⸱ 8 њ⴨ӂн਼Ⲵ䗃‫ޕ‬DŽ⌘᜿ྲ᷌ᢺ㕆⸱ਾⲴ
٬ഋ㠽ӄ‫ޕ‬Ѫ 0 ઼ 1ˈ䛓Ѹ㔃᷌ᱟ 8 њн਼٬Ⲵḷ߶Ҽ䘋٬㕆⸱DŽ

& & &


㘳㲁䇝㓳മ 4-7 ᡰ⽪Ⲵ㖁㔌ˈᶕᆖҐㆰঅⲴⴞḷ࠭ᮠ f( x )= x ˈަѝ x ᱟਜ਼ᴹгњ 0 ઼
ањ 1 Ⲵੁ䟿DŽ㖁㔌ᗵ享ᆖՊ൘ 8 њ䗃ࠪঅ‫ݳ‬䟽⧠䘉 8 њ䗃‫ޕ‬DŽቭ㇑䘉ᱟањㆰঅⲴ࠭ᮠˈ
ն⧠൘䲀ࡦ㖁㔌ਚ㜭֯⭘ 3 њ䳀অ‫ݳ‬DŽᡰԕˈᆖҐࡠⲴ 3 њ䳀㯿অ‫ݳ‬ᗵ享ᦅ᥹տᶕ㠚 8 њ䗃
‫ޕ‬অ‫Ⲵݳ‬ᡰᴹ‫ޣ‬䭞ؑ᚟DŽ

ᖃ৽ੁՐ᫝㇇⌅㻛⭘ᶕᆼᡀ䘉њԫ࣑ᰦˈ֯⭘ 8 њਟ㜭ੁ䟿֌Ѫ䇝㓳ṧֻˈᆳᡀ࣏ൠᆖ
ՊҶⴞḷ࠭ᮠDŽởᓖл䱽Ⲵ৽ੁՐ᫝㇇⌅ӗ⭏Ⲵ䳀㯿ቲ㺘⽪ᱟӰѸ઒˛䙊䗷࠶᷀ᆖҐࡠⲴ㖁
㔌ሩҾ 8 њਟ㜭䗃‫ੁޕ‬䟿ӗ⭏Ⲵ䳀㯿অ‫Ⲵݳ‬٬ˈਟԕⴻࠪᆖࡠⲴ㕆⸱઼⟏⸕Ⲵሩ 8 њ٬֯⭘
3 սḷ߶Ҽ䘋ࡦ㕆⸱⴨਼˄ҏቡᱟ 000ˈ001ˈ010ˈĂĂˈ111˅DŽമ 4-7 ᱮ⽪Ҷ৽ੁՐ᫝㇇
⌅Ⲵа⅑䘀㹼ѝ䇑㇇ࠪⲴ䘉 3 њ䳀㯿অ‫࠷⺞Ⲵݳ‬٬DŽ

ཊቲ㖁㔌൘䳀㯿ቲ㠚ࣘਁ⧠ᴹ⭘㺘⽪Ⲵ㜭࣋ᱟ ANN ᆖҐⲴањ‫ޣ‬䭞⢩ᙗDŽо䛓Ӌӵ䲀


Ҿ֯⭘Ӫ㊫䇮䇑㘵ᨀ‫Ⲵ׋‬亴ᇊѹ⢩ᖱⲴᆖҐᯩ⌅⴨∄ˈᆳᨀ‫׋‬Ҷа⿽⴨ᖃ䟽㾱Ⲵ⚥⍫ᙗüü
‫ݱ‬䇨ᆖҐಘࡋ䙐ࠪ䇮䇑㘵⋑ᴹ᰾⺞ᕅ‫Ⲵޕ‬⢩ᖱDŽᖃ❦䘉Ӌࡋ䙐ࠪⲴ⢩ᖱаᇊᱟ㖁㔌䗃‫Ⲵޕ‬
sigmoid অ‫࠭ݳ‬ᮠਟԕ䇑㇇ࠪⲴDŽ⌘᜿㖁㔌ѝ֯⭘Ⲵঅ‫ݳ‬ቲ䎺ཊˈቡਟԕࡋ䙐ࠪ䎺༽ᵲⲴ⢩
ᖱDŽ4.7 㢲㾱䇘䇪ⲴӪ㝨䇶࡛ᓄ⭘ᨀ‫׋‬Ҷ䳀㯿অ‫ݳ‬⢩ᖱⲴਖањֻᆀDŽ

ѪҶ໎ᕪሩ䘉њֻᆀѝ৽ੁՐ᫝㇇⌅᫽֌Ⲵⴤ㿲⨶䀓ˈ䇙ᡁԜᴤ䈖㓶ൠ࠶᷀ởᓖл䱽䗷
〻ѝⲴާփ᫽֌ķDŽ֯⭘㺘 4-2 ѝⲴ㇇⌅䇝㓳മ 4-7 ѝⲴ㖁㔌ˈ䇮㖞ࡍ࿻Ⲵᵳ٬Ѫ४䰤˄-0.1,
0.1˅ѝⲴ䲿ᵪᮠˈᆖҐ䙏⦷K=0.3ˈ⋑ᴹᵳߢ䟿˄ণD=0˅DŽ֯⭘ަԆⲴᆖҐ䙏⦷઼֯⭘䶎 0
Ⲵߢ䟿ᗇࡠⲴ㔃᷌⴨լDŽ മ 4-7 ѝᱮ⽪Ⲵ䳀㯿অ‫ݳ‬㕆⸱ᱟ൘ᢗ㹼Ҷ㇇⌅Ⲵཆቲ䇝㓳䘝ԓ 5000
⅑ਾᗇࡠⲴ˄ҏቡᱟሩ 8 њ䇝㓳ṧֻⲴ⇿ањ䘝ԓ 5000 ⅑˅DŽ❦㘼੨ᕅᡁԜ⌘᜿Ⲵབྷཊᮠᵳ
٬ਈॆᱟਁ⭏൘ࡽ 2500 ⅑ⲴDŽ

ᡁԜਟԕ᧿㔈ࠪ䗃ࠪ䈟ᐞⲴᒣᯩ⴨ሩởᓖл䱽ᩌ㍒↕ᮠⲴ࠭ᮠᴢ㓯ˈ䘉ṧቡਟԕⴤ᧕㿲
ሏ৽ੁՐ᫝㇇⌅Ⲵởᓖл䱽ᩌ㍒Ⲵ᭸᷌DŽᆳᱮ⽪൘മ 4-8 ѝᴰк䶒Ⲵᴢ㓯മѝDŽ䘉ᑵമⲴ 8
ᶑᴢ㓯ሩᓄ 8 њ㖁㔌䗃ࠪˈ⇿аᶑᴢ㓯䜭ᱮ⽪Ҷ⴨ᓄⲴ㖁㔌䗃ࠪሩᡰᴹ䇝㓳ṧֻⲴ䈟ᐞᒣᯩ
઼DŽ⁚䖤㺘⽪৽ੁՐ᫝㇇⌅Ⲵᴰཆቲ䘝ԓⲴ⅑ᮠDŽྲമѝᡰᱮ⽪Ⲵˈ⇿њ䗃ࠪⲴ䈟ᐞᒣᯩ઼
䲿⵰ởᓖл䱽䗷〻㘼л䱽ˈḀӋঅ‫ݳ‬ᘛаӋˈḀӋঅ‫ݳ‬䖳ធDŽ

䳀㯿অ‫ݳ‬㺘⽪Ⲵ╄ਈ䗷〻ਟԕ൘മ 4-8 ⲴㅜҼᑵമѝⴻࡠDŽ䘉ᑵമᱮ⽪ҶሩҾањਟ㜭


Ⲵ䗃‫˄ޕ‬䘉ᑵമሩᓄⲴᱟ 01000000˅㖁㔌䇑㇇ࠪⲴйњ䳀㯿অ‫ݳ‬٬DŽ઼ࡽ䶒аṧˈ⁚䖤㺘
⽪䇝㓳ᗚ⧟Ⲵ⅑ᮠDŽྲമѝᡰᱮ⽪Ⲵˈ䘉њ㖁㔌᭦ᮋࡠമ 4-7 ѝ㔉ࠪⲴᴰ㓸Ⲵ㕆⸱ѻࡽ㓿শ
Ҷᖸཊн਼Ⲵ㕆⸱DŽ

ᴰਾˈമ 4-8 ѝⲴㅜ 3 ᑵമ⭫ࠪҶ㖁㔌ѝ਴њᵳ٬Ⲵ╄ਈ䗷〻DŽ䘉ᑵമᱮ⽪Ҷ䘎᧕ 8 њ


䗃‫ޕ‬অ‫઼˄ݳ‬ањᑨ䟿‫ٿ‬㖞䗃‫˄ޕ‬constant bias input˅˅ࡠ 3 њ䳀অ‫ݳ‬ѻаⲴᵳ٬Ⲵ╄ਈ䗷〻DŽ
⌘᜿䘉њ䳀㯿অ‫ݳ‬ᵳ٬Ⲵᱮ㪇ਈॆо䳀㯿ቲ㕆⸱઼䗃ࠪ䈟ᐞᒣᯩⲴᱮ㪇ਈॆа㠤DŽ䘉䟼᭦ᮋ

ķ
䘉њֻᆀⲴⓀԓ⸱ਟԕӾhttp://www.cs.cmu.edu/~tom/mlbook.htmlᗇࡠDŽ
᧕䘁 0 Ⲵᵳ٬ᱟ‫ٿ‬㖞ᵳw0DŽ

插图——原书页码:109

Sum of squared errors for each output unit-⇿њ䗃ࠪঅ‫Ⲵݳ‬䈟ᐞᒣᯩ઼

Hidden unit encoding for input 01000000-䗃‫ ޕ‬01000000 Ⲵ䳀㯿অ‫ݳ‬㕆⸱

Weights from inputs to one hidden unit-䗃‫ࡠޕ‬ањ䳀㯿অ‫Ⲵݳ‬ᵳ

മ 4-8 ᆖҐ 8u3u8 㖁㔌

ᴰкമᱮ⽪Ҷ䲿⵰䇝㓳䘝ԓ⅑ᮠ˄䖞ᮠ˅Ⲵ໎࣐ˈ8 њ䗃‫Ⲵޕ‬䈟ᐞᒣᯩ઼Ⲵ╄ਈDŽѝമᱮ⽪ҶሩҾ
䗃‫ޕ‬ѢĀ01000000āⲴ䳀㯿ቲ㺘⽪Ⲵ╄ਈDŽлമᱮ⽪Ҷ 3 њ䳀㯿অ‫ݳ‬ѻаⲴᵳ٬╄ਈ䗷〻DŽ

4.6.5 ⌑ौθ䗽ᓜᤕਾૂ‫ᦤ࡚↘ڒ‬

൘㺘 4-2 ሩ৽ੁՐ᫝㇇⌅Ⲵ᧿䘠ѝˈ⋑ᴹᤷᇊ㇇⌅֯⭘Ⲵ㓸→ᶑԦDŽ㓸→ᵳ٬ᴤᯠᗚ⧟
Ⲵਸ䘲ᶑԦᱟӰѸ઒˛ᖸ᰾ᱮˈа⿽䘹ᤙᱟ㔗㔝䇝㓳ⴤࡠሩ䇝㓳ṧֻⲴ䈟ᐞ E 䱽վ㠣Ḁњ
亴‫ݸ‬ᇊѹⲴ䰸٬ѻлDŽһᇎкˈ䘉нᱟањྭⲴㆆ⮕ˈഐѪ৽ੁՐ᫝㇇⌅ᇩ᱃䗷ᓖᤏਸ䇝㓳
ṧֻˈ䱽վҶሩҾަԆᵚ㿱䗷ᇎֻⲴ⌋ॆ㋮ᓖDŽ

ѪҶⴻࠪ֯䇝㓳ᮠᦞк䈟ᐞᴰሿॆⲴড䲙ˈ㘳㲁䈟ᐞ E ᱟྲօ䲿⵰ᵳ٬䘝ԓ⅑ᮠਈॆ
ⲴDŽമ 4-9 ᱮ⽪Ҷєњ⴨ᖃިරⲴ৽ੁՐ᫝㇇⌅ᓄ⭘ѝⲴ䘉⿽ਈॆDŽ俆‫ݸ‬㘳㲁മѝк䶒аᑵ
ᴢ㓯മDŽєᶑᴢ㓯ѝ䖳վⲴаᶑᱮ⽪Ҷ൘䇝㓳䳶ਸкⲴ䈟ᐞ E 䲿⵰ởᓖл䱽䘝ԓ⅑ᮠⲴ໎
࣐㘼অ䈳л䱽DŽ䖳儈Ⲵᴢ㓯ᱟ൘ањо䇝㓳ṧֻн਼Ⲵ傼䇱䳶ਸⲴᇎֻк⍻ࡠⲴ䈟ᐞ E Ⲵ
ᛵߥDŽ䘉ᶑ㓯⍻䟿Ҷ㖁㔌Ⲵ⌋ॆ㋮ᓖ˄generalization accuracy˅üü㖁㔌ᤏਸ䇝㓳ᮠᦞཆⲴ
ᇎֻⲴ㋮ᓖDŽ

⌘᜿൘傼䇱ṧֻк⍻䟿ࡠⲴⲴ䈟ᐞEķ‫ݸ‬л䱽ˈ❦ਾкॷˈቭ㇑൘䇝㓳ṧֻкⲴ䈟ᐞᤱ
㔝л䱽DŽѪӰѸՊਁ⭏䘉⿽⧠䊑઒˛䘉ᱟഐѪ䘉Ӌᵳ٬ᤏਸҶ䇝㓳ṧֻⲴĀ⢩ᔲᙗā
˄idiosyncrasy˅ˈ㘼䘉њĀ⢩ᔲᙗāሩҾṧֻⲴа㡜࠶ᐳ⋑ᴹԓ㺘ᙗDŽANNѝབྷ䟿Ⲵᵳ٬৲
ᮠѪᤏਸ䘉ṧⲴĀ⢩ᔲᙗāᨀ‫׋‬ҶᖸབྷⲴ㠚⭡ᓖDŽ

ѪӰѸ䗷ᓖᤏਸᖰᖰᱟਁ⭏൘䘝ԓⲴਾᵏˈ㘼нᱟ䘝ԓⲴᰙᵏ઒˛䇮ᜣ㖁㔌Ⲵᵳ٬ᱟ㻛
ࡍ࿻ॆѪሿ䲿ᵪ٬ⲴDŽ֯⭘䘉ӋࠐѾаṧⲴᵳ٬ӵ㜭᧿䘠䶎ᑨᒣ━Ⲵߣㆆ䶒DŽ䲿⵰䇝㓳Ⲵ䘋
㹼ˈаӋᵳ٬ᔰ࿻໎䮯ˈԕ䱽վ൘䇝㓳ᮠᦞкⲴ䈟ᐞˈ਼ᰦᆖҐࡠⲴߣㆆ䶒Ⲵ༽ᵲᓖҏ൘ᨀ
儈DŽҾᱟˈ䲿⵰ᵳ٬䈳ᮤ䘝ԓ⅑ᮠⲴ໎࣐ˈ৽ੁՐ᫝㇇⌅㧧ᗇⲴ‫ٷ‬䇮Ⲵᴹ᭸༽ᵲᓖҏ൘໎࣐DŽ
ྲ᷌ᵳ٬䈳ᮤ䘝ԓ⅑ᮠ䏣ཏཊˈ৽ੁՐ᫝㇇⌅㓿ᑨՊӗ⭏䗷ᓖ༽ᵲⲴߣㆆ䶒ˈᤏਸҶ䇝㓳ᮠ
ᦞѝⲴಚ༠઼䇝㓳ṧֻѝ⋑ᴹԓ㺘ᙗⲴ⢩ᖱDŽ䘉њ䗷ᓖᤏਸ䰞仈оߣㆆṁᆖҐѝⲴ䗷ᓖᤏਸ

ķ
䈁⌘˖৏Җ↔༴ᴹ䈟ˈ৏ਕѪgeneralization accuracy‫ݸ‬л䱽ਾкॷˈᱮ❦䘉䟼Ⲵgeneralization accuracyᓄ
Ѫerror E˅DŽ
䰞仈⴨լ˄㿱ㅜ 3 ㄐ˅DŽ

ᴹࠐ⿽ᢰᵟਟԕ⭘Ҿ䀓ߣ৽ੁՐ᫝ѝⲴ䗷ᓖᤏਸ䰞仈DŽа⿽ᯩ⌅㻛〠Ѫᵳ٬㺠߿
˄weight decay˅ˈᆳ൘⇿⅑䘝ԓ䗷〻ѝԕḀњሿഐᆀ䱽վ⇿њᵳ٬DŽ䘉ㅹ᭸Ҿ‫؞‬᭩ E Ⲵᇊѹˈ
࣐‫ޕ‬ањо㖁㔌ᵳ٬Ⲵᙫ䟿⴨ᓄⲴ᜙㖊亩DŽ↔ᯩ⌅Ⲵࣘᵪ൘Ҿ‫؍‬ᤱᵳ٬䖳ሿˈӾ㘼֯ᆖҐ䗷
〻ੁ⵰༽ᵲߣㆆ䶒Ⲵ৽ᯩੁ‫ٿ‬㖞DŽ

‫ݻ‬ᴽ䗷ᓖᤏਸ䰞仈Ⲵањᴰᡀ࣏Ⲵᯩ⌅ˈቡᱟ൘䇝㓳ᮠᦞཆ޽Ѫ㇇⌅ᨀ‫׋‬а྇傼䇱ᮠᦞ
˄validation data˅DŽ㇇⌅൘֯⭘䇝㓳䳶ਸ傡ࣘởᓖл䱽ᩌ㍒Ⲵ਼ᰦˈⴁ㿶ሩҾ䘉њ傼䇱䳶ਸ
Ⲵ䈟ᐞDŽᵜ䍘кˈ䘉⴨ᖃҾ‫ݱ‬䇨㇇⌅ᵜ䓛⭫ࠪമ 4-9 ѝᱮ⽪Ⲵєᶑᴢ㓯DŽ㇇⌅ᓄ䈕䘋㹼ཊቁ
⅑ᵳ٬䈳ᮤ䘝ԓ઒˛ᱮ❦ˈᓄ䈕֯⭘൘傼䇱䳶ਸкӗ⭏ᴰሿ䈟ᐞⲴ䘝ԓ⅑ᮠˈഐѪ䘉ᱟ㖁㔌
ᙗ㜭ሩҾᵚ㿱䗷ᇎֻⲴᴰྭ㺘ᖱDŽ൘䘉⿽ᯩ⌅Ⲵިරᇎ⧠ѝˈ㖁㔌Ⲵᵳ٬㻛‫⮉؍‬єԭᤧ䍍˖
аԭ⭘ᶕ䇝㓳ˈ㘼ਖаԭᤧ䍍֌ѪⴞࡽѪ→ᙗ㜭ᴰྭⲴᵳˈ㺑䟿Ⲵḷ߶ᱟᆳԜሩҾ傼䇱䳶ਸ
Ⲵ䈟ᐞDŽаᰖ䇝㓳ࡠⲴᵳ٬൘傼䇱䳶ਸкⲴ䈟ᐞ∄‫؍‬ᆈⲴᵳ٬Ⲵ䈟ᐞ儈ˈ䇝㓳㻛㓸→ˈᒦф
䘄എ‫؍‬ᆈⲴᵳ٬֌Ѫᴰ㓸Ⲵ‫ٷ‬䇮DŽᖃ䘉њ䗷〻㻛ᓄ⭘ࡠമ 4-9 ѝᴰкമⲴᛵߥᰦˈᆳሶ䗃ࠪ
൘ 9100 ⅑䘝ԓਾ㖁㔌ᗇࡠⲴᵳ٬DŽമ 4-9 ⲴㅜҼᑵᴢ㓯മᱮ⽪ˈнᱟᙫ㜭᰾ᱮ⺞ᇊ傼䇱䳶
ਸօᰦ䗮ࡠᴰሿ䈟ᐞDŽ൘䘉ᑵമѝˈ傼䇱䳶ਸⲴ䈟ᐞ‫ݸ‬л䱽ˈ❦ਾкॷˈ❦ਾ޽л䱽DŽᡰԕ
ᗵ享⌘᜿䚯‫ݽ‬䭉䈟Ⲵ㔃䇪˖൘ 850 ⅑䘝ԓਾ㖁㔌ࡠ䗮ҶᆳⲴᴰሿ傼䇱䳶ਸ䈟ᐞDŽ

插图——原书页码:110

Error versus weight updates(example 1)-䈟ᐞ⴨ሩᵳ٬ᴤᯠ⅑ᮠਈॆᴢ㓯˄ֻ 1˅

Error versus weight updates(example 2)- 䈟ᐞ⴨ሩᵳ٬ᴤᯠ⅑ᮠਈॆᴢ㓯˄ֻ 2˅

Error-䈟ᐞ

Number of weight updates-ᵳ٬ᴤᯠ⅑ᮠ

Training set error-䇝㓳䳶ਸⲴ䈟ᐞ

Validation set error-傼䇱䳶ਸⲴ䈟ᐞ

മ 4-9 єњн਼ᵪಘӪᝏ⸕ԫ࣑Ⲵ䈟ᐞ E ⴨ሩᵳ٬ᴤᯠ⅑ᮠⲴਈॆᴢ㓯

є⿽ᛵߥлˈ൘䇝㓳ṧֻкⲴ䈟ᐞ E 䜭অ䈳л䱽ˈഐѪởᓖл䱽Ⲵⴞḷᱟᴰሿॆ䘉њ䈟ᐞDŽሩҾঅ
⤜Ⲵ傼䇱䳶ਸѝⲴṧֻˈ䈟ᐞ E 䙊ᑨ‫ݸ‬л䱽ˈ❦ਾ䈟ᐞਟ㜭ഐѪ䗷ᓖᤏਸ䇝㓳ṧֻ㘼кॷDŽᴰᴹਟ
㜭↓⺞⌋ॆࡠᵚ㿱䗷ᮠᦞⲴ㖁㔌ᱟሩҾ傼䇱䳶ਸᴹᴰሿ䈟ᐞⲴ㖁㔌DŽ⌘᜿൘ㅜҼᑵᴢ㓯മѝˈᗵ享
ሿᗳн㾱䗷ᰙ‫→ڌ‬䇝㓳ˈഐѪ൘傼䇱䳶ਸкⲴ䈟ᐞ E ൘䘝ԓࡠ 850 ⅑ᰦᔰ࿻кॷ㘼ਾ৸л䱽DŽ

а㡜㘼䀰ˈ䗷ᓖᤏਸ䰞仈ԕ৺‫ݻ‬ᴽᆳⲴᯩ⌅ᱟањἈ᡻Ⲵ䰞仈DŽк䶒ⲴӔ৹傼䇱ᯩ⌅൘
ਟ㧧ᗇ仍ཆⲴᮠᦞᨀ‫׋‬傼䇱䳶ਸᰦᐕ֌ᗇᴰྭDŽ❦㘼нᒨⲴᱟˈ䗷ᓖᤏਸⲴ䰞仈ሩሿ䇝㓳䳶
ਸᴰѕ䟽DŽ൘䘉⿽ᛵߥлˈᴹᰦ֯⭘а⿽〠ѪĀk-foldӔ৹傼䇱˄k-fold cross-validation˅āⲴ
ᯩ⌅ˈ䘉⿽ᯩ⌅䘋㹼k⅑н਼ⲴӔ৹傼䇱ˈ⇿⅑֯⭘ᮠᦞⲴн਼࠶ࢢ֌Ѫ䇝㓳䳶ਸ઼傼䇱䳶
ਸˈ❦ਾሩ㔃᷌䘋㹼ᒣ൷DŽ൘䘉⿽ᯩ⌅Ⲵањ⡸ᵜѝˈᢺਟ‫Ⲵ⭘֯׋‬mњᇎֻ࠶ࢢᡀkњн
⴨ӔⲴᆀ䳶ˈ⇿њᆀ䳶ᴹm/kњᇎֻDŽ❦ਾˈ䘀㹼k⅑Ӕ৹傼䇱䗷〻ˈ⇿а⅑֯⭘н਼Ⲵᆀ䳶
֌Ѫ傼䇱䳶ਸˈᒦਸᒦަԆⲴᆀ䳶֌Ѫ䇝㓳䳶ਸDŽҾᱟˈ⇿ањṧֻՊ൘а⅑ᇎ傼ѝ㻛⭘֌
傼䇱䳶ਸⲴᡀઈˈ൘k-1 ⅑ᇎ傼ѝ⭘֌䇝㓳䳶ਸⲴᡀઈDŽ൘⇿⅑䈅傼ѝˈ䜭֯⭘к䶒䇘䇪Ⲵ
Ӕ৹傼䇱䗷〻ˈᶕߣᇊ൘傼䇱䳶ਸкਆᗇᴰ֣ᙗ㜭Ⲵ䘝ԓ⅑ᮠiDŽ❦ਾ䇑㇇䘉ӋiⲴ൷٬ i ˈ
ᴰਾ䘀㹼а⅑৽ੁՐ᫝㇇⌅ˈ䇝㓳ᡰᴹmњķᇎֻᒦ䘝ԓ i ⅑ˈ↔ᰦ⋑ᴹ傼䇱䳶ਸDŽ䘉њ䗷〻
оㅜ 5 ㄐ᧿䘠ⲴสҾᴹ䲀ᮠᦞ∄䖳є⿽ᆖҐᯩ⌅Ⲵ䗷〻ᖸ⴨䘁DŽ

4.7 ⽰ׁφӰ㝮䇼ࡡ

ѪҶ䈤᰾৽ੁՐ᫝㇇⌅ᓄ⭘ѝⲴаӋᇎ䱵Ⲵ䇮䇑䰞仈ˈ䘉а㢲䇘䇪ᢺ䘉њ㇇⌅ᓄ⭘ࡠӪ
㝨䇶࡛ⲴᆖҐԫ࣑DŽ䘉а㢲⭘ᶕӗ⭏䘉њֻᆀⲴᡰᴹമ‫ۿ‬ᮠᦞ઼ԓ⸱䜭ਟԕӾԕл㖁൰ᗇ
ࡠ˖http://www.cs.cmu.edu//~tom/mlbook.htmlˈ਼ᰦ䘈ᴹྲօ֯⭘䘉Ӌԓ⸱Ⲵᆼᮤ᮷ẓDŽ䈫
㘵ਟԕ㠚ᐡ䘋㹼䈅傼DŽ

4.7.1 Աࣗ

䘉䟼ⲴᆖҐԫ࣑ᱟ࠶㊫н਼ӪⲴн਼ုᘱⲴᩴᖡമ‫ۿ‬DŽᡁԜ᭦䳶Ҷ 20 њн਼ⲴӪⲴᩴ
ᖡമ‫⇿ˈۿ‬њӪབྷ㓖ᴹ 32 ᕐമ‫ˈۿ‬ሩᓄ䘉њӪн਼Ⲵ㺘ᛵ˄ᘛҀˈ⋞їˈ᝔ᙂˈѝᙗ˅˗Ԇ
ԜⴻⲴн਼ᯩੁ˄ᐖˈਣˈ↓ࡽˈк˅˗઼ԆԜᱟ੖ᡤཚ䱣䮌DŽӾമ 4-10 Ⲵ⽪ֻമ‫ۿ‬ѝਟԕ
ⴻࡠˈӪਾ䶒Ⲵ㛼ᲟǃクⲴ㺓ᴽǃ઼Ӫ㝨൘മ‫ۿ‬ѝⲴս㖞ҏ䜭ᴹᐞᔲDŽᡁԜ‫ޡ‬᭦䳶Ҷ 624
ᑵ⚠ᓖമ‫⇿ˈۿ‬аᑵⲴ࠶䗘⦷Ѫ 120u128ˈമ‫⇿Ⲵۿ‬њ‫ۿ‬㍐֯⭘ 0˄唁㢢˅ࡠ 255˄ⲭ㢢˅
Ⲵ⚠ᓖ٬᧿䘠DŽ

Ӿ䘉Ӌമ‫ۿ‬ᮠᦞѝਟԕᆖҐᖸཊн਼Ⲵⴞḷ࠭ᮠDŽֻྲˈᡁԜਟԕ䇝㓳ањ ANNˈ֯
㔉ᇊаᑵമ‫ۿ‬䗃‫ޕ‬ᰦ䗃ࠪ䘉њӪⲴᜏаḷ䇶˄identity˅ǃ㝨Ⲵᵍੁǃᙗ࡛ǃᱟ੖ᑖཚ䱣䮌ㅹDŽ
ᡰᴹ䘉Ӌⴞḷ࠭ᮠਟԕԕᖸ儈Ⲵ㋮ᓖӾ䘉ӋᮠᦞѝᆖҐࡠˈ啃࣡䈫㘵Ԝ㠚㹼䈅傼DŽ൘ᵜ㢲ਾ
䶒Ⲵ䜘࠶ˈᡁԜ㘳㲁ањ⢩ᇊⲴԫ࣑˖ᆖҐമ‫ۿ‬ѝӪ㝨Ⲵᵍੁ˄ᐖˈਣˈ↓ࡽˈ䘈ᱟк˅DŽ

插图——原书页码:113

30u32resolution input images- 30u32 ࠶䗘⦷Ⲵ䗃‫ޕ‬മ‫ۿ‬

Network weights after 1 iteration through each training example- ሩ⇿њ䇝㓳ṧֻ䘝ԓ


1 ⅑ਾⲴ㖁㔌ᵳ٬

Network weights after 100 iteration through each training example- ሩ⇿њ䇝㓳ṧֻ䘝ԓ
100 ⅑ਾⲴ㖁㔌ᵳ٬

left: ᐖ

straight: ࡽ

ķ
䈁⌘˖৏Җ↔༴䈟Ѫn
right: ਣ

up: к

മ 4-10 ᆖҐ䇶࡛Ӫ㝨ᵍੁⲴӪᐕ⾎㓿㖁㔌

䘉䟼֯⭘Ӫ㝨Ⲵ⚠ᓖമ‫˄ۿ‬㿱ᴰка㹼˅䇝㓳ањ 960u3u4 Ⲵ㖁㔌ˈᶕ亴⍻ањӪᱟ൘ੁᐖǃੁਣǃ


ੁࡽ䘈ᱟੁкⴻDŽ൘֯⭘Ҷ 260 ᑵ䘉ṧⲴമ‫ۿ‬䇝㓳ਾˈ䘉њ㖁㔌ሩҾ⤜・Ⲵ傼䇱䳶ਸ䗮ࡠҶ 90%
Ⲵ㋮ᓖDŽമѝҏᱮ⽪Ҷ֯⭘䇝㓳ṧֻ䘝ԓ 1 ⅑ਾ઼䘝ԓ 100 ⅑ਾⲴ㖁㔌ᵳ٬DŽ⇿њ䗃ࠪঅ‫˄ݳ‬ᐖˈ
ࡽˈਣˈк˅ᴹഋњᵳ٬ˈ⭘᳇˄䍏˅઼᰾˄↓˅Ⲵᯩඇᱮ⽪DŽᴰᐖ‫Ⲵח‬ᯩඇሩᓄᵳw0ˈᆳߣᇊঅ
‫Ⲵݳ‬䰸٬ˈਣ䶒ⲴйњᯩඇሩᓄӾйњ䳀㯿অ‫ݳ‬䗃‫Ⲵޕ‬ᵳDŽമѝҏᱮ⽪Ҷ⇿њ‫ۿ‬㍐䗃‫⇿ࡠޕ‬њ䳀㯿
অ‫Ⲵݳ‬ᵳ٬ˈ㻛⭫൘ሩᓄ‫ۿ‬㍐Ⲵս㖞DŽ

4.7.2 䇴䇗㾷㍖

ᓄ⭘৽ੁՐ᫝㇇⌅ࡠањ㔉ᇊԫ࣑ᰦˈᗵ享ߣᇊࠐњ䇮䇑㾱㍐DŽл䶒ᡁԜᖂ㓣ࠪҶᆖҐ
Ӫ㝨ᵍੁ䘉њᆖҐԫ࣑ⲴаӋ䇮䇑㾱㍐DŽቭ㇑ᡁԜ⋑ᴹᢃ㇇৫䘹ᤙ㋮⺞ⲴᴰՈ䇮䇑ˈն䘉䟼
᧿䘠Ⲵ䇮䇑ሩⴞḷ࠭ᮠᆖҐᗇ⴨ᖃྭDŽ൘䇝㓳Ҷ 260 ᑵമ‫ۿ‬ṧֻѻਾˈሩҾ⤜・⍻䈅䳶ਸⲴ
㋮ᓖ䗮ࡠ 90%DŽ⴨ሩ㘼䀰ˈྲ᷌䲿ᵪ⥌⍻ഋњ㝨ᵍੁѝⲴањˈਚ㜭䗮ࡠ 25%Ⲵ↓⺞⦷DŽ

䗃‫ޕ‬㕆⸱DŽᐢ㓿⸕䚃 ANN Ⲵ䗃‫ޕ‬ᗵ❦ᱟമ‫Ⲵۿ‬Ḁ⿽㺘⽪ˈ䛓Ѹ䇮䇑Ⲵ‫ޣ‬䭞ᱟྲօ㕆


⸱䘉ᑵമ‫ۿ‬DŽֻྲᡁԜਟԕሩമ‫ۿ‬䘋㹼亴༴⨶ˈᶕ࠶䀓ࠪ䗩㕈ǃӞᓖа㠤Ⲵ४ฏᡆަԆተ䜘
മ‫ۿ‬⢩ᖱˈ❦ਾᢺ䘉Ӌ⢩ᖱ䗃‫ޕ‬㖁㔌DŽ䘉⿽䇮䇑Ⲵањ䰞仈ᱟՊሬ㠤⇿ᑵമ‫ۿ‬ᴹн਼ᮠ䟿Ⲵ
⢩ᖱ৲ᮠ˄ֻྲ䗩㕈Ⲵᮠ䟿˅ˈ❦㘼 ANN ާᴹപᇊᮠ䟿Ⲵ䗃‫ޕ‬অ‫ݳ‬DŽሩҾ䘉⿽ᛵߥˈᡁԜ
Ⲵ䇮䇑ᱟᢺമ‫ۿ‬㕆⸱ᡀപᇊⲴ 30u32 ‫ۿ‬㍐ⲴӞᓖ٬ˈ⇿њ‫ۿ‬㍐ሩᓄањ㖁㔌䗃‫ޕ‬DŽᒦфᢺ㤳
തᱟ 0 ࡠ 255 ⲴӞᓖ٬᤹∄ֻ㓯ᙗ㕙᭮ࡠ 0 ࡠ 1 Ⲵ४䰤޵ˈԕ֯㖁㔌䗃‫ޕ‬о䳀অ‫઼ݳ‬䗃ࠪঅ
‫ݳ‬൘਼ṧⲴ४䰤ਆ٬DŽᇎ䱵к䘉䟼Ⲵ 30u32 ‫ۿ‬㍐മ‫ۿ‬ቡᱟ৏ᶕ 120u128 ‫ۿ‬㍐Ⲵമ‫Ⲵۿ‬վ࠶
䗘⦷ᾲᤜˈ⇿њվ࠶䗘⦷‫ۿ‬㍐ṩᦞሩᓄⲴ㤕ᒢ儈࠶䗘⦷‫ۿ‬㍐ӞᓖⲴ൷٬䇑㇇ᗇࡠDŽ֯⭘䘉ṧ
Ⲵվ࠶䗘⦷മ‫ˈۿ‬ᢺ䗃‫ޕ‬њᮠ઼ᵳ٬Ⲵᮠ䟿߿ቁࡠҶањᴤ᱃Ҿ༴⨶Ⲵ㿴⁑ˈӾ㘼䱽վҶ䘀
㇇㾱≲ˈն਼ᰦҏ‫⮉؍‬Ҷ䏣ཏⲴ࠶䗘⦷ԕ↓⺞࠶㊫മ‫ۿ‬DŽഎᗶമ 4-1 ѝ ALVINN ㌫㔏֯⭘
Ҷ⴨լⲴⲴ࠶䗘⦷മ‫֌ۿ‬Ѫ㖁㔌Ⲵ䗃‫ޕ‬DŽањᴹ䏓Ⲵᐞ࡛ᱟˈ൘ ALVINN ѝˈ⇿ањվ࠶
䗘⦷‫ۿ‬㍐ⲴӞᓖㅹҾӾ儈࠶䗘⦷മ‫ۿ‬ሩᓄⲴ४ฏѝ䲿ᵪਆањ‫ۿ‬㍐ⲴӞᓖˈ㘼нᱟਆ䘉њ४
ฏѝᡰᴹ‫ۿ‬㍐ӞᓖⲴ൷٬DŽަࣘᵪᱟѪҶ᰾ᱮൠ߿ቁӾ儈࠶䗘⦷മ‫ۿ‬ӗ⭏վ࠶䗘⦷മ‫ۿ‬ᡰ䴰
Ⲵ䘀㇇DŽ䘉њ᭸⦷ሩҾ ALVINN ㌫㔏ᱟ⢩࡛䟽㾱ⲴˈഐѪ൘㠚ࣘ傮傦䖖䖶Ⲵ䗷〻ѝˈALVINN
㌫㔏Ⲵ㖁㔌ᗵ享൘⇿。䫏༴⨶ᖸཊᑵമ‫ۿ‬DŽ

䗃ࠪ㕆⸱DŽANN ᗵ享䗃ࠪഋњ٬ѝⲴањᶕ㺘⽪䗃‫ޕ‬മ‫ۿ‬ѝӪ㝨Ⲵᵍੁ˄ᐖˈਣˈкˈ
ࡽ˅DŽ⌘᜿ᡁԜਟԕ֯⭘অаⲴ䗃ࠪঅ‫ݳ‬ᶕ㕆⸱䘉ഋ⿽ᛵߥⲴ࠶㊫ˈֻྲᤷᇊ䗃ࠪ٬ 0.2ˈ0.4ˈ
0.6 ઼ 0.8 ᶕ㕆⸱䘉ഋњਟ㜭٬DŽн䗷䘉䟼ᡁԜ֯⭘ 4 њн਼Ⲵ䗃ࠪঅ‫⇿ˈݳ‬ањሩᓄഋ⿽
ਟ㜭ᵍੁѝⲴа⿽ˈਆާᴹᴰ儈٬Ⲵ䗃ࠪ֌Ѫ㖁㔌Ⲵ亴⍻٬DŽ䘉⿽ᯩ⌅㓿ᑨ㻛〠Ѫ n ਆ 1
˄1-of-n˅䗃ࠪ㕆⸱DŽ䘹ᤙ n ਆ 1 䗃ࠪ㕆⸱㘼н⭘অњঅ‫ݳ‬ᴹєњࣘᵪDŽㅜаˈ䘉Ѫ㖁㔌㺘
⽪ⴞḷ࠭ᮠᨀ‫׋‬ҶᴤབྷⲴ㠚⭡ᓖ˄ণ൘䗃ࠪቲঅ‫ݳ‬ѝᴹ n ‫Ⲵؽ‬ਟ⭘ᵳ٬˅DŽㅜҼˈ൘ n ਆ 1
㕆⸱ѝˈᴰ儈٬䗃઼ࠪ⅑儈٬䗃ࠪ䰤Ⲵᐞᔲਟԕ֌Ѫሩ㖁㔌亴⍻Ⲵ㖞ؑᓖ˄н᰾⺞Ⲵ࠶㊫ਟ
㜭ሬ㠤㔃᷌⴨䘁ᡆ⴨ㅹ˅ DŽ䘋а↕Ⲵ䇮䇑䰞仈ᱟĀ䘉 4 њ䗃ࠪঅ‫ⴞⲴݳ‬ḷ٬ᓄ䈕ᱟӰѸ˛ā
ањᱮ㘼᱃㿱Ⲵ࣎⌅ᱟ⭘ 4 њⴞḷ٬<1ˈ0ˈ0ˈ0>ᶕ㕆⸱㝨ᵍੁᐖˈ<0ˈ1ˈ0ˈ0>ᶕ㕆⸱
㝨ᵍੁ↓ࡽˈ‫↔׍‬㊫᧘DŽᡁԜ䘉䟼֯⭘ 0.1 ઼ 0.9ˈ㘼нᱟ 0 ઼ 1ˈণ<0.9ˈ0.1ˈ0.1ˈ0.1>
㺘⽪㝨ᵍੁᐖⲴⴞḷ䗃ࠪੁ䟿DŽ䚯‫ ⭘֯ݽ‬0 ઼ 1 ֌Ѫⴞḷ٬Ⲵ৏ഐᱟ sigmoid অ‫ݳ‬ሩҾᴹ䲀
ᵳ٬н㜭ӗ⭏䘉ṧⲴ䗃ࠪDŽྲ᷌ᡁԜԱമ䇝㓳㖁㔌ᶕ߶⺞३䝽ⴞḷ٬ 0 ઼ 1ˈởᓖл䱽ሶՊ
䘛֯ᵳ٬ᰐ⭼໎䮯DŽਖаᯩ䶒ˈ٬ 0.1 ઼ 0.9 ᱟ sigmoid অ‫ݳ‬൘ᴹ䲀ᵳ٬ᛵߥлਟԕᆼᡀⲴDŽ

㖁㔌㔃ᶴമDŽ↓ྲࡽ䶒ᡰ᧿䘠Ⲵˈ৽ੁՐ᫝㇇⌅ਟԕ㻛ᓄ⭘ࡠԫօᴹੁᰐ⧟ sigmoid অ
‫Ⲵݳ‬㖁㔌DŽᡰԕˈᡁԜ䶒ѤⲴਖа䇮䇑䰞仈ᱟˈ䘉њ㖁㔌वਜ਼ཊቁњঅ‫ݳ‬ԕ৺ྲօӂ䘎DŽᴰ
Პ䙽Ⲵа⿽㖁㔌㔃ᶴᱟ࠶ቲ㖁㔌ˈаቲⲴ⇿њঅ‫ࡽੁݳ‬䘎᧕ࡠлаቲⲴ⇿ањঅ‫ݳ‬DŽⴞࡽⲴ
䇮䇑䘹ᤙ䘉ṧⲴḷ߶㔃ᶴˈ֯⭘єቲ sigmoid অ‫˄ݳ‬ањ䳀㯿ቲ઼ањ䗃ࠪቲ˅DŽ֯⭘аᡆ
єቲ sigmoid অ‫ݳ‬ᱟᖸᲞ䙽Ⲵˈ‫ڦ‬ቄ֯⭘йቲDŽ֯⭘ᴤཊⲴቲᱟнᑨ㿱ⲴˈഐѪ䇝㓳ᰦ䰤Պ
ਈᗇᖸ䮯ˈ㘼фйቲ sigmoid অ‫Ⲵݳ‬㖁㔌ᐢ㓿㜭ཏ㺘⽪ᮠ䟿⴨ᖃབྷⲴⴞḷ࠭ᮠ˄㿱 4.6.2 㢲˅
DŽ
ᡁԜᐢ㓿⺞ᇊ䘹ᤙањ࠶ቲⲴࡽ侸㖁㔌ˈ䛓Ѹަѝᓄ䈕वਜ਼ཊቁњ䳀㯿অ‫ݳ‬઒˛൘മ 4-10
ᣕ੺Ⲵ㔃᷌ѝˈӵ֯⭘Ҷйњ䳀㯿অ‫ˈݳ‬䗮ࡠҶሩ⍻䈅䳶ਸ 90%Ⲵ㋮ᓖDŽ൘ਖањ֯⭘ 30
њ䳀㯿অ‫Ⲵݳ‬ᇎ傼ѝˈᗇࡠⲴ㋮ᓖᨀ儈ҶаࡠєњⲮ࠶⛩DŽቭ㇑䘉єњᇎ傼ᗇࡠⲴ⌋ॆ㋮ᓖ
⴨ᐞᖸሿˈնਾањ䈅傼᰾ᱮ䴰㾱ᴤཊⲴ䇝㓳ᰦ䰤DŽ֯⭘ 260 ᑵമ‫Ⲵۿ‬䇝㓳ṧֻˈ30 њ䳀
অ‫Ⲵݳ‬㖁㔌൘ Sun Sparc5 ᐕ֌ㄉкⲴ䇝㓳ᰦ䰤བྷ㓖ᱟањሿᰦDŽ⴨ሩ㘼䀰ˈйњ䳀㯿অ‫ݳ‬
Ⲵ㖁㔌བྷ㓖ᱟ 5 ࠶䫏DŽӪԜᐢ㓿ਁ⧠൘ᖸཊᓄ⭘ѝ䴰㾱Ḁњᴰሿᮠ䟿Ⲵ䳀অ‫ݳ‬ᶕ㋮⺞ൠᆖҐ
ⴞḷ࠭ᮠˈᒦф䎵䗷䘉њᮠ䟿Ⲵཊ։Ⲵ䳀অ‫ݳ‬нՊᱮ㪇ൠᨀ儈⌋ॆ㋮ᓖˈᶑԦᱟ֯⭘Ӕ৹傼
䇱ᯩ⌅ᶕߣᇊᓄ䈕䘋㹼ཊቁ⅑ởᓖл䱽䘝ԓDŽྲ᷌⋑ᴹ֯⭘Ӕ৹傼䇱ˈ䛓Ѹ໎࣐䳀㯿অ‫ݳ‬ᮠ
䟿㓿ᑨՊ໎࣐䗷ᓖᤏਸ䇝㓳ᮠᦞⲴ‫ˈੁٮ‬Ӿ㘼䱽վ⌋ॆ㋮ᓖDŽ

ᆖҐ㇇⌅ⲴަԆ৲ᮠDŽ൘䘉њᇎ傼ѝˈᆖҐ䙏⦷K㻛䇮ᇊѪ 0.3ˈߢ䟿D㻛䇮ᇊѪ 0.3DŽ


䍻Ҹ䘉єњ৲ᮠᴤվⲴ٬Պӗ⭏བྷփ⴨ᖃⲴ⌋ॆ㋮ᓖˈն䴰㾱ᴤ䮯Ⲵ䇝㓳ᰦ䰤DŽྲ᷌䘉єњ
٬㻛䇮ᇊᗇཚ儈ˈ䇝㓳ሶн㜭᭦ᮋࡠањާᴹਟ᧕ਇ䈟ᐞ˄൘䇝㓳䳶ਸк˅Ⲵ㖁㔌DŽ൘ᮤњ
䈅傼ѝᡁԜ֯⭘ᆼ‫Ⲵޘ‬ởᓖл䱽˄઼㺘 4-2 ㇇⌅ѝ䲿ᵪ䘁լⲴởᓖл䱽н਼˅DŽ䗃ࠪঅ‫Ⲵݳ‬
㖁㔌ᵳ٬㻛ࡍ࿻ॆѪሿⲴ䲿ᵪ٬DŽ❦㘼䗃‫ޕ‬অ‫Ⲵݳ‬ᵳ٬㻛ࡍ࿻ॆѪ 0ˈഐѪ䘉ṧਟԕ֯ᆖҐ
ࡠⲴᵳ٬Ⲵമ‫˄ॆۿ‬㿱മ 4-10˅ᴤ᱃Ҿ⨶䀓ˈ㘼ሩ⌋ॆ㋮ᓖ⋑ᴹ᰾ᱮⲴᖡ૽DŽ䇝㓳Ⲵ䘝ԓ
⅑ᮠⲴ䘹ᤙਟԕ䙊䗷࠶ࢢਟ⭘ⲴᮠᦞѪ䇝㓳䳶ਸ઼⤜・Ⲵ傼䇱䳶ਸDŽởᓖл䱽ᯩ⌅㻛⭘Ҿᴰ
ሿॆ䇝㓳䳶ਸкⲴ䈟ᐞˈᒦф⇿䳄 50 ⅑ởᓖл䱽䘝ԓṩᦞ傼䇱䳶ਸ䇴ՠа⅑㖁㔌Ⲵᙗ㜭DŽ
ᴰ㓸䘹ᤙⲴ㖁㔌ᱟሩ傼䇱䳶ਸ㋮ᓖᴰ儈Ⲵ㖁㔌DŽਟԕ৲㿱 4.6.5 㢲ᗇࡠ‫ޣ‬Ҿ䘉њ䗷〻Ⲵ䀓䟺
઼‫ᦞ׍‬DŽᴰ㓸ᣕ੺Ⲵ㋮ᓖ˄ҏቡᱟ 90%ˈሩҾമ 4-10 ѝⲴ㖁㔌˅ᱟ൘⋑ᴹሩ䇝㓳ӗ⭏ԫօ
ᖡ૽Ⲵㅜйњ䳶ਸüü⍻䈅䳶ਸк⍻䟿ᗇࡠⲴDŽ

4.7.3 ᆜҖࡦⲺ䳆㰅ቸ㺞⽰

ᴹᗵ㾱࠶᷀ал㖁㔌ѝᆖҐᗇࡠⲴ 2899 њķᵳ٬DŽമ 4-10 ᧿㔈Ҷሩᡰᴹ䇝㓳ṧֻ䘋㹼


а⅑ᵳ٬ᴤᯠਾⲴ⇿њᵳ٬ˈ઼ 100 ⅑ᴤᯠਾⲴᵳ٬DŽ

ѪҶ⨶䀓䘉Ӌമ‫ݸˈۿ‬㘳㲁മѝ㍗䛫Ӫ㝨മ‫ۿ‬лⲴഋњ⸙ᖒDŽ⇿ањ⸙ᖒ᧿㔈Ҷ㖁㔌ѝ
ഋњ䗃ࠪঅ‫˄ݳ‬㕆⸱Ҷᐖǃࡽǃਣ઼к˅ѝⲴањᵳ٬DŽ⇿њ⸙ᖒѝⲴഋњሿᯩᖒ㺘⽪઼䘉

ķ
䈁⌘˖2899=䗃‫ޕ‬অ‫ݳ‬ойњ䳀অ‫ݳ‬䰤䘎᧕ሩᓄⲴᵳ˄960u3˅+йњ䳀অ‫ݳ‬оഋњ䗃ࠪঅ‫ݳ‬䰤䘎᧕ሩᓄ
Ⲵᵳ˄3u4˅+йњ䳀অ‫઼ݳ‬ഋњ䗃ࠪঅ‫Ⲵݳ‬w0ᵳ˄3+4˅
њ䗃ࠪঅ‫ޣݳ‬㚄Ⲵഋњᵳ٬üüᴰᐖ䗩ᱟᵳw0ˈᆳߣᇊঅ‫Ⲵݳ‬䰸٬ˈ❦ਾᱟ䘎᧕йњ䳀㯿অ
‫ࡠݳ‬䘉њ䗃ࠪⲴйњᵳ٬DŽᯩᖒⲴӞᓖ㺘⽪ᵳ٬ˈӞⲭ㺘⽪䖳བྷⲴ↓ᵳ٬ˈ᳇唁㺘⽪䖳བྷⲴ
䍏ᵳ٬ˈӻҾѝ䰤Ⲵ⚠㢢䱤ᖡ㺘⽪ѝㅹⲴᵳ٬DŽֻྲˈḷѪĀкāⲴ䗃ࠪঅ‫Ⲵݳ‬䰸٬ᵳw0᧕
䘁 0ˈӾㅜањ䳀㯿অ‫ݳ‬ᶕⲴᵳ٬Ѫ䖳བྷⲴ↓٬ˈӾㅜҼњ䳀㯿অ‫ݳ‬ᶕⲴᵳ٬Ѫ䖳བྷⲴ䍏٬DŽ

䳀㯿অ‫Ⲵݳ‬ᵳ٬ᱮ⽪൘䗃ࠪঅ‫Ⲵݳ‬л䗩DŽഎᗶалˈ⇿њ䳀㯿অ‫᧕ݳ‬ਇᡰᴹ 30u32 њ‫ۿ‬


㍐䗃‫ޕ‬DŽо䘉Ӌ䗃‫ޣޕ‬㚄Ⲵ 30u32 њᵳ٬㻛ᱮ⽪൘ᆳԜሩᓄⲴ‫ۿ‬㍐Ⲵս㖞˄䰸٬ᵳw0㻛䟽ਐ
ᱮ⽪൘മ‫ۿ‬䱥ࡇⲴᐖк䀂˅DŽ䶎ᑨᴹ䏓ⲴᱟˈਟԕⴻࡠᵳⲴਆ٬䙊ᑨሩӪ㝨઼䓛փࠪ⧠Ⲵമ
‫ۿ‬४ฏⲴ⢩࡛᭿ᝏDŽ

䪸ሩ⇿ањ䇝㓳ṧֻởᓖл䱽䘝ԓ 100 ⅑ਾⲴ㖁㔌ᵳ٬ᱮ⽪൘മⲴл䜘DŽ⌘᜿ᴰᐖ䗩Ⲵ


䳀㯿অ‫Ⲵݳ‬ᵳ٬઼䘝ԓа⅑ᰦⲴᵳ٬ᴹᖸབྷн਼ˈਖєњ䳀㯿অ‫Ⲵݳ‬ᵳ٬ҏᴹᡰਈॆDŽ⧠൘
ਟԕ࠶᷀ал䘉њᴰ㓸ᵳ٬䳶ਸѝⲴ㕆⸱DŽֻྲˈ㘳㲁䗃ࠪঅ‫ݳ‬ᤷࠪањӪᱟ൘ੁਣⴻDŽ䘉
њঅ‫ݳ‬оㅜҼњ䳀㯿অ‫ݳ‬䰤ާᴹањ䖳བྷⲴ↓ᵳ٬ˈоㅜйњ䳀অ‫ݳ‬䰤ާᴹањབྷⲴ䍏ᵳ
٬DŽ࠶᷀䘉єњ䳀অ‫Ⲵݳ‬ᵳ٬ˈᇩ᱃ⴻࡠྲ᷌ањӪⲴ㝨ᱟ䖜ੁԆⲴਣ䶒˄ҏቡᱟᡁԜⲴᐖ
䶒˅ˈ䛓ѸԆⲴӞᓖ儈ⲴⳞ㛔Պབྷ㠤о䘉њ䳀㯿অ‫ݳ‬ѝⲴ䖳བྷ↓٬ሩ喀ˈ਼ᰦԆⲴӞᓖվⲴ
ཤਁՊབྷ㠤о䍏ᵳ٬ሩ喀ˈ䘉ሬ㠤↔অ‫ݳ‬䗃ࠪањ䖳བྷⲴ٬DŽ਼ṧⲴമ‫ۿ‬Պ֯ㅜйњ䳀অ‫ݳ‬
䗃ࠪањ᧕䘁 0 Ⲵ٬ˈഐѪӞᓖ儈Ⲵ㝨䜘‫ੁٮ‬ҾоབྷⲴ䍏ᵳሩ喀DŽ

4.8 Ӱᐛ⾔㔅㖇㔒Ⲻ儎㓝䈓从

4.8.1 ެԌਥ䘿Ⲻ䈥ᐤ࠳ᮦ

↓ྲࡽ䶒ᡰᤷࠪⲴˈਚ㾱࠭ᮠ E ⴨ሩ৲ᮠॆⲴ‫ٷ‬䇮オ䰤ਟᗞˈ䛓Ѹቡਟԕᢗ㹼ởᓖл
䱽DŽ㲭❦สᵜⲴ৽ੁՐ᫝㇇⌅ԕ㖁㔌䈟ᐞᒣᯩ઼Ⲵᖒᔿᇊѹ EˈնҏᴹӪᨀࠪަԆⲴᇊѹˈ
ԕ‫ׯ‬ᢺަԆⲴ㓖ᶏᕅ‫ޕ‬ᵳ٬䈳ᮤ⌅ࡉDŽྲ᷌ᇊѹҶањᯠⲴ Eˈ䛓Ѹቡᗵ享᧘ሬࠪањᯠⲴ
ᵳ٬䈳ᮤ⌅ࡉ‫׋‬ởᓖл䱽֯⭘DŽE ⲴަԆਟ䘹ᇊѹवᤜ˖
x Ѫᵳ٬໎࣐ањ᜙㖊亩DŽྲ਼ࡽ䶒䇘䇪ⲴˈᡁԜਟԕ࣐‫ޕ‬ањ䲿⵰ੁ䟿ᑵᓖ໎
䮯Ⲵ亩ࡠ E ѝDŽ䘉ሬ㠤ởᓖл䱽ᩌራ䖳ሿⲴᵳ٬ੁ䟿ˈӾ㘼߿ሿ䗷ᓖᤏਸⲴ仾
䲙DŽа⿽࣎⌅ᱟ᤹➗л䶒Ⲵㅹᔿ䟽ᯠᇊѹ E˖

& 1
E ( w) { ¦ ¦ (t kd  o kd ) 2  J ¦ w ji
2

2 dD koutputs i, j

䘉ᗇࡠҶањо৽ੁՐ᫝⌅ࡉสᵜа㠤Ⲵᵳᴤᯠ⌅ࡉˈਚᱟ൘⇿⅑䘝ԓᰦѪ⇿
њᵳ҈ԕᑨ䟿˄1-2JK˅DŽഐ↔䘹ᤙ䘉⿽ E Ⲵᇊѹ઼֯⭘ᵳ㺠߿ㆆ⮕˄㿱㓳Ґ 4.10˅
ᱟㅹԧⲴDŽ
x ሩ䈟ᐞ໎࣐а亩ⴞḷ࠭ᮠⲴᯌ⦷˄slope˅ᡆሬᮠDŽḀӋᛵߥлˈ䇝㓳ؑ᚟ѝн
ӵᴹⴞḷ٬ˈ㘼ф䘈ᴹ‫ޣ‬Ҿⴞḷ࠭ᮠⲴሬᮠDŽֻྲˈSimard et al.˄1992˅᧿䘠
Ҷањᆇㅖ䇶࡛Ⲵᓄ⭘ˈ൘䘉њᓄ⭘ѝ֯⭘ҶаӋ䇝㓳ሬᮠᶕᕪ䘛㖁㔌ᆖҐ䛓
Ӌ൘മ‫ۿ‬ᒣ〫ѝнਈⲴᆇㅖ䇶࡛࠭ᮠDŽMitchell and Thrun˄1993˅᧿䘠Ҷṩᦞᆖ
ҐಘԕࡽⲴ⸕䇶䇑㇇䇝㓳ሬᮠⲴᯩ⌅DŽ൘䘉єњ㌫㔏ѝ˄൘ㅜ 12 ㄐѝ᧿䘠˅ˈ
䈟ᐞ࠭ᮠ䜭㻛໎࣐Ҷа亩ˈ⭘ᶕ㺑䟿䘉Ӌ䇝㓳ሬᮠ઼㖁㔌Ⲵᇎ䱵ሬᮠ䰤ⲴᐞᔲDŽ
䘉ṧⲴ䈟ᐞ࠭ᮠⲴањֻᆀᱟ
& 1 ª § wt wo ·
2
º
E ( w) { ¦ ¦ «(t kd  okd ) 2  P ¦ ¨¨ kdj  kdj ¸¸ »
2 dD koutputs « jinputs © wxd wxd ¹ »¼
¬
wt kd
wx j
j
x d
䘉䟼ˈ 㺘⽪ሩҾ䇝㓳ᇎֻdㅜjњ䗃‫ޕ‬অ‫Ⲵݳ‬٬DŽҾᱟ d ᱟ᧿䘠ⴞḷ䗃ࠪ٬

wokd
wx dj 㺘⽪ᇎ䱵ⲴᆖҐ㖁㔌
j
x d
tkdᓄ䈕ྲօ䲿䗃‫ޕ‬٬ ਈॆⲴ䇝㓳ሬᮠDŽ㊫լⲴˈ
ⲴሩᓄሬᮠDŽᑨᮠPߣᇊ३䝽䇝㓳٬ሩҾ३䝽䇝㓳ሬᮠⲴ⴨ሩᵳ٬DŽ
x ֯㖁㔌ሩⴞḷ٬ⲴӔ৹⟥˄cross entropy˅ᴰሿॆDŽ㘳㲁ᆖҐањᾲ⦷࠭ᮠˈ∄
ྲ亴⍻ањُ䍧⭣䈧㘵Պ੖䘈䍧ˈṩᦞᱟ䘉њ⭣䈧㘵Ⲵᒤ喴઼ᆈⅮ։仍DŽቭ㇑
䘉䟼Ⲵ䇝㓳ṧֻӵᨀ‫׋‬ҶᐳቄරⲴⴞḷ٬˄㾱Ѹᱟ 1ˈ㾱Ѹᱟ 0ˈṩᦞ䘉њ⭣䈧
㘵ᱟ੖䘈䍧˅ˈնสᵜⲴⴞḷ࠭ᮠᴰྭԕ⭣䈧㘵䘈䍧Ⲵᾲ⦷Ⲵᖒᔿ䗃ࠪˈ㘼н
ᱟሩ⇿њ䗃‫ޕ‬ᇎֻ䜭Աമ䗃ࠪ᰾⺞Ⲵ 0 ᡆ 1 ٬DŽ൘䘉⿽ᛵߥлˈᡁԜᐼᵋ㖁㔌
䗃ࠪањᾲ⦷ՠ䇑ˈਟԕ䇱᰾ᴰሿॆӔ৹⟥˄cross entropy˅Ⲵ㖁㔌ਟԕ㔉ࠪᴰ
ྭⲴ˄ҏቡᱟᴰབྷլ❦˅ᾲ⦷ՠ䇑ˈӔ৹⟥Ⲵᇊѹྲл˖
 ¦ t d log od  (1  t d ) log(1  od )
d D

䘉䟼odᱟ㖁㔌ሩҾ䇝㓳ṧֻd䗃ࠪⲴᾲ⦷ՠ䇑ˈtdᱟሩҾ䇝㓳ṧֻdⲴⴞḷ٬˄0
ᡆ 1˅DŽㅜ 6 ㄐ䇘䇪Ҷօᰦ৺ѪӰѸᴰਟ㜭Ⲵ㖁㔌‫ٷ‬䇮ቡᱟ֯Ӕ৹⟥ᴰሿॆⲴ‫ٷ‬
䇮ˈᒦ᧘ሬҶ⴨ᓄⲴsigmoidঅ‫Ⲵݳ‬ởᓖл䱽ᵳ٬䈳ᮤ⌅ࡉDŽㅜ 6 ㄐҏ᧿䘠Ҷ൘
ӰѸᶑԦлᴰਟ㜭Ⲵ‫ٷ‬䇮ቡᱟ֯䈟ᐞᒣᯩ઼ᴰሿॆⲴ‫ٷ‬䇮DŽ
x ᭩ਈᴹ᭸䈟ᐞ࠭ᮠҏਟԕ䙊䗷ᵳ٬‫ޡ‬ӛ˄weight sharing˅ᆼᡀˈҏቡᱟᢺон
਼অ‫ݳ‬ᡆ䗃‫ޣ⴨ޕ‬㚄ⲴᵳĀ᥶㔁൘а䎧āDŽ䘉䟼Ⲵᜣ⌅ᱟᕪ䘛н਼Ⲵ㖁㔌ᵳ٬
ਆа㠤Ⲵ٬ˈ䙊ᑨᱟѪҶᇎᯭӪ㊫䇮䇑㘵һ‫⸕ݸ‬䚃ⲴḀњ㓖ᶏDŽֻྲˈWaibel et
al.˄1989˅઼ Lang et al.˄1990˅᧿䘠Ҷ⾎㓿㖁㔌൘䈝丣䇶࡛ᯩ䶒Ⲵањᓄ⭘ ˈ
ަѝ㖁㔌Ⲵ䗃‫ޕ‬ᱟ൘ањ 144 ∛。Ⲵᰦ䰤デѝн਼ᰦ䰤Ⲵ䈝丣仁⦷࠶䟿DŽ൘䘉
њᓄ⭘ѝਟԕ‫Ⲵڊ‬ањ‫ٷ‬ᇊᱟ˖ањ⢩ᇊ䈝丣˄ֻྲĀeeeā˅Ⲵ仁⦷࠶䟿Ⲵ䇶
࡛ᱟо䘉њ䈝丣൘ 144 ∛。ᰦ䰤デѝࠪ⧠Ⲵ⺞࠷ᰦ䰤ᰐ‫Ⲵޣ‬DŽѪҶᇎᯭ䘉њ㓖
ᶏˈᗵ享ᕪ䘛᧕᭦䘉њᰦ䰤デн਼䜘࠶Ⲵн਼অ‫ޡݳ‬ӛᵳ٬DŽ䘉ṧ‫Ⲵڊ‬᭸᷌ᱟ
㓖ᶏҶ‫ٷ‬䇮Ⲵ▌൘オ䰤ˈӾ㘼߿ሿҶ䗷ᓖᤏਸⲴ仾䲙ˈᨀ儈Ҷ߶⺞⌋ॆࡠᵚ㿱
䗷ᛵᖒⲴਟ㜭ᙗDŽᵳ٬‫ޡ‬ӛ䙊ᑨ䘉ṧᇎ⧠˖俆‫ݸ‬൘‫ޡ‬ӛᵳ٬Ⲵ⇿њঅ‫࡛࠶ݳ‬ᴤ
ᯠ਴њᵳ٬ˈ❦ਾਆ䘉Ӌᵳ٬Ⲵᒣ൷ˈ޽⭘䘉њᒣ൷٬ᴯᦒ⇿њ䴰‫ޡ‬ӛⲴᵳ٬DŽ
䘉њ䗷〻Ⲵ㔃᷌ᱟ㻛‫ޡ‬ӛⲴᵳ٬о⋑ᴹ㻛‫ޡ‬ӛⲴᵳ٬⴨∄֯⭘Ҷн਼Ⲵ䈟ᐞ࠭
ᮠDŽ

4.8.2 ެԌਥ䘿Ⲻ䈥ᐤᴶቅौ䗽ぁ

㲭❦ởᓖл䱽ᱟᩌራ֯䈟ᐞ࠭ᮠᴰሿॆⲴ‫ٷ‬䇮Ⲵᴰ䙊⭘Ⲵᩌ㍒ᯩ⌅ѻаˈնᆳнᙫᱟᴰ
儈᭸ⲴDŽᖃ䇝㓳༽ᵲⲴ㖁㔌ᰦˈн䳮㿱ࡠ৽ੁՐ᫝㇇⌅㾱䘋㹼кз⅑Ⲵᵳ٬ᴤᯠ䘝ԓDŽ⭡Ҿ
䘉њ৏ഐˈӪԜ᧒㍒ᒦᨀࠪҶᖸཊަԆⲴᵳ٬Ոॆ㇇⌅DŽѪҶ亶ՊަԆⲴਟ㜭ᯩ⌅ˈᡁԜн
࿘ᢺᵳ٬ᴤᯠᯩ⌅ቡⴻ֌ᱟ㾱ߣᇊєњ䰞仈˖䘹ᤙањ᭩ਈᖃࡽᵳ٬ੁ䟿Ⲵᯩੁ˗䘹ᤙ㾱〫
ࣘⲴ䐍⿫DŽ൘৽ੁՐ᫝㇇⌅ѝˈ䘉њᯩੁᱟ䙊䗷ਆởᓖⲴ䍏٬ᶕ䘹ᤙⲴˈ䐍⿫ᱟ䙊䗷ᑨ䟿Ⲵ
ᆖҐ䙏⦷KߣᇊⲴDŽ
а⿽㻛〠ѪĀ㓯 㓯ᩌ㍒˄line search˅āⲴՈॆᯩ⌅ˈ䟷⭘Ҷн਼Ⲵᯩ⌅䘹ᤙᵳ٬ᴤᯠⲴ䐍
⿫DŽ⺞࠷ൠ䇢ˈ⇿ᖃ䘹ᇊҶаᶑ⺞ᇊᵳ٬ᴤᯠᯩੁⲴ䐟㓯ˈ䛓ѸᵳᴤᯠⲴ䐍⿫ᱟ䙊䗷ራ᢮⋯
䘉ᶑ㓯Ⲵ䈟ᐞ࠭ᮠⲴᴰሿ٬ᶕ䘹ᤙⲴDŽ⌘᜿䘉ਟ㜭ሬ㠤ᖸབྷᑵᓖҏਟ㜭ᱟᖸሿᑵᓖⲴᵳ٬ᴤ
ᯠˈ㾱ⴻ⋯䘉ᶑ㓯Ⲵᴰሿ䈟ᐞ⛩Ⲵս㖞DŽਖа⿽ᯩ⌅ˈᱟṩᦞĀ㓯ᩌ㍒āⲴᙍᜣᔪ・Ⲵˈ㻛
〠Ѫ‫ޡ‬
‫ޡ‬䖝ởᓖ˄conjugate gradient˅⌅DŽ䘉⿽ᯩ⌅䘋㹼а㌫ࡇ㓯ᩌ㍒ᶕᩌ㍒䈟ᐞᴢ䶒Ⲵᴰሿ
٬DŽ䘉а㌫ࡇᩌ㍒Ⲵㅜа↕ӽ❦֯⭘ởᓖⲴ৽ᯩੁ֌ѪᯩੁDŽ൘ਾᶕⲴ⇿а↕ˈ䘹ᤙ֯䈟ᐞ
ởᓖ࠶䟿ࡊྭѪ 0 ᒦ‫؍‬ᤱѪ 0 ⲴᯩੁDŽ

㲭❦ަԆⲴ䈟ᐞᴰሿॆᯩ⌅ᨀ儈Ҷ䇝㓳㖁㔌Ⲵ᭸⦷ˈն䊑‫ޡ‬䖝ởᓖ䘉ṧⲴᯩ⌅ሩҾᴰ㓸
㖁㔌Ⲵ⌋ॆ䈟ᐞ⋑ᴹ᰾ᱮⲴᖡ૽DŽሩᴰ㓸䈟ᐞᜏаਟ㜭Ⲵᖡ૽ᱟˈн਼Ⲵ䈟ᐞᴰሿॆ䗷〻Պ
䲧‫ޕ‬н਼Ⲵተ䜘ᶱሿ٬DŽBishop˄1996˅वਜ਼Ҷ‫ޣ‬Ҿ䇝㓳㖁㔌Ⲵࠐ⿽৲ᮠՈॆᯩ⌅Ⲵа㡜ᙗ
䇘䇪DŽ

4.8.3 䙈ᖈ㖇㔒δRecurrent Networksε

ⴤࡠ⧠൘ᡁԜ㘳㲁Ⲵਚᱟᴹੁᰐ⧟Ⲵ㖁㔌ᤃᢁ㔃ᶴDŽ䙂ᖂ㖁㔌ᱟᴹྲл⢩ᖱⲴӪᐕ⾎㓿
㖁㔌˖䘲⭘Ҿᰦᒿᮠᦞ˗֯⭘㖁㔌অ‫ݳ‬൘ᰦ䰤 t Ⲵ䗃ࠪ֌ѪަԆঅ‫ݳ‬൘ᰦ䰤 t+1 Ⲵ䗃‫ޕ‬DŽԕ
䘉⿽ᯩᔿˈ䙂ᖂ㖁㔌᭟ᤱ൘㖁㔌ѝ֯⭘Ḁ⿽ᖒᔿⲴᴹੁ⧟˄directed cycles˅DŽѪҶ╄⽪䙂ᖂ
㖁㔌ˈ㘳㲁ањᰦᒿ亴⍻ԫ࣑üüṩᦞᖃཙⲴ㓿⍾ᤷḷ x(t)ˈ亴⍻лаཙⲴ㛑⾘ᒣ൷ᐲ٬
y(t+1)DŽ㔉ᇊҶ䘉ṧⲴᰦᒿᮠᦞˈањᱮ㘼᱃㿱Ⲵ࣎⌅ᱟṩᦞ䗃‫ޕ‬٬ x(t)䇝㓳ањࡽ侸㖁㔌
亴⍻䗃ࠪ y(t+1)DŽањ䘉ṧⲴ㖁㔌ᱮ⽪൘മ 4-11˄a˅ѝDŽ

䘉ṧⲴ㖁㔌Ⲵ㕪⛩ᱟӵ‫׍‬䎆 x(t)֌ࠪሩ y(t+1)亴⍻ˈ㘼н㜭ᦅ᥹ y(t+1)ሩ x Ⲵԕࡽ٬Ⲵ‫׍‬


䎆ᙗDŽ㘼䘉ਟ㜭ᱟᗵ䴰Ⲵˈֻྲˈ᰾ཙⲴ㛑⾘ᒣ൷ᐲ٬ਟ㜭‫׍‬䎆ҾӺཙⲴ㓿⍾ᤷḷ઼᱘ཙⲴ
㓿⍾ᤷḷⲴᐞᔲDŽᖃ❦ᡁԜਟԕ䙊䗷ᢺ x(t)઼ x(t-1)䜭֌Ѫࡽ侸㖁㔌Ⲵ䗃‫ˈޕ‬ᶕᕕ㺕䘉њн
䏣DŽնᱟྲ᷌ᡁԜᐼᵋ䘉њ㖁㔌亴⍻ y(t+1)ᰦ㘳㲁ԫ᜿䗷৫Ⲵᰦ䰤デ޵Ⲵؑ᚟઒˛䛓Ѹቡ䴰
㾱⭘н਼Ⲵ䀓ߣᯩṸҶDŽമ 4-11˄b˅ᱮ⽪Ⲵ䙂ᖂ㖁㔌ᨀ‫׋‬Ҷањ䘉ṧⲴ䀓ߣᯩṸDŽ䘉䟼ᡁ
Ԝੁ䳀㯿ቲ࣐ҶањᯠⲴঅ‫ ݳ‬b ઼ᯠⲴ䗃‫ޕ‬অ‫ ݳ‬c(t)DŽc(t)Ⲵ٬㻛ᇊѹѪঅ‫ ݳ‬b ൘ᰦ䰤 t-1 Ⲵ
٬˗ҏቡᱟ䈤ˈ㖁㔌൘Ḁањᰦ䰤↕˄time step˅Ⲵ䗃‫ޕ‬٬ c(t)ᤧ䍍㠚অ‫ ݳ‬b ൘ࡽаᰦ䰤↕
Ⲵ٬DŽ⌘᜿䘉ᇎ⧠Ҷа⿽䙂ᖂ‫ޣ‬㌫ˈަѝ b 㺘⽪‫ޣ‬Ҿ㖁㔌䗃‫Ⲵޕ‬শਢؑ᚟DŽഐѪ b ᰒ‫׍‬䎆Ҿ
x(t)৸‫׍‬䎆Ҿ c(t)ˈᡰԕ b ਟ㜭ᾲᤜҶ x ԕࡽԫ᜿ᰦ䰤䐍⿫Ⲵ٬DŽᖸཊަԆⲴ㖁㔌ᤃᢁҏਟԕ
⭘ᶕ㺘⽪䙂ᖂ㖁㔌DŽֻྲˈᡁԜਟԕ൘䗃‫઼ޕ‬অ‫ ݳ‬b 䰤ᨂ‫ޕ‬㤕ᒢቲঅ‫ˈݳ‬ҏਟԕ൘࣐‫ޕ‬অ‫ݳ‬
b ઼䗃‫ޕ‬অ‫ ݳ‬c Ⲵൠᯩ޽ᒦ㹼ᨂ‫ࠐޕ‬њঅ‫ݳ‬DŽ

插图——原书页码:120

Feedforward network-ࡽ侸㖁㔌

Recurrent network-䙂ᖂ㖁㔌

Recurrent network unfolded in time-᤹ᰦ䰤ኅᔰⲴ䙂ᖂ㖁㔌

മ 4-11 䙂ᖂ㖁㔌
ྲօ䇝㓳䘉ṧⲴ䙂ᖂ㖁㔌઒˛䙂ᖂ㖁㔌ᴹཊ⿽ਈփˈഐ↔ӪԜҏ࠶࡛ᨀࠪҶн਼Ⲵ䇝㓳
ᯩ⌅˄ֻྲ৲㿱Jordan 1986; Elman 1990; Mozer 1995; Williams & Zipser 1995˅DŽᴹ䏓Ⲵᱟˈ
䊑മ 4-11˄b˅䛓ṧⲴ䙂ᖂ㖁㔌ਟԕㆰঅ֯⭘৽ੁՐ᫝㇇⌅Ⲵਈփᶕ䇝㓳DŽѪҶ⨶䀓ྲօᇎ
ᯭˈ㘳㲁മ 4-11˄c˅ˈᱮ⽪Ҷ䙂ᖂ㖁㔌᤹➗ᰦ䰤ኅᔰⲴᮠᦞ⍱DŽ䘉䟼ᡁԜᢺ䙂ᖂ㖁㔌ᤧ䍍ᡀ
ࠐԭˈ⭘н਼ᤧ䍍䰤Ⲵ䘎᧕ᴯᦒᦹ৽侸⧟DŽ⌘᜿䘉њབྷⲴ㖁㔌н޽वਜ਼എ䐟DŽᡰԕኅᔰ㖁㔌
Ⲵᵳ٬ਟԕⴤ᧕֯⭘৽ੁՐ᫝㇇⌅ᶕ䇝㓳DŽᖃ❦ᇎ䐥ѝᡁԜᐼᵋӵ‫⮉؍‬аԭ䙂ᖂ㖁㔌઼ᵳ٬
䳶ਸⲴᤧ䍍DŽᡰԕˈ൘䇝㓳ҶኅᔰⲴ㖁㔌ਾˈਟԕਆн਼ᤧ䍍ѝᵳ٬wjiⲴᒣ൷٬֌Ѫᴰ㓸㖁
㔌ⲴሩᓄⲴᵳ٬wjiDŽMozer˄1995˅䶎ᑨ䈖㓶ൠ᧿䘠Ҷ䘉њ䇝㓳䗷〻DŽᇎ䐥ѝˈ䙂ᖂ㖁㔌∄
⋑ᴹ৽侸⧟Ⲵ㖁㔌䳮ԕ䇝㓳ˈ⌋ॆⲴਟ䶐ᙗҏнྲਾ㘵DŽ❦㘼ᆳԜӽ❦ഐ䖳ᕪⲴ㺘ᖱ࣋‫؍‬ᤱ
⵰䟽㾱ᙗDŽ

4.8.4 ࣞᘷ‫ؤ‬᭯㖇㔒㔉ᶺ

ⴤࡠ⧠൘ᡁԜ㘳㲁Ⲵ⾎㓿㖁㔌ᆖҐ䰞仈ᱟ䈳ᮤањപᇊ㖁㔌㔃ᶴѝⲴᵳ٬DŽѪҶ᭩ழ⌋
ॆ㋮ᓖ઼䇝㓳᭸⦷ˈӪԜᨀࠪҶᖸཊࣘᘱ໎䮯ᡆ঻㕙㖁㔌অ‫઼ݳ‬অ‫ݳ‬䰤䘎᧕ᮠ䟿Ⲵᯩ⌅DŽ

а⿽ᜣ⌅ᱟӾањнवਜ਼䳀㯿অ‫Ⲵݳ‬㖁㔌ᔰ࿻ˈ❦ਾṩᦞ䴰㾱໎࣐䳀অ‫ݳ‬໎䮯㖁㔌ˈⴤ
ࡠ䇝㓳䈟ᐞл䱽ࡠḀњਟ᧕ਇⲴ≤ᒣDŽ㓗㚄⴨‫˄ޣ‬Cascade-Correlation˅㇇⌅˄Fahlman &
Lebiere 1990˅ቡᱟ䘉ṧа⿽㇇⌅DŽ㓗㚄⴨‫ޣ‬㇇⌅Ӿࡋᔪањ⋑ᴹ䳀অ‫Ⲵݳ‬㖁㔌ᔰ࿻DŽֻྲˈ
ሩҾᡁԜⲴӪ㝨ᵍੁⲴᆖҐԫ࣑ˈᆳՊᔪ・ањӵवਜ਼ഋњ䗃ࠪঅ‫ޘݳ‬䘎᧕ࡠ 30u32 њ䗃‫ޕ‬
㔃⛩Ⲵ㖁㔌DŽ൘䘉њ㖁㔌㻛䇝㓳Ҷа⇥ᰦ䰤ਾˈᡁԜਟԕᖸᇩ᱃ൠਁ⧠䘈ᴹ䖳བྷⲴ↻⮉䈟ᐞˈ
ഐѪһᇎк䘉њⴞḷ࠭ᮠнਟ㜭㻛ањঅቲ㔃ᶴⲴ㖁㔌⨶ᜣൠ㺘⽪DŽ൘䘉⿽ᛵߥлˈ㇇⌅໎
࣐ањ䳀㯿অ‫ˈݳ‬䘹ᤙᆳⲴᵳ٬֯䘉њ䳀㯿অ‫Ⲵݳ‬٬઼ᮤњ㖁㔌Ⲵ↻⮉䈟ᐞⲴ⴨‫ޣ‬ᙗᴰབྷ
ॆDŽ⧠൘ањᯠⲴঅ‫ݳ‬㻛ᆹ㻵䘋Ҷ㖁㔌ˈᆳⲴᵳ٬‫؍‬ᤱнਈˈᒦф໎࣐䘉њᯠঅ‫⇿ࡠݳ‬ањ
䗃ࠪঅ‫ݳ‬䰤Ⲵ䘎᧕DŽ䟽༽䘉њ䗷〻DŽ৏࿻Ⲵᵳ٬㻛޽⅑䇝㓳˄‫؍‬ᤱ䳀㯿অ‫Ⲵݳ‬ᵳ٬нਈ˅ˈ
Ựḕ↻⮉䈟ᐞˈྲ᷌↻⮉䈟ᐞ䘈儈Ҿ䰸٬ቡ࣐‫ޕ‬ㅜҼњ䳀অ‫ݳ‬DŽ⇿ᖃ࣐‫ޕ‬ањᯠⲴ䳀㯿অ‫ˈݳ‬
ᆳⲴ䗃‫ޕ‬वᤜᡰᴹ৏࿻Ⲵ㖁㔌䗃‫઼ޕ‬ᐢ㓿ᆈ൘Ⲵ䳀㯿অ‫Ⲵݳ‬䗃ࠪDŽ㖁㔌ԕ䘉⿽ᯩᔿ໎䮯ˈ〟
㚊䳀㯿অ‫ࡠⴤˈݳ‬㖁㔌Ⲵ↻։䈟ᐞл䱽ࡠḀњਟ᧕ਇⲴ≤ᒣDŽFahlman & Lebiere˄1990˅ᣕ
੺Ҷ㓗㚄⴨‫ޣ‬㇇⌅ᱮ㪇߿ቁ䇝㓳ᰦ䰤Ⲵֻᆀˈ৏ഐᱟ⇿а↕ӵᴹаቲ㖁㔌൘㻛䇝㓳DŽ䘉њ㇇
⌅Ⲵањᇎ䱵ഠ䳮ᱟഐѪ㇇⌅ਟԕᰐ䲀ࡦൠ໎࣐অ‫ˈݳ‬ᆳቡᖸᇩ᱃䗷ᓖᤏਸ䇝㓳ᮠᦞˈᡰԕ
ᗵ享䟷ਆ䚯‫ݽ‬䗷ᓖᤏਸⲴ亴䱢᧚ᯭDŽ

ࣘᘱ‫؞‬᭩㖁㔌㔃ᶴⲴㅜҼњᜣ⌅ᱟ֯⭘⴨৽Ⲵ䙄ᖴDŽн޽Ӿਟ㜭Ⲵᴰㆰঅ㖁㔌ᔰ࿻໎࣐
༽ᵲᙗˈ㘼ᱟӾањ༽ᵲⲴ㖁㔌ᔰ࿻‫ᦹ࢚؞‬ḀӋᰐ‫ޣ‬㍗㾱Ⲵ䘎᧕DŽࡔᯝḀњᵳᱟ੖ᰐ‫ޣ‬㍗㾱
Ⲵа⿽ᯩ⌅ᱟⴻᆳⲴ٬ᱟ੖᧕䘁 0DŽㅜҼ⿽ⴻᶕ൘ᇎ䐥ѝᴤ࣐ᡀ࣏Ⲵᯩ⌅ᱟ㘳㲁䘉њᵳ٬Ⲵ
wE
ањሿⲴਈॆሩ䈟ᐞ E Ⲵᖡ૽DŽਈॆ w ሩ E Ⲵᖡ૽˄ҏቡᱟ ˅ਟԕ㻛ⴻ֌㺑䟿䘉њ䘎
ww
᧕Ⲵᱮ㪇ᙗ˄salient˅ⲴቪᓖDŽLeCun et al.˄1990˅᧿䘠Ҷањ㖁㔌㻛䇝㓳Ⲵ䗷〻ˈᴰнᱮ
㪇Ⲵ䘎᧕㻛᣶䲔ˈ䟽༽䘉њ䗷〻ⴤࡠ䙷ࡠḀњ㓸→ᶑԦDŽԆԜ〠䘉⿽ᯩ⌅ѪĀᴰՈ㝁ᦏՔ
˄optimal brain damage˅ā⌅ˈഐѪ൘⇿а↕㇇⌅䜭䈅മ৫䲔ᴰ⋑ᴹ⭘Ⲵ䘎᧕DŽԆԜᣕ੺Ҷ
൘ањᆇㅖ䇶࡛ᓄ⭘ѝ䘉⿽ᯩ⌅ሶањབྷⲴ㖁㔌ѝᵳ٬߿ቁࡠഋ࠶ѻаˈሩ⌋ॆ㋮ᓖᴹᗞሿ
Ⲵ᭩ழˈᒦфབྷབྷ᭩ழҶਾᶕⲴ䇝㓳᭸⦷DŽ

а㡜㘼䀰ˈࣘᘱ‫؞‬᭩㖁㔌㔃ᶴⲴᯩ⌅ᐢ㓿ਆᗇҶаӋᡀ࣏ˈնҏᴹн䏣DŽ䘉⿽ᯩ⌅ᱟ੖
㜭っᇊൠᨀ儈৽ੁՐ᫝㇇⌅Ⲵ⌋ॆ㋮ᓖ䘈ᴹᖵ⹄ウDŽ❦㘼ᐢ㓿䇱᰾൘аӋᛵᖒлᆳਟԕᱮ㪇
ൠ䱽վ䇝㓳ᰦ䰤DŽ

4.9 ቅ㔉ૂ㺛‫ݻ‬䈱⢟

䘉аㄐⲴ㾱⛩वᤜ˖
x Ӫᐕ⾎㓿㖁㔌ᆖҐѪᆖҐᇎᮠ٬઼ੁ䟿٬࠭ᮠᨀ‫׋‬Ҷа⿽ᇎ䱵Ⲵᯩ⌅ˈሩҾ
䘎㔝Ⲵ઼⿫ᮓ٬Ⲵ኎ᙗ䜭ਟԕ֯⭘ˈᒦфሩ䇝㓳ᮠᦞѝⲴಚ༠ᴹᖸྭⲴ励ἂ
ᙗDŽ৽ੁՐ᫝㇇⌅ᱟᴰᑨ㿱Ⲵ㖁㔌ᆖҐ㇇⌅ˈᐢ㓿ᡀ࣏ᓄ⭘ࡠᖸཊᆖҐԫ࣑ˈ
∄ྲ᡻߉䇶઼࡛ᵪಘӪ᧗ࡦDŽ
x ৽ੁՐ᫝㇇⌅㘳㲁Ⲵ‫ٷ‬䇮オ䰤ᱟപᇊ䘎᧕Ⲵᴹᵳ㖁㔌ᡰ㜭㺘⽪Ⲵᡰᴹ࠭ᮠ
オ䰤DŽवਜ਼йቲঅ‫ࡽⲴݳ‬侸㖁㔌㜭ཏԕԫ᜿㋮ᓖ䙬䘁ԫ᜿࠭ᮠˈਚ㾱⇿аቲ
ᴹ䏣ཏᮠ䟿˄ਟ㜭䶎ᑨཊ˅Ⲵঅ‫ݳ‬DŽণ֯ᱟањᇎ䱵བྷሿⲴ㖁㔌ҏ㜭ཏ㺘⽪
ᖸབྷ㤳തⲴ儈ᓖ䶎㓯ᙗⲴ࠭ᮠˈ䘉֯ᗇࡽ侸㖁㔌ᡀѪᆖҐ亴‫ݸ‬ᵚ⸕Ⲵа㡜ᖒ
ᔿⲴ⿫ᮓ઼䘎㔝࠭ᮠⲴᖸྭ䘹ᤙDŽ
x ৽ੁՐ᫝㇇⌅֯⭘ởᓖл䱽ᯩ⌅ᩌ㍒ਟ㜭‫ٷ‬䇮Ⲵオ䰤ˈ䘝ԓ߿ሿ㖁㔌Ⲵ䈟ᐞ
ԕᤏਸ䇝㓳ᮠᦞDŽởᓖл䱽᭦ᮋࡠ䇝㓳䈟ᐞ⴨ሩ㖁㔌ᵳ٬Ⲵተ䜘ᶱሿ٬DŽᴤ
а㡜Ⲵˈởᓖл䱽ᱟа⿽ᴹᓄ⭘▌࣋Ⲵᯩ⌅ˈᆳਟ⭘ᶕᩌ㍒ᖸཊ䘎㔝৲ᮠⲴ
‫ٷ‬䇮オ䰤ˈਚ㾱䇝㓳䈟ᐞᱟ‫ٷ‬䇮৲ᮠⲴਟᗞ࠭ᮠDŽ
x ৽ੁՐ᫝㇇⌅ᴰԔӪᝏ‫ޤ‬䏓Ⲵ⢩ᖱѻаᱟˈᆳ㜭ཏࡋ䙐ࠪ㖁㔌䗃‫ޕ‬ѝ⋑ᴹ᰾
⺞ࠪ⧠Ⲵ⢩ᖱDŽ⺞࠷ൠ䇢ˈཊቲ㖁㔌Ⲵ޵䜘˄䳀㯿˅ቲ㜭ཏ㺘⽪ሩᆖҐⴞḷ
࠭ᮠᴹ⭘Ⲵն䳀ਜ਼൘㖁㔌䗃‫ޕ‬ѝⲴѝ䰤⢩ᖱDŽ䘉⿽㜭࣋㻛ֻᆀྲ 4.6.4 㢲Ⲵ
8u3u8 㖁㔌ѝࡋ䙐Ⲵᮠᆇ 1 ࡠ 8 Ⲵᐳቄ㕆⸱˗ԕ৺ 4.7 㢲Ӫ㝨䇶࡛ᓄ⭘ѝ䳀
㯿ቲ㺘⽪Ⲵമ‫ۿ‬⢩ᖱDŽ
x 䗷ᓖᤏਸ䇝㓳ᮠᦞᱟ ANN ᆖҐѝⲴањ䟽㾱䰞仈DŽ䗷ᓖᤏਸሬ㠤㖁㔌⌋ॆ
ࡠᯠⲴᮠᦞᰦᙗ㜭ᖸᐞˈቭ㇑㖁㔌ሩҾ䇝㓳ᮠᦞ㺘⧠䶎ᑨྭDŽӔ৹傼䇱ᯩ⌅
ਟԕ⭘ᶕՠ䇑ởᓖл䱽ᩌ㍒Ⲵਸ䘲㓸→⛩ˈӾ㘼ᴰሿॆ䗷ᓖᤏਸⲴ仾䲙DŽ
x ቭ㇑৽ੁՐ᫝㇇⌅ᱟᴰᑨ㿱Ⲵ ANN ᆖҐ㇇⌅ˈӪԜҏᨀࠪᖸཊަԆⲴ㇇⌅ˈ
वᤜሩҾ⢩↺ԫ࣑ⲴаӋ㇇⌅DŽֻྲˈ䙂ᖂ㖁㔌ᯩ⌅䇝㓳वਜ਼ᴹੁ⧟Ⲵ㖁㔌ˈ
㊫լ㓗㚄⴨‫Ⲵޣ‬㇇⌅᭩ਈᵳⲴ਼ᰦҏ᭩ਈ㖁㔌㔃ᶴDŽ

ᵜҖⲴަԆㄐ㢲ҏӻ㓽ҶаӋ‫ޣ‬Ҿ ANN ᆖҐⲴަԆؑ᚟DŽㅜ 6 ㄐ㔉ࠪҶ䘹ᤙᴰሿॆ䈟


ᐞᒣᯩ઼Ⲵ䍍ਦᯟ䇪䇱ˈԕ৺൘ަԆᛵߥл⭘ᴰሿॆӔ৹⟥˄cross entropy˅ԓᴯᴰሿॆ䈟
ᐞᒣᯩ઼Ⲵᯩ⌅DŽㅜ 7 ㄐ䇘䇪ҶѪਟ䶐ᆖҐᐳቄ࠭ᮠᡰ䴰㾱Ⲵ䇝㓳ᇎֻᮠ䟿Ⲵ⨶䇪㔃᷌ˈԕ
৺ḀӋ㊫ර㖁㔌Ⲵ Vapnik-Chervonenkis 㔤DŽ‫ޣ‬Ҿ䗷ᓖᤏਸԕ৺ྲօ䚯‫Ⲵݽ‬䇘䇪ਟԕ൘ㅜ 5
ㄐѝ᢮ࡠDŽㅜ 12 ㄐ䇘䇪Ҷ֯⭘ԕࡽⲴ⸕䇶ᶕᨀ儈⌋ॆ㋮ᓖⲴᯩ⌅DŽ

ሩӪᐕ⾎㓿㖁㔌Ⲵ⹄ウਟԕ䘭ⓟࡠ䇑㇇ᵪ、ᆖⲴᰙᵏDŽMcCulloch & Pitts˄1943˅ᨀࠪ


Ҷањ⴨ᖃҾᝏ⸕ಘⲴ⾎㓿‫⁑ݳ‬රˈ60 ᒤԓⲴབྷ䟿ᐕ֌᧒㍒Ҷ䘉њ⁑රⲴᖸཊਈփDŽ60 ᒤ
ԓᰙᵏ Widrow & Hoff˄1960˅᧒㍒Ҷᝏ⸕ಘ㖁㔌˄ԆԜ〠ѪĀadelinesā
˅઼ delta ⌅ࡉˈ
Rosenblatt˄1962˅䇱᰾Ҷᝏ⸕ಘ䇝㓳⌅ࡉⲴ᭦ᮋᙗDŽ❦㘼ˈⴤࡠ 60 ᒤԓᲊᵏˈӪԜᔰ࿻␵
ᾊঅቲⲴᝏ⸕ಘ㖁㔌Ⲵ㺘ᖱ㜭࣋ᖸᴹ䲀ˈ㘼ф᢮нࡠ䇝㓳ཊቲ㖁㔌Ⲵᴹ᭸ᯩ⌅DŽMinsky &
Papert˄1969˅䈤᰾ণ֯ᱟ䊑 XOR 䘉ṧㆰঅⲴ࠭ᮠҏн㜭⭘অቲⲴᝏ⸕ಘ㖁㔌㺘⽪ᡆᆖҐˈ
൘ᮤњ 70 ᒤԓ ANN Ⲵ⹄ウ㺠䘰ҶDŽ
൘ 80 ᒤԓѝᵏ ANN Ⲵ⹄ウ㓿শҶа⅑༽‫ˈޤ‬ѫ㾱ᱟഐѪ䇝㓳ཊቲ㖁㔌Ⲵ৽ੁՐ᫝㇇
⌅Ⲵਁ᰾˄Rumelhart & McClelland 1986˗Parker 1985˅DŽ䘉Ӌᙍᜣਟԕ㻛䘭ⓟࡠᴹ‫Ⲵޣ‬ᰙᵏ
⹄ウ˄ֻྲ Werbos 1975˅DŽ㠚Ӿ 80 ᒤԓˈ৽ੁՐ᫝㇇⌅ቡᡀѪᓄ⭘ᴰᒯ⌋ⲴᆖҐᯩ⌅ˈ㘼
фӪԜҏ〟ᶱ᧒㍒ࠪҶᖸཊަԆⲴ ANN ᯩ⌅DŽ൘਼аᰦᵏˈ䇑㇇ᵪਈᗇн޽䍥䟽ˈ䘉‫ݱ‬䇨
ӪԜ䈅傼䛓Ӌ൘ 60 ᒤԓнਟ㜭㻛ᆼ‫᧒ޘ‬㍒Ⲵ䇑㇇ᇶ䳶ᙗⲴ㇇⌅DŽ

ᖸཊᮉ、Җу䰘䇪䘠Ҷ⾎㓿㖁㔌ᆖҐDŽаᵜᰙᵏⲴնӽᴹ⭘Ⲵ‫ޣ‬Ҿ⁑ᔿ䇶࡛Ⲵ৲ᮠᆖҐ
ᯩ⌅ⲴҖᱟ Duda & Hart˄1973˅DŽWindrow & Stearns˄1985˅Ⲵᮉ、Җ㾶ⴆҶᝏ⸕ಘ઼⴨‫ޣ‬
Ⲵঅቲ㖁㔌ԕ৺ᆳԜⲴᓄ⭘DŽRumelhart & McClelland˄1986˅᭦㕆Ҷ 80 ᒤԓѝᵏᔰ࿻Ⲵ䟽
ᯠ◰ਁ䎧ӪԜሩ⾎㓿㖁㔌ᯩ⌅‫ޤ‬䏓Ⲵ䇪᮷DŽ‫ޣ‬Ҿ⾎㓿㖁㔌ᴰ䘁ࠪ⡸ⲴҖ㉽वᤜ Bishop
˄1996˅˗Chauvin & Rumelhart˄1995˅˗Freeman & Skapina˄1991˅
˗Fu˄1994˅˗Hecht-Nielson
˄1990˅઼ Hertz et al.˄1991˅DŽ
Ґ仈

4.1 ሩമ 4-3 ⭫ࠪⲴ䈟ᐞᴢ䶒ˈᝏ⸕ಘⲴᵳw0ˈw1઼w2Ⲵ٬ᱟӰѸ˛‫ٷ‬ᇊ䘉њ䈟ᐞᴢ䶒


оx1䖤⴨Ӕ൘x1= -1ˈᒦоx2䖤⴨Ӕ൘x2 = 2DŽ

4.2 䇮䇑ањє䗃‫Ⲵޕ‬ᝏ⸕ಘᶕᇎ⧠ᐳቄ࠭ᮠ Aš™BDŽ䇮䇑ањєቲⲴᝏ⸕ಘ㖁㔌ᶕᇎ


⧠ᐳቄ࠭ᮠ A XOR BDŽ

4.3 㘳㲁֯⭘䰸٬㺘䗮ᔿw0 + w1x1 + w2x2 > 0 ᇊѹⲴєњᝏ⸕ಘDŽᝏ⸕ಘAⲴᵳ٬Ѫ

w0=1ˈw1=2ˈw2=1

ᝏ⸕ಘ B Ⲵᵳ٬Ѫ

w0=0ˈw1=2ˈw2=1

䈧 ࡔ ᯝ ԕ л 㺘 䗮 ሩ ᡆ 䭉 DŽ ᝏ ⸕ ಘ A ᱟ more_general_than ᝏ ⸕ ಘ B Ⲵ DŽ
˄more_general_than ൘ㅜ 2 ㄐѝᇊѹ˅

4.4 ᇎ⧠ањє䗃‫ޕ‬㓯ᙗঅ‫Ⲵݳ‬delta䇝㓳⌅ࡉDŽ䇝㓳ᆳᶕᤏਸⴞḷᾲᘥ-2+x1+2x2>0DŽ⭫
ࠪ䈟ᐞE⴨ሩ䇝㓳䘝ԓ⅑ᮠⲴ࠭ᮠᴢ㓯DŽ⭫ࠪ 5ˈ10ˈ50ˈ100ˈĂĂ⅑䘝ԓਾⲴߣㆆ䶒DŽ

˄a˅ ѪK䘹ਆн਼Ⲵᑨ䟿٬ˈᒦ֯⭘㺠߿ⲴᆖҐ䙏⦷üüҏቡᱟㅜi⅑䘝ԓ
֯⭘K0/iˈ޽䘋㹼䈅傼DŽଚањ᭸᷌ᴤྭ˛

˄b˅ 䈅傼໎䟿˄incremental˅઼ᢩ䟿˄batch˅ᆖҐDŽ䛓њ᭦ᮋᗇᴤᘛ˛㘳
㲁ᵳ٬ᴤᯠ⅑ᮠ઼ᙫᢗ㹼ᰦ䰤DŽ

4.5 ᧘ሬ䗃ࠪѪ o Ⲵঅњঅ‫Ⲵݳ‬ởᓖл䱽䇝㓳⌅ࡉˈަѝ

o w0  w1 x1  w1 x12    wn x n  wn x n2

4.6 ㆰ⮕Ⲵ䀓䟺ѪӰѸ‫ޜ‬ᔿ˄4.10˅ѝⲴ delta ⌅ࡉӵᱟ‫ޜ‬ᔿ˄4.7˅㺘⽪Ⲵⵏ↓ởᓖл䱽


⌅ࡉⲴ䘁լ˛

4.7 㘳㲁ањєቲⲴࡽ侸ANNˈᆳާᴹєњ䗃‫ޕ‬a઼bˈањ䳀অ‫ݳ‬cˈ઼ањ䗃ࠪঅ‫ݳ‬dDŽ
䘉њ㖁㔌ᴹӄњᵳ٬˄wcaˈwcbˈwc0ˈwdcˈwd0˅ˈަѝwx0㺘⽪অ‫ݳ‬xⲴ䰸٬ᵳDŽ‫ݸ‬ᢺ䘉Ӌᵳ
Ⲵ٬ࡍ࿻ॆѪ˄0.1ˈ0.1ˈ0.1ˈ0.1ˈ0.1˅ˈ❦ਾ㔉ࠪ֯⭘৽ੁՐ᫝㇇⌅䇝㓳䘉њ㖁㔌Ⲵࡽє
⅑䘝ԓѝ⇿а⅑䘉Ӌᵳ٬Ⲵ٬DŽ‫ٷ‬ᇊᆖҐ䙏⦷K=0.3ˈߢ䟿D=0.9ˈ䟷⭘໎䟿Ⲵᵳ٬ᴤᯠˈ઼
ԕл䇝㓳ṧֻ˖

a b d

1 0 1

0 1 0

4.8 ‫؞‬᭩㺘 4-2 ѝⲴ৽ੁՐ᫝㇇⌅ˈ֯⭘ৼᴢ↓࠷tanh࠭ᮠਆԓsigmoid࠭ᮠ֌Ѫᥔ঻࠭


& &
ᮠDŽҏቡᱟ䈤ˈ‫ٷ‬ᇊঅњঅ‫Ⲵݳ‬䗃ࠪᱟo=tanh˄ w ˜ x ˅DŽ㔉ࠪ䗃ࠪቲᵳ٬઼䳀㯿ቲᵳ٬Ⲵᵳ
ᴤᯠ⌅ࡉDŽᨀ⽪˖tanhc(x)=1-tanh2(x)DŽ

4.9 എᗶമ 4-7 ᧿䘠Ⲵ 8u3u8 㖁㔌DŽ㘳㲁䇝㓳ањ 8u1u8 Ⲵ㖁㔌ᶕᆼᡀ਼ṧⲴԫ࣑˗ҏ


ቡᱟӵᴹањ䳀㯿অ‫Ⲵݳ‬㖁㔌DŽ⌘᜿ˈമ 4-7 ѝⲴ 8 њ䇝㓳ṧֻਟԕ㻛㺘⽪Ѫঅњ䳀অ‫Ⲵݳ‬
8 њн਼Ⲵ٬˄ֻྲ 0.1ˈ0.2ˈĂĂˈ0.8˅DŽ䛓Ѹӵᴹањ䳀অ‫Ⲵݳ‬㖁㔌㜭ཏṩᦞ䘉Ӌ䇝㓳
ṧֻᆖҐᚂㅹ࠭ᮠੇ˛ᨀ⽪˖㘳㲁㊫լ䘉ṧⲴ䰞仈Āᱟ੖ᆈ൘䘉ṧⲴ䳀㯿অ‫ݳ‬ᵳ٬ˈ㜭ӗ⭏
к䶒ᔪ䇞Ⲵ䳀㯿অ‫ݳ‬㕆⸱˛āˈĀᱟ੖ᆈ൘䘉ṧⲴ䗃ࠪঅ‫ݳ‬ᵳ٬ˈ㜭↓⺞䀓⸱䘉ṧⲴ䗃‫ޕ‬㕆
⸱˛ā઼Āởᓖл䱽ᩌ㍒ਟ㜭ਁ⧠䘉ṧⲴᵳ٬ੇ˛ā

4.10 㘳㲁 4.8.1 ሿ㢲ѝ᧿䘠Ⲵਖа⿽䈟ᐞ࠭ᮠ˖

& 1
E ( w) { ¦ ¦ (t kd  o kd )2  J ¦ w ji
2

2 dD koutputs i, j

Ѫ䘉њ䈟ᐞ E ᧘ሬࠪởᓖл䱽ᵳᴤᯠ⌅ࡉDŽ䇱᰾䘉њᵳ٬ᴤᯠ⌅ࡉⲴᇎ⧠ਟ䙊䗷൘䘋
㹼㺘 4-2 Ⲵḷ߶ởᓖл䱽ᵳᴤᯠࡽᢺ⇿њᵳ٬҈ԕањᑨᮠDŽ

4.11 ᓄ ⭘ ৽ ੁ Ր ᫝ ㇇ ⌅ ᶕ ᆼ ᡀ Ӫ 㝨 䇶 ࡛ ԫ ࣑ DŽ ৲ 㿱 ӂ 㚄 㖁 亥
http://www.cs.cmu.edu/~tom/mlbook.html ᶕ㧧ᗇަ㓶㢲ˈवᤜӪ㝨മ‫ۿ‬ᮠᦞˈ৽ੁՐ᫝〻ᒿ
Ⓚԓ⸱઼ާփⲴԫ࣑DŽ

4.12 ᧘ሬࠪᆖҐ xˈy ᒣ䶒кⲴ⸙ᖒ䘉аⴞḷᾲᘥⲴởᓖл䱽㇇⌅DŽ֯⭘ xˈy Ⲵ඀ḷ᧿


䘠⇿ањ‫ٷ‬䇮ˈ⸙ᖒⲴᐖл䀂઼ਣк䀂࠶࡛㺘⽪Ѫ llxˈllyˈurx ઼ uryDŽᇎֻ<x,y>㻛‫ٷ‬䇮<llxˈ
llyˈurxˈury>ḷ䇠Ѫ↓ֻⲴ‫ݵ‬㾱ᶑԦᱟ⛩<x,y>սҾሩᓄⲴ⸙ᖒ޵䜘DŽ᤹ᵜㄐѝⲴ࣎⌅ᇊѹ
䈟ᐞ EDŽ䈅䇮䇑ањởᓖл䱽㇇⌅ᶕᆖҐ䘉ṧⲴ⸙ᖒ‫ٷ‬䇮DŽ⌘᜿䈟ᐞ E нᱟ llxˈllyˈurx ઼
ury Ⲵ䘎㔝࠭ᮠˈ䘉оᝏ⸕ಘᆖҐⲴᛵߥаṧDŽ˄ᨀ⽪˖㘳㲁ᝏ⸕ಘѝ֯⭘Ⲵєњ䀓ߣ࣎⌅˖
˄1˅᭩ਈ࠶㊫⌅ࡉᶕ֯䗃ࠪ亴⍻ᡀѪ䗃‫Ⲵޕ‬䘎㔝࠭ᮠ˗˄2˅ਖཆᇊѹањ䈟ᐞüü∄ྲࡠ
⸙ᖒѝᗳⲴ䐍⿫üüቡ‫ۿ‬䇝㓳ᝏ⸕ಘⲴ delta ⌅ࡉDŽ˅ᖃ↓઼ֻ৽ֻਟ㻛⸙ᖒ࠶ࢢᰦˈ䇮䇑Ⲵ
㇇⌅Պ᭦ᮋࡠᴰሿ䈟ᐞ‫ٷ‬䇮ੇ˛օᰦнՊ˛䈕㇇⌅ᴹተ䜘ᶱሿ٬Ⲵ䰞仈ੇ˛䈕㇇⌅оᆖҐ
⢩ᖱ㓖ᶏਸਆⲴㅖਧᯩ⌅⴨∄ྲօ˛

৲㘳᮷⥞
ㅢ5ㄖ 䇺զ‫ٽ‬䇴

ᇍ‫؛‬䆒ⱘ㊒ᑺ䖯㸠㒣偠ⱘ䆘Ԅᰃᴎ఼ᄺдЁⱘ෎ᴀ䯂乬DŽᴀゴҟ㒡њ⫼㒳䅵ᮍ⊩Ԅ䅵‫؛‬
䆒㊒ᑺˈЏ㽕Ў㾷‫އ‬ҹϟϝϾ䯂乬˖佪‫ˈܜ‬ᏆⶹϔϾ‫؛‬䆒೼᳝䰤᭄᥂ḋᴀϞ㾖ᆳࠄⱘ㊒ᑺˈ
ᗢḋԄ䅵ᅗ೼݊Ҫᅲ՟Ϟⱘ㊒ᑺDŽ݊⃵ˈབᵰϔϾ‫؛‬䆒೼ᶤѯ᭄᥂ḋᴀϞདѢ঺ϔϾˈ䙷М
ϔ㠀ᚙ‫މ‬ϟᰃ৺䆹‫؛‬䆒᳈‫⹂ޚ‬DŽ㄀ϝˈᔧ᭄᥂᳝䰤ᯊˈᗢḋ催ᬜഄ߽⫼䖭ѯ᭄᥂ˈ䗮䖛ᅗӀ
᮶㛑ᄺдࠄ‫؛‬䆒ˈ䖬㛑Ԅ䅵݊㊒ᑺ˛⬅Ѣ᳝䰤ⱘ᭄᥂ḋᴀৃ㛑ϡҷ㸼᭄᥂ⱘϔ㠀ߚᏗˈ᠔ҹ
Ң䖭ѯ᭄᥂ϞԄ䅵ߎⱘ‫؛‬䆒㊒ᑺৃ㛑᳝䇃ᏂDŽ㒳䅵ⱘᮍ⊩ˈ㒧ড়᭄᳝݇᥂෎‫ߚޚ‬Ꮧⱘ‫؛‬ᅮˈ
Փ៥Ӏৃҹ⫼᳝䰤᭄᥂ḋᴀϞⱘ㾖ᆳ㊒ᑺᴹ䘐䖥ᭈϾ᭄᥂ߚᏗϞⱘⳳᅲ㊒ᑺDŽ

5.1 ࣞᵰ

໮᭄ᚙ‫މ‬ϟˈᇍᄺдࠄⱘ‫؛‬䆒䖯㸠ሑৃ㛑‫ⱘ⹂ޚ‬ᗻ㛑䆘Ԅकߚ䞡㽕DŽॳ಴Пϔᕜㅔऩˈ
ᰃЎњⶹ䘧ᰃ৺ৃҹՓ⫼䆹‫؛‬䆒DŽ՟བˈҢϔϾ䭓ᑺ᳝䰤ⱘ᭄᥂ᑧЁᄺдˈҹњ㾷ϡৠए⭫
᠟↉ⱘᬜᵰˈህ᳝ᖙ㽕ሑৃ㛑‫⹂ޚ‬ഄⶹ䘧ᄺд㒧ᵰⱘℷ⹂ᗻDŽ঺ϔॳ಴೼Ѣˈᇍ‫؛‬䆒ⱘ䆘Ԅ
ᰃ䆌໮ᄺдᮍ⊩ⱘ䞡㽕㒘៤䚼ߚDŽ՟བ೼‫އ‬ㄪᷥᄺдЁˈЎ䙓‫ܡ‬䖛ᑺᢳড়䯂乬ᖙ乏䖯㸠ৢׂ
࠾ˈ䖭ᯊ៥Ӏᖙ乏䆘Ԅ↣ϔℹׂ࠾ᇍᷥⱘ㊒ᑺѻ⫳ⱘᕅડDŽ಴ℸˈ᳝ᖙ㽕њ㾷Ꮖׂ࠾੠᳾ׂ
࠾ᷥⱘ㊒ᑺԄ䅵Ё೎᳝ⱘৃ㛑䇃ᏂDŽ

ᔧ᭄᥂कߚ‫ܙ‬䎇ᯊˈ‫؛‬䆒㊒ᑺⱘԄ䅵ⳌᇍᆍᯧDŽ✊㗠ᔧ㒭ᅮⱘ᭄᥂䲚䴲ᐌ᳝䰤ᯊˈ㽕ᄺ
дϔϾὖᗉᑊԄ䅵݊ᇚᴹⱘ㊒ᑺˈᄬ೼ϸϾᕜ݇䬂ⱘೄ䲒˖
z Ԅ䅵ⱘ‫أ‬Ꮒ(Bias in the estimate)DŽ佪‫ˈܜ‬ᄺдࠄⱘὖᗉ೼䆁㒗ḋ՟Ϟⱘ㾖ᆳ㊒ᑺ
䗮ᐌϡ㛑ᕜདഄ⫼ѢԄ䅵೼ᇚᴹḋ՟Ϟⱘ㊒ᑺDŽ಴Ў‫؛‬䆒ᰃҢ䖭ѯḋ՟Ёᕫߎ
ⱘˈ಴ℸᇍᇚᴹḋ՟ⱘ㊒ᑺԄ䅵䗮ᐌ‫أ‬ѢФ㾖DŽᇸ݊೼ᄺд఼䞛⫼њᕜ໻ⱘ‫؛‬
䆒ぎ䯈ˈᑊ䖛ᑺᢳড়䆁㒗ḋ՟ᯊˈ䖭ϔᚙ‫މ‬᳈ৃ㛑ߎ⦄DŽ㽕ᇍᇚᴹⱘ㊒ᑺ䖯㸠
᮴‫أ‬Ԅ䅵ˈ‫݌‬ൟⱘᮍ⊩ᰃ䗝ᢽϢ䆁㒗ḋ՟੠‫؛‬䆒᮴݇ⱘẔ偠ḋ՟ˈ೼䖭Ͼḋ՟
䲚ড়ϞẔ偠‫؛‬䆒DŽ
z Ԅ䅵ⱘᮍᏂ(Variance in the estimate)DŽ݊⃵ˈेՓ‫؛‬䆒㊒ᑺ೼⣀ゟⱘ᮴‫أ‬Ẕ偠ḋ
՟Ϟ⌟䞣ˈᕫࠄⱘ㊒ᑺҡৃ㛑Ϣⳳᅲ㊒ᑺϡৠˈ䖭প‫އ‬Ѣ⡍ᅮẔ偠ḋ՟䲚ড়ⱘ
㒘៤DŽẔ偠ḋ՟䍞ᇥˈѻ⫳ⱘᮍᏂ䍞໻DŽ

ᴀゴ䅼䆎њᇍᄺࠄⱘ‫؛‬䆒ⱘ䆘ԄǃᇍϸϾ‫؛‬䆒㊒ᑺⱘ↨䕗ǃ੠᳝䰤᭄᥂ḋᴀᚙ‫މ‬ϟϸϾ
ᄺдㅫ⊩㊒ᑺⱘ↨䕗DŽ݊Ёⱘ䅼䆎໮᭄䲚Ё೼㒳䅵੠䞛ḋ⧚䆎ⱘ෎ᴀᅮᕟˈ㗠ᴀゴ‫؛‬ᅮ䇏㗙
೼㒳䅵ᄺᮍ䴶≵᳝㚠᱃ⶹ䆚DŽ‫؛‬䆒ⱘ㒳䅵Ẕ偠䳔㽕䕗໮ⱘ⧚䆎ⶹ䆚DŽᴀゴᦤկњҟ㒡ᗻⱘ㓐
䗄ˈ䲚Ё䅼䆎䙷ѯϢ‫؛‬䆒ⱘᄺдǃ䆘Ԅ੠↨䕗Ⳍ݇ⱘ䯂乬DŽ

5.2 զ䇗‫ٽ‬䇴㋴ᓜ

೼䆘ԄϔϾ‫؛‬䆒ᯊˈ៥Ӏϔ㠀᳈ᛳ݈䍷ѢԄ䅵݊ᇍ᳾ᴹᅲ՟ⱘߚ㉏㊒ᑺDŽৠᯊˈг䳔㽕
ⶹ䘧䖭ϔ㊒ᑺԄ䅵Ёⱘৃ㛑ⱘ䇃Ꮒ˄ेϢℸԄ䅵Ⳍ㘨㋏ⱘ䇃Ꮒ䮼䰤˅DŽ

ᴀゴՓ⫼ⱘᄺд䯂乬ⱘḚᶊབϟDŽ᳝ϔ᠔᳝ৃ㛑ᅲ՟ⱘぎ䯈 X˄བ᠔᳝Ҏⱘ䲚ড়˅ ˈ݊
ϞᅮНњ໮ϾⳂᷛߑ᭄˄བ䅵ߦᴀᑈ䌁ф⒥䲾ᵓ㗙˅DŽ៥Ӏ‫؛‬ᅮ X Ёϡৠᅲ՟‫݋‬᳝ϡৠⱘߎ
⦄乥⥛ˈᇍℸˈϔ⾡ড়䗖ⱘᓎ῵ᮍᓣᰃˈ‫؛‬ᅮᄬ೼ϔ᳾ⶹⱘὖ⥛ߚᏗ DˈᅗᅮНњ X Ё↣ϔ
ᅲ՟ߎ⦄ⱘὖ⥛˄བ 19 ቕⱘҎⱘὖ⥛↨ 109 ቕⱘҎὖ⥛催˅
DŽ⊼ᛣ D ᑊ≵᳝䇈ᯢ x ᰃϔℷ՟
䖬ᰃϔড՟ˈা⹂ᅮњ݊ߎ⦄ὖ⥛DŽᄺдӏࡵᰃ೼‫؛‬䆒ぎ䯈 H ϞᄺдϔϾⳂᷛὖᗉ˄ेⳂ
ᷛߑ᭄˅fDŽⳂᷛߑ᭄ f ⱘ䆁㒗ḋ՟⬅ᮑᬭ㗙ᦤկ㒭ᄺд఼˖↣ϔϾᅲ՟ᣝ✻ߚᏗ D 㹿⣀ゟ
ഄᢑপˈ✊ৢᅗ䖲ৠ݊ℷ⹂ⱘⳂᷛؐ f(x)㹿ᦤկ㒭ᄺд఼DŽ

Ў䇈ᯢ䖭ϔ⚍ˈ㗗㰥Ⳃᷛߑ᭄Ā䅵ߦᴀᑈ䌁ф⒥䲾ᵓ㗙āˈৃҹ䇗ᶹএ⒥䲾ᵓଚᑫⱘ乒
ᅶˈ䗮䖛ℸ䇗ᶹᴹᬊ䲚䆁㒗ḋ՟DŽ೼䖭䞠ᅲ՟ぎ䯈 X Ў᠔᳝Ҏ㒘៤ⱘ䲚ড়ˈ↣Ͼᅲ՟ৃ⬅
Ҏⱘ৘⾡ሲᗻᦣ䗄ˈབᑈ啘ǃ㘠Ϯǃ↣ᑈ⒥䲾⃵᭄ㄝDŽߚᏗᚙ‫ މ‬D ᣛᅮњ೼⒥䲾ᵓଚᑫЁ
䘛ࠄⱘ↣ϾҎⱘὖ⥛DŽⳂᷛߑ᭄ f:Xė{0,1}ᇚ↣ϾҎ䖯㸠ߚ㉏ˈ߸ᮁᅗᰃ৺Ӯ೼ᴀᑈ‫ݙ‬䌁ф
⒥䲾ᵓDŽ

೼䖭Ͼϔ㠀ⱘḚᶊЁˈ៥Ӏᛳ݈䍷ⱘᰃҹϟϸϾ䯂乬˖

1. 㒭ᅮ‫؛‬䆒 h ੠ࣙ৿㢹ᑆᣝ D ߚᏗ䱣ᴎᢑপⱘḋ՟ⱘ᭄᥂䲚ˈབԩ䩜ᇍᇚᴹᣝৠḋߚᏗᢑ


পⱘᅲ՟ˈᕫࠄᇍ h ⱘ㊒ᑺⱘ᳔དԄ䅵DŽ

2. 䖭ϔ㊒ᑺԄ䅵ⱘৃ㛑ⱘ䇃Ꮒᰃ໮ᇥ˛

5.2.1 ṭᵢ䭏䈥⦽ૂⵕᇔ䭏䈥⦽

Ў㾷‫އ‬Ϟ䗄ⱘϸϾ䯂乬ˈ䳔㽕⹂ߛഄऎߚߎϸ⾡㊒ᑺ˄៪ϸ⾡䫭䇃⥛˅DŽ݊ϔᰃৃ⫼᭄
᥂ḋᴀϞ䆹‫؛‬䆒ⱘ䫭䇃⥛DŽ݊Ѡᰃ೼ߚᏗЎ D ⱘᭈϾᅲ՟䲚ড়Ϟ䆹‫؛‬䆒ⱘ䫭䇃⥛DŽᅗӀߚ
߿㹿⿄Ўḋᴀ䫭䇃⥛੠ⳳᅲ䫭䇃⥛DŽ

ᇍѢѢҢ X Ёᢑপⱘḋᴀ Sˈᶤ‫؛‬䆒݇Ѣ S ⱘḋ


ḋᴀ䫭䇃⥛˄sample error˅
ˈᰃ䆹‫؛‬䆒䫭
䇃ߚ㉏ⱘᅲ՟೼ S Ё᠔ऴ↨՟˖

ḋᴀ䫭䇃⥛˄ᷛ䆄ЎerrorS(h)˅Ў˖
定义: ‫؛‬䆒h݇ѢⳂᷛߑ᭄f੠᭄᥂ḋᴀSⱘḋ

1
errorS (h) { ¦ G ( f ( x), h( x))
n xS

݊Ё n Ў S Ёḋ՟ⱘ᭄䞣ˈ㗠 G ( f ( x ), h( x )) ೼ f ( x ) z h( x ) ᯊЎ 1ˈ৺߭Ў 0DŽ

ⳳᅲ䫭䇃⥛(true error)ᰃᇍѢᣝ D ߚᏗ䱣ᴎᢑপⱘᅲ՟ˈ䆹‫؛‬䆒ᇍᅗ䫭䇃ߚ㉏ⱘὖ⥛DŽ

ⳳᅲ䫭䇃⥛˄⬅errorD(h)㸼⼎˅ˈЎh䇃ߚ㉏ᣝD
定义: ‫؛‬䆒h݇ѢⳂᷛߑ᭄f੠ߚᏗDⱘⳳ
ߚᏗ䱣ᴎᢑপᅲ՟ⱘὖ⥛˖

errorD ( h) { Pr [ f ( x ) z h( x )]
xD

䖭䞠ˈ䆄ো Pr 㸼⼎ὖ⥛೼ᅲ՟ߚᏗ D Ϟ䅵ㅫDŽ


xD

៥Ӏ䗮ᐌᛇⶹ䘧ⱘᰃ‫؛‬䆒ⱘⳳᅲ䫭䇃⥛errorD(h)ˈ಴Ў䖭ᰃ೼ߚ㉏᳾ᴹḋ՟ᯊߎ⦄䫭䇃
ⱘৃ㛑ᗻDŽ✊㗠៥Ӏ᠔㛑⌟䞣ⱘাᰃḋᴀ䫭䇃⥛errorS(h)ˈᅗ᠔㽕∖ⱘ᭄᥂ḋᴀSᰃ៥Ӏ᠔
ᢹ᳝ⱘDŽᴀ㡖᠔㽕㗗㰥ⱘЏ㽕䯂乬ህᰃĀerrorS(h)೼ԩ⾡⿟ᑺϞᦤկњᇍerrorD(h) ⱘԄ
䅵˛āDŽ

5.2.2 ⿱ᮙ‫ٽٲ‬䇴Ⲻ㖤‫ؗ‬॰䰪

Ў㾷‫އ‬ĀerrorS(h)೼ԩ⾡⿟ᑺϞᦤկњᇍerrorD(h) ⱘԄ䅵āⱘ䯂乬ˈ‫ܜ‬㗗㰥hЎ⾏ᬷؐ
‫؛‬䆒ⱘᚙ‫މ‬DŽ‫݋‬ԧഄ䇈ˈ↨བ㽕෎Ѣᶤ⾏ᬷؐ‫؛‬䆒h೼ḋᴀSϞ㾖ᆳࠄⱘḋᴀ䫭䇃⥛ˈԄ䅵ᅗ
ⱘⳳᅲ䫭䇃⥛ˈ݊Ё˖
z ḋᴀ S ࣙ৿ n Ͼḋ՟ˈᅗӀⱘᢑপᣝ✻ὖ⥛ߚᏗ Dˈᢑপ䖛⿟ᰃⳌѦ⣀ゟⱘˈᑊ
Ϩϡձ䌪Ѣ h
z nı30
z ‫؛‬䆒h೼䖭nϾḋ՟Ϟ⢃њrϾ䫭䇃˄errorS(h)=r/n˅

Ꮖⶹ䖭ѯᴵӊˈ㒳䅵⧚䆎ৃ㒭ߎҹϟᮁ㿔˖

1.≵᳝݊Ҫֵᙃⱘ䆱ˈerrorD(h)᳔ৃ㛑ⱘؐЎerrorS(h)

2.᳝໻㑺 95ˁⱘৃ㛑ᗻˈⳳᅲ䫭䇃⥛errorD(h)໘Ѣϟ䴶ⱘऎ䯈‫˖ݙ‬

errorS (h)(1  errorS (h))


errorS (h) r 1.96
n

В՟䇈ᯢˈ‫؛‬བ᭄᥂ḋᴀSࣙ৿n=40 Ͼḋ՟ˈᑊϨ‫؛‬䆒h೼䖭ѯ᭄᥂Ϟѻ⫳њr=12 Ͼ䫭
䇃DŽ䖭ḋˈḋᴀ䫭䇃⥛ЎerrorS(h)=12/40˙0.3DŽབᵰ≵᳝᳈໮ⱘֵᙃˈᇍⳳᅲ䫭䇃⥛errorD(h)
ⱘ᳔དⱘԄ䅵ेЎḋᴀ䫭䇃⥛ 0.3DŽ✊㗠៥Ӏϡ㛑ᳳᳯ䖭ᰃᇍⳳᅲ䫭䇃⥛ⱘᅠ㕢Ԅ䅵DŽབᵰ
঺໪᧰䲚 40 Ͼ䱣ᴎᢑপⱘḋ՟S´ˈḋᴀ䫭䇃⥛errorS´(h)ᇚϢॳᴹⱘerrorS(h)ᄬ೼ѯ䆌ϡৠDŽ
䖭⾡ϡৠᰃ⬅S´੠S㒘៤Ϟⱘ䱣ᴎᏂᓖ᠔ѻ⫳ⱘDŽᅲ䰙Ϟˈབᵰϡᮁ䞡໡䖭ϔᅲ偠ˈ↣⃵ᢑ
পϔϾࣙ৿ 40 ḋ՟ⱘḋᴀSiˈᇚӮথ⦄㑺 95%ⱘᅲ偠Ё䅵ㅫ᠔ᕫⱘऎ䯈ࣙ৿ⳳᅲ䫭䇃⥛DŽ
಴ℸˈ៥Ӏᇚℸऎ䯈⿄ЎerrorD(h)ⱘ 95%㕂ֵऎ䯈Ԅ䅵DŽ೼ᴀ՟Ёˈr=12 ੠n=40ˈḍ᥂Ϟᓣˈ
95%㕂ֵऎ䯈Ў 0.30f(1.96h0.07)˙0.30f0.14DŽ

Ϟ䴶ⱘ 95ˁ㕂ֵऎ䯈㸼䖒ᓣৃ᥼ᑓࠄϔ㠀ᚙᔶҹ䅵ㅫӏᛣ㕂ֵᑺDŽᐌ᭄ 1.96 ᰃ⬅ 95%


䖭ϔ㕂ֵᑺ⹂ᅮⱘDŽᅮНzNЎ䅵ㅫN%㕂ֵऎ䯈ᯊⱘᐌ᭄DŽ䅵ㅫerrorD(h)ⱘN%㕂ֵऎ䯈ⱘϔ
㠀㸼䖒ᓣЎ˖

errorS (h)(1  errorS (h))


errorS (h) r z N (5.1)
n

݊ЁzNⱘؐձ䌪Ѣ᠔䳔ⱘ㕂ֵᑺˈখ㾕㸼 5-1 ЁⱘপؐDŽ

㸼 5-1 ঠջⱘNˁ㕂ֵऎ䯈ⱘzNؐ

㕂ֵᑺ N% 50% 68% 80% 90% 95% 98% 99%


ᐌ䞣zN 0.67 1.00 1.28 1.64 1.96 2.33 2.58

಴ℸˈℷབerrorD(h)ⱘ 95ˁ㕂ֵऎ䯈Ў 0.30f(1.96噝 0.07)˄݊Ёr=12ˈn=40˅ˈৃҹ∖


ᕫৠḋᚙ‫މ‬ϟ 68%㕂ֵऎ䯈Ў 0.30f˄1.0噝 0.07˅DŽҢⳈ㾝Ϟ៥Ӏгৃҹⳟߎ 68ˁ㕂ֵऎ䯈
㽕ᇣѢ 95ˁ㕂ֵऎ䯈ˈ಴Ў៥Ӏ‫ޣ‬ᇣњ㽕∖errorD(h)㨑ܹℸऎ䯈ⱘὖ⥛DŽ
ㄝᓣ 5.1 ᦣ䗄њЎњ೼errorS(h)෎⸔ϞԄ䅵errorD(h)ˈབԩ䅵ㅫ㕂ֵऎ䯈˄े䇃Ꮒ䮼䰤˅DŽ
䖭ϔ㸼䖒ᓣᯊা㛑ᑨ⫼Ѣ⾏ᬷؐ‫؛‬䆒DŽᅗ‫؛‬ᅮḋᴀSᢑপⱘߚᏗϢᇚᴹⱘ᭄᥂ᢑপⱘߚᏗⳌ
ৠˈᑊϨ‫؛‬ᅮ᭄᥂ϡձ䌪Ѣ᠔Ẕ偠ⱘ‫؛‬䆒DŽ䖬᳝ˈ䆹㸼䖒ᓣাᦤկњ䖥Ԑⱘ㕂ֵऎ䯈ˈϡ䖛
䖭ϔ䖥Ԑ೼㟇ᇥࣙ৿ 30 Ͼḋ՟ᑊϨerrorS(h)ϡ໾䴴䖥 0 ៪ 1 ᯊᕜ᥹䖥ⳳᅲᚙ‫މ‬DŽ߸ᮁ䖭⾡
䖥Ԑᰃ৺᥹䖥ⳳᅲˈ᳈㊒⹂ⱘ㾘߭Ў˖

n˜ errorS (h)(1  errorS (h)) t 5

Ϟ䴶៥Ӏὖ䗄њ䅵ㅫ⾏ᬷؐ‫؛‬䆒ⱘ㕂ֵऎ䯈ⱘ䖛⿟ˈϟϔ㡖ᇚ㒭ߎ䖭ϔ䖛⿟ⱘ㒳䅵ᄺ෎
⸔DŽ

5.3 䟽ṭ⨼䇰ะ⹶

ᴀ㡖ҟ㒡њ㒳䅵ᄺ੠䞛ḋ⧚䆎ⱘ޴Ͼ෎ᴀὖᗉˈࣙᣀὖ⥛ߚᏗǃᳳᳯؐǃᮍᏂǃѠ乍ߚ
Ꮧ੠ℷᗕߚᏗǃҹঞঠջ੠ऩջऎ䯈DŽᇍѢ䖭ѯὖᗉⱘ෎ᴀњ㾷ᇚ᳝ࡽѢ⧚㾷‫؛‬䆒䆘Ԅ੠ㅫ
⊩䆘ԄDŽ᳈Ў䞡㽕ⱘˈᅗӀᦤկњϔ⾡䞡㽕ⱘὖᗉḚᶊˈҹ֓Ѣ⧚㾷Ⳍ݇ⱘᴎ఼ᄺд䯂乬˄བ
䖛ᑺᢳড়䯂乬˅ҹঞ⧚㾷೼៤ࡳⱘ⊯࣪੠䆁㒗ḋ՟᭄ⳂП䯈ⱘ݇㋏DŽᏆ㒣❳ᙝ䖭ѯὖᗉⱘ䇏
㗙ৃҹ䏇䖛ᴀ㡖DŽ݊Ёҟ㒡ⱘ݇䬂ὖᗉ೼㸼 5-2 Ё߫ߎDŽ

㸼 5-2 㒳䅵ᄺЁⱘ෎ᴀᅮН੠ὖᗉ

 䱣ᴎব䞣(random variable)ৃ㹿ⳟ԰ᰃ᳝ὖ⥛䕧ߎⱘϔϾᅲ偠DŽᅗⱘؐЎᅲ偠ⱘ䕧ߎ㒧ᵰDŽ
 ᶤ䱣ᴎব䞣ⱘὖ⥛ߚᏗ(probability distribution)ᣛᅮњYপؐЎӏϔৃ㛑ⱘؐyiⱘৃ㛑ᗻPr(Y=yi)

 䱣ᴎব䞣Yⱘᳳᳯؐ(expected value)៪ഛؐ(mean)Ў ¦y i i Pr(Y y i ) DŽ䗮ᐌ⫼ヺো­Yᴹ㸼⼎


E[Y]DŽ
 䱣ᴎব䞣ⱘᮍᏂ(Variance)ЎVar(Y)=E[(Y-­Y)2]DŽᅗᦣ䗄њY݇Ѣ݊ഛؐߚᏗⱘᆑᑺ៪ߚᬷᑺDŽ

 Yⱘᷛ‫ޚ‬Ꮒ(Standard deviation)Ў Var (Y ) DŽ䗮ᐌ⫼ヺো³Yᴹҷ㸼DŽ


 Ѡ乍ߚᏗ(Binomial distribution)ᰃ೼⹀Ꮥᡩᦋ䯂乬Ёˈ㢹ߎ⦄ℷ䴶ⱘὖ⥛Ў pˈ䙷М೼ n Ͼ⣀ゟ
ⱘᅲ偠Ёߎ⦄ r ⃵ℷ䴶ⱘߚᏗᚙ‫މ‬DŽ
 ℷᗕߚᏗ(Normal distribution)ᰃϔ䩳ᔶⱘὖ⥛ߚᏗˈᅗ೼䆌໮㞾✊⦄䈵Ё䛑Ӯߎ⦄DŽ
 Ёᖗᵕ䰤ᅮ⧚(Central Limit Theorem)䇈ᯢ⣀ゟৠߚᏗⱘ䱣ᴎব䞣೼໻䞣ᅲ偠Ёⱘ੠䙉ᕾℷᗕߚ
ᏗDŽ
 Ԅ䅵䞣(estimator)Ўϔ䱣ᴎব䞣 Yˈᅗ⫼ᴹԄ䅵ϔ෎‫ޚ‬ᘏԧⱘᶤϔখ᭄ pDŽ
 P ⱘԄ䅵䞣 Y ⱘԄ䅵‫أ‬Ꮒ(estimation bias)Ў(E[Y]ˉp)DŽ᮴‫أ‬Ԅ䅵䞣ᰃᣛ䆹‫أ‬ᏂЎ 0DŽ
 N%㕂ֵऎ䯈(confidence interval)⫼ѢԄ䅵খ᭄ pˈ䆹ऎ䯈ҹ N%ⱘὖ⥛ࣙ৿ pDŽ

5.3.1 䭏䈥⦽զ䇗ૂӂ亯∊ׁզ䇗

೼ḋᴀ䫭䇃⥛੠ⳳᅲ䫭䇃⥛П䯈ⱘᏂᓖϢ᭄᥂ḋᴀ໻ᇣⱘձ䌪݇㋏བԩ˛䖭ϔ䯂乬೼
㒳䅵ᄺЁᏆ䗣ᕏⷨおDŽᅗৃ㸼䗄Ў˖㒭ᅮϔᘏԧЁ䱣ᴎᢑপⱘ䚼ߚḋᴀⱘ㾖ᆳ乥⥛ˈԄ䅵ᭈ
Ͼᘏԧⱘὖ⥛DŽ೼䖭䞠ˈ៥Ӏᛳ݈䍷ⱘ㾖ᆳ䞣Ў h ᰃ৺䇃ߚ㉏ḋ՟DŽ

㾷‫އ‬䆹䯂乬佪‫ܜ‬㽕⊼ᛣࠄˈ⌟䞣ḋᴀ䫭䇃⥛ⳌᔧѢ೼԰ϔϾ᳝䱣ᴎ䕧ߎⱘᅲ偠DŽ៥Ӏ‫ܜ‬
ҢߚᏗDЁ䱣ᴎᢑপߎnϾ⣀ゟⱘᅲ՟ˈᔶ៤ḋᴀSˈ✊ৢ⌟䞣ḋᴀ䫭䇃⥛errorS(h)ˈབࠡϔ
㡖᠔䗄ˈབᵰᇚᅲ偠䞡໡໮⃵ˈ↣⃵ᢑপ໻ᇣЎnⱘϡৠⱘḋᴀSiˈᇚৃҹᕫࠄϡৠⱘerrorSi(h)
ⱘؐˈᅗপ‫އ‬ѢϡৠSiⱘ㒘៤Ёⱘ䱣ᴎᏂᓖDŽ䖭⾡ᚙ‫މ‬ϟˈ㄀iϾ䖭ḋⱘᅲ偠ⱘ䕧ߎerrorSi(h)
㹿⿄Ўϔ䱣ᴎব䞣˄random variable˅
DŽϔ㠀ᚙ‫މ‬ϟˈৃҹᇚ䱣ᴎব䞣ⳟ៤ϔϾ᳝䱣ᴎ䕧ߎⱘ
ᅲ偠DŽ䱣ᴎব䞣ؐेЎ䱣ᴎᅲ偠ⱘ㾖ᆳ䕧ߎDŽ

䆒ᛇ㽕䖤㸠kϾ䖭ḋⱘ䱣ᴎᅲ偠ˈ⌟䞣䱣ᴎব䞣errorS1(h) ˈerrorS2(h)ˈĂĂˈ errorSk(h)DŽ


✊ৢ៥Ӏҹ೒㸼ⱘᔶᓣᰒ⼎ߎ㾖ᆳࠄⱘ↣Ͼ䫭䇃⥛ؐⱘ乥⥛DŽᔧkϡᮁ๲䭓ˈ䆹೒㸼ᇚਜ⦄
བ㸼 5-3 䙷ḋⱘߚᏗDŽ䆹㸼ᦣ䗄ⱘὖ⥛ߚᏗ⿄ЎѠ乍ߚᏗ˄Binomial distribution˅DŽ

㸼 5-3 Ѡ乍ߚᏗ

插图——原书页码:25

Binomial distribution for n=40, p=0.3: n=40ˈp=0.3 ᯊⱘѠ乍ߚᏗ

  ϔϾѠ乍ߚᏗ˄Binomial distribution˅㒭ߎњᔧऩϾ⹀Ꮥᡩᦋߎ⦄ℷ䴶ⱘὖ⥛Ў p ᯊˈ೼ n Ͼ⣀ゟ⹀Ꮥ


ᡩᦋⱘḋᴀЁ㾖ᆳࠄ r ⃵ℷ䴶ⱘὖ⥛DŽᅗ⬅ҹϟⱘὖ⥛ߑ᭄ᅮН˖

n!
P(r ) p r (1  p) n  r
r!(n  r )!
  བᵰ䱣ᴎব䞣 X 䙉ᕾѠ乍ߚᏗˈ߭˖
 X পؐЎ r ⱘὖ⥛ Pr(X=r)⬅ P(r)㒭ߎDŽ
 X ⱘᳳᳯؐ៪ഛؐ E[X]Ў˖
E[X]=np
 X ⱘᮍᏂ Var(X)Ў
Var(X)=np(1-p)
 Xⱘᷛ‫ޚ‬ᏂЎ³XЎ˖

VX np(1  p)
  ᇍѢ䎇໳໻ⱘ n ؐˈѠ乍ߚᏗᕜ᥹䖥Ѣ᳝ৠḋഛؐ੠ᮍᏂⱘℷᗕߚᏗ˄㾕㸼 5-4˅DŽ໮᭄㒳䅵ᄺᆊᓎ䆂
া೼ np(1-p)ı5 ᯊՓ⫼ℷᗕߚᏗᴹ䖥ԐѠ乍ߚᏗDŽ

5.3.2 ӂ亯࠼ᐹ

Ў䕗དഄ⧚㾷Ѡ乍ߚᏗˈ㗗㰥ҹϟⱘ䯂乬DŽ᳝ϔ⺼ᤳᑊᔃ᳆њⱘ⹀Ꮥˈ㽕Ԅ䅵೼ᡯ⹀Ꮥ
ᯊߎ⦄ℷ䴶ⱘὖ⥛DŽҸℸ᳾ⶹὖ⥛Ў pDŽᡩᦋ䆹⹀Ꮥ n ⃵ᑊ䅵ㅫߎ⦄ℷ䴶ⱘ⃵᭄ rDŽᇍѢ p
ⱘϔড়⧚ⱘԄ䅵Ў r/nDŽ⊼ᛣˈབᵰ䞡ᮄ䖯㸠ϔ⃵䆹ᅲ偠ˈ⫳៤ϔϾᮄⱘ n ⃵ᡯ⹀Ꮥⱘ䲚ড়ˈ
݊ߎ⦄ℷ䴶⃵᭄ r ᇚϢ㄀ϔ⃵ᅲ偠᳝⿡䆌ϡৠˈҢ㗠ᕫࠄᇍ p ⱘ঺ϔϾԄ䅵DŽѠ乍ߚᏗᦣ䗄
ⱘᰃᇍӏϔৃ㛑ⱘ r ؐ˄Ң 0 ࠄ n˅ˈ䖭Ͼℷ䴶ὖ⥛Ў p ⱘ⹀Ꮥᡯᦋ n ⃵ᙄདߎ⦄ r ⃵ℷ䴶ⱘ
ὖ⥛DŽ

᳝䍷ⱘᰃˈҢᡯᦋ⹀Ꮥⱘ䱣ᴎḋᴀЁԄ䅵pˈϢ೼ᅲ՟ⱘ䱣ᴎḋᴀϞ⌟䆩hҹԄ䅵errorD(h)
ᰃⳌৠⱘ䯂乬DŽϔ⃵⹀ᏕᡯᦋᇍᑨѢҢDЁᢑপϔϾᅲ՟ᑊ⌟䆩ᅗᰃ৺㹿h䇃ߚ㉏DŽϔ⃵䱣
ᴎᡯᦋߎ⦄ℷ䴶ⱘὖ⥛pᇍᑨѢ䱣ᴎᢑপⱘᅲ՟㹿䇃ߚ㉏ⱘὖ⥛˄ेpᇍᑨerrorD(h)˅ DŽn⃵ᡯ
ᦋⱘḋᴀ㾖ᆳࠄr⃵ℷ䴶ˈᇍᑨnϾᢑপⱘᅲ՟㹿䇃ߚ㉏ⱘ᭄ⳂDŽ಴ℸr/nᇍᑨerrorS(h)DŽԄ䅵
pⱘ䯂乬ㄝᬜѢԄ䅵errorD(h)DŽѠ乍ߚᏗ㒭ߎњϔϾϔ㠀ᔶᓣⱘὖ⥛ߚᏗˈ᮴䆎⫼Ѣ㸼⼎n⃵
⹀Ꮥߎ⦄ℷ䴶ⱘ⃵᭄䖬ᰃ೼nϾḋ՟Ё‫؛‬䆒ߎ䫭ⱘ⃵᭄DŽѠ乍ߚᏗⱘ䆺㒚ᔶᓣձ䌪Ѣḋᴀ໻
ᇣnҹঞὖ⥛p៪errorD(h)DŽ

ϔ㠀ᴹ䇈ᑨ⫼Ѡ乍ߚᏗⱘᴵӊࣙᣀ˖

1.᳝ϔ෎‫ޚ‬ᅲ偠˄བᡩᦋ⹀Ꮥ˅ˈ݊䕧ߎৃ㹿ᦣ䗄Ўϔ䱣ᴎব䞣 YDŽ䱣ᴎব䞣 Y ᳝ϸ⾡


পؐ˄བ Y˙1 Ўℷ䴶ˈY˙0 ড䴶˅DŽ

2.೼ᅲ偠ⱘӏϔ⃵ᇱ䆩Ё Y=1 ⱘὖ⥛Ўᐌ᭄ pDŽᅗϢ݊Ҫⱘᅲ偠ᇱ䆩᮴݇DŽ಴ℸ Y=0 ⱘ


ὖ⥛Ў 1-pDŽϔ㠀 p Ў乘‫ܜ‬᳾ⶹⱘˈ䴶Јⱘ䯂乬ህ೼ѢԄ䅵ᅗDŽ

3.෎‫ޚ‬ᅲ偠ⱘn⃵⣀ゟᇱ䆩ᣝᑣ߫ᠻ㸠ˈ⫳៤ϔϾ⣀ゟৠߚᏗⱘ䱣ᴎব䞣ᑣ߫Y1ˈY2ˈĂĂ
YnDŽҸRҷ㸼n⃵䆩偠Ёߎ⦄Yi˙1 ⱘ⃵᭄˖

n
R { ¦ Yi
i 1

4.䱣ᴎব䞣 R প⡍ᅮؐ r ⱘὖ⥛˄བ㾖ᆳࠄ r ⃵ℷ䴶ⱘὖ⥛˅⬅Ѡ乍ߚᏗ㒭ߎ˖

n!
Pr( R r) p r (1  p) n  r ˄5.2˅
r!(n  r )!

ℸὖ⥛ߚᏗⱘϔϾ೒㸼೼㸼 5-3 Ё㒭ߎDŽ

Ѡ乍ߚᏗࠏ⬏њ n ⃵⹀Ꮥᡩᦋߎ⦄ r ⃵ℷ䴶ⱘὖ⥛ˈгࠏ⬏њࣙ৿ n Ͼ䱣ᴎḋ՟ⱘ᭄᥂


ḋᴀߎ⦄ r ⃵䇃ߚ㉏䫭䇃ⱘὖ⥛DŽ

5.3.3 ൽ‫ૂٲ‬ᯯᐤ

䱣ᴎব䞣ⱘϸϾ᳔ᐌ⫼ࠄⱘሲᗻЎ݊ᳳᳯؐ˄г⿄Ўഛؐ˅੠ᮍᏂDŽᳳᳯؐᰃ䞡໡䞛ḋ
䱣ᴎব䞣ᕫࠄⱘؐⱘᑇഛDŽ᳈㊒⹂ⱘᅮНབϟ˖

定义: 㗗㰥䱣ᴎব䞣Yৃ㛑ⱘপؐЎy1…ynˈYⱘᳳ
ᳳᳯؐ(expected value)E(Y)Ў˖

n
E[Y ] { ¦ y i Pr(Y yi ) ˄5.3˅
i 1

՟བˈབᵰ Y পؐ 1 ⱘὖ⥛Ў 0.7ˈপؐ 2 ⱘὖ⥛ 0.3ˈ䙷МᳳᳯؐЎ˄1g0.7ˇ2g0.3


˙1.3˅DŽབᵰ䱣ᴎব䞣 Y ᳡ҢѠ乍ߚᏗˈ䙷Мৃᕫ˖

E[Y ] np ˄5.4˅

݊Ё n ੠ p Ўᓣ 5.2 ЁᅮНⱘѠ乍ߚᏗⱘখ᭄DŽ

঺ϔ䞡㽕ሲᗻᮍ
ᮍᏂᦣ䗄ⱘᰃὖ⥛ߚᏗⱘᆑᑺ៪ᬷᑺˈेᅗᦣ䗄њ䱣ᴎব䞣Ϣ݊ഛؐП䯈
ⱘᏂ᳝໮໻DŽ
定义: 䱣ᴎব䞣 Y ⱘᮍ
ᮍᏂ˄variance˅Var[Y]Ў˖

Var[Y ] { E[(Y  E[Y ]) 2 ] ˄5.5˅

ᮍᏂᦣ䗄ⱘᰃҢYⱘϔϾ㾖ᆳএԄ䅵݊ഛؐE(Y)ⱘ䇃ᏂᑇᮍⱘᳳᳯDŽᮍᏂⱘᑇᮍḍ㹿⿄
ЎYⱘᷛ‫ޚ‬Ꮒˈ䆄Ў³YDŽ

ᷛ‫ޚ‬Ꮒ˄standard deviation˅³YЎ˖
定义: 䱣ᴎব䞣Yⱘᷛ

V Y { E[(Y  E[Y ]) 2 ] ˄5.6˅

㢹䱣ᴎব䞣 Y ᳡ҢѠ乍ߚᏗˈ߭ᮍᏂ੠ᷛ‫ޚ‬Ꮒߚ߿Ў˖

Var[Y ] { np (1  p )

V Y { np(1  p) ˄5.7˅

5.3.4 զ䇗䠅θ‫څ‬ᐤૂᯯᐤ

៥ӀᏆᕫߎ䱣ᴎব䞣errorS(h)᳡ҢѠ乍ߚᏗˈ⦄೼ಲࠄࠡ䴶ⱘ䯂乬˖errorS(h)੠ⳳᅲ䫭
䇃⥛errorD(h)П䯈ৃ㛑ⱘᏂᓖᰃ໮ᇥ˛

⫼ᓣ 5.2 ЁѠ乍ߚᏗⱘᅮНᴹᦣ䗄errorS(h)੠errorD(h)ˈৃᕫ˖

r
errorS (h)
n

errorD (h) p

݊Ё n Ўḋᴀ S Ёᅲ՟᭄ˈr ᰃ S Ё㹿 h 䇃ߚ㉏ⱘᅲ՟᭄ˈp ЎҢ D Ёᢑপϔᅲ՟㹿䇃


ߚ㉏ⱘὖ⥛DŽ

㒳䅵ᄺЁᇚerrorS(h)⿄Ўⳳᅲ䫭䇃⥛errorD(h)ⱘϔϾԄ䅵䞣 (estimator)DŽϔ㠀ഄˈԄ䅵
䞣ᰃ⫼ᴹԄ䅵ᶤ෎‫ޚ‬ᘏԧⱘᶤϔখ᭄ⱘ䱣ᴎব䞣DŽᇍѢԄ䅵䞣ˈᰒ✊᳔݇ᖗⱘᰃᅗᑇഛᴹ䇈
ᰃ৺㛑ѻ⫳ℷ⹂Ԅ䅵DŽϟ䴶ᅮНԄ䅵‫أ‬Ꮒ(estimation bias)ЎԄ䅵䞣ⱘᳳᳯؐৠⳳᅲখ᭄ؐП
䯈ⱘᏂᓖDŽ

定义: 䩜ᇍӏᛣখ᭄ p ⱘԄ䅵䞣 Y ⱘԄ


Ԅ䅵‫أ‬ᏂЎ˖

E[Y]-p

བᵰԄ䅵‫أ‬ᏂЎ 0ˈ៥Ӏ⿄ Y Ў p ⱘ᮴‫أ‬Ԅ䅵䞣˄unbiased estimator˅DŽ⊼ᛣˈ೼ℸᚙ‫މ‬


ϟ⬅໮⃵䞡໡ᅲ偠⫳៤ⱘ Y ⱘ໮Ͼ䱣ᴎؐⱘᑇഛ˄े E[Y]˅ᇚᬊᬯѢ pDŽ

errorS(h)ᰃ৺ЎerrorD(h)ⱘϔϾ᮴‫أ‬Ԅ䅵䞣˛⹂ᅲབℸˈ಴ЎᇍѢѠ乍ߚᏗˈrⱘᳳᳯؐ
Ўnp˄ㄝᓣ[5.4]˅DŽ⬅ℸˈᑊϨ಴ЎnЎϔᐌ᭄ˈ䙷Мr/nⱘᳳᳯؐЎpDŽ
ᇍԄ䅵‫أ‬Ꮒ䖬䳔㽕԰ϸ⚍䇈ᯢDŽ佪‫ˈܜ‬೼ᴀゴᓔྟ៥Ӏᦤࠄˈ೼䆁㒗ḋ՟Ϟ⌟䆩‫؛‬䆒ᕫ
ࠄⱘᇍ‫؛‬䆒䫭䇃⥛ⱘԄ䅵‫أ‬ѢФ㾖࣪ˈ᠔ᣛⱘℷᰃԄ䅵‫أ‬ᏂDŽ㽕ՓerrorS(h)ᇍerrorD(h)᮴‫أ‬
Ԅ䅵ˈ‫؛‬䆒h੠ḋᴀSᖙ乏⣀ゟ䗝পDŽ㄀ѠˈԄ䅵‫أ‬Ꮒ(estimation bias)䖭ϔὖᗉϡ㛑Ϣ㄀Ѡゴ
ҟ㒡ⱘᄺд఼ⱘᔦ㒇‫أ‬㕂(inductive bias)Ⳍ⏋⎚DŽԄ䅵‫أ‬ᏂЎϔ᭄ᄫ䞣ˈ㗠ᔦ㒇‫أ‬㕂Ўᮁ㿔
䲚ড়DŽ

Ԅ䅵䞣ⱘ঺ϔ䞡㽕ሲᗻЎ݊ᮍᏂDŽ㒭ᅮ໮Ͼ᮴‫أ‬Ԅ䅵䞣ˈⳈ㾖Ϟᑨ䗝প݊ЁᮍᏂ᳔ᇣⱘDŽ
⬅ᮍᏂⱘᅮНˈ᠔䗝ᢽⱘᑨЎখ᭄ؐ੠Ԅ䅵ؐП䯈ᳳᳯᑇᮍ䇃Ꮒ᳔ᇣⱘDŽ

‫؛‬བ೼⌟䆩ϔ‫؛‬䆒ᯊˈᅗᇍn˙40 Ͼ䱣ᴎḋ՟ⱘḋᴀѻ⫳r˙12 Ͼ䫭䇃ˈ䙷МᇍerrorD(h)


ⱘ᮴‫أ‬Ԅ䅵ЎerrorS(h)˙r/n˙0.3DŽԄ䅵Ёѻ⫳ⱘᮍᏂᅠܼᴹ⑤ѢrЁⱘᮍᏂˈ಴ЎnЎϔᐌ᭄DŽ
⬅ѢrᰃѠ乍ߚᏗˈᅗⱘᮍᏂ⬅ᓣ˄5.7˅Ўnp(1-p)DŽ✊㗠p᳾ⶹˈ៥Ӏৃҹ⫼Ԅ䅵䞣r/nᴹҷ
᳓pDŽ⬅ℸᕫߎrⱘⱘԄ䅵ᮍᏂЎ 40g0.3(1-0.3)˙8.4ˈ៪Ⳍᑨⱘᷛ‫ޚ‬Ꮒ 8.4 Ĭ2.9DŽ䖭㸼⼎
errorS(h)˙r/nЁⱘᷛ‫ޚ‬Ꮒ㑺Ў 2.9/40˙0.07DŽὖ㗠㿔Пˈ㾖ᆳࠄⱘerrorS(h)Ў 0.3ˈᷛ‫ޚ‬Ꮒ㑺
Ў 0.07DŽ˄㾕д乬 5.1˅DŽ

ϔ㠀ᴹ䇈ˈ㢹೼nϾ䱣ᴎ䗝পⱘḋᴀЁ᳝rϾ䫭䇃ˈerrorS (h)ⱘᷛ‫ޚ‬ᏂЎ˖

Vr p(1  p)
V error ( h ) ˄5.8˅
S
n n

ᅗ㑺ㄝѢ⫼r/n˙errorS (h)ᴹҷ᳓p˖

errorS (h)(1  errorS (h))


V error ( h ) | ˄5.9˅
S
n

5.3.5 㖤‫ؗ‬॰䰪

䗮ᐌᦣ䗄ᶤԄ䅵ⱘϡ⹂ᅮᗻⱘᮍ⊩ᰃՓ⫼ϔ㕂ֵऎ䯈ˈⳳᅲⱘؐҹϔᅮⱘὖ⥛㨑ܹ䆹ऎ
䯈ЁDŽ䖭ḋⱘԄ䅵⿄Ў㕂
㕂ֵऎ䯈˄confidence interval˅Ԅ䅵DŽ

㕂ֵऎ䯈ᰃϔϾҹ Nˁⱘὖ⥛ࣙ৿ p ⱘऎ䯈DŽ


定义: ᶤϾখ᭄ p ⱘ Nˁ㕂

՟བˈབᵰ೼n˙40 Ͼ⣀ゟᢑপⱘḋ՟ⱘḋᴀЁ᳝r˙12 Ͼ䫭䇃ˈৃҹ⿄ऎ䯈 0.3f0.14


᳝ 95ˁⱘৃ㛑ᗻࣙ৿ⳳᅲ䫭䇃⥛errorD(h)DŽ

བԩ㦋ᕫerrorD(h)ⱘ㕂ֵऎ䯈˛ㄨḜ೼ѢԄ䅵䞣errorS(h)᳡ҢѠ乍ߚᏗDŽ䖭ϔߚᏗⱘഛ
ؐЎerrorD(h)ˈᷛ‫ޚ‬Ꮒৃ⬅ᓣ 5.9 䅵ㅫDŽ಴ℸˈЎ䅵ㅫ 95ˁ㕂ֵऎ䯈ˈা䳔㽕ᡒࠄϔϾҹഛ
ؐerrorD(h)ЎЁᖗⱘऎ䯈ˈᅗⱘᆑᑺ䎇ҹࣙ৿䆹ߚᏗϟܼ䚼ὖ⥛ⱘ 95ˁDŽㄝӋഄˈᅗᣛᅮњ
errorD(h)᳝ 95ˁⱘᴎӮ㨑ܹerrorS(h)਼ೈⱘᶤऎ䯈ⱘ໻ᇣDŽ

ᇍѢ㒭ᅮⱘ N ؐˈབԩ䅵ㅫऎ䯈໻ᇣҹՓ݊ࣙ৿ Nˁⱘὖ⥛䋼䞣˛ᇍѢѠ乍ߚᏗᴹ䇈


䖭ϔ䅵ㅫकߚ⚺⧤DŽ✊㗠໮᭄ᚙ‫މ‬ϟৃҹ䖯㸠ϔ䖥ԐˈՓ䅵ㅫ䖛⿟᳈ᆍᯧDŽ䖭෎Ѣབϟџᅲ˖
ेᇍѢ䎇໳໻ⱘḋᴀˈѠ乍ߚᏗৃҹᕜདഄ⬅ℷᗕߚᏗᴹ䖥ԐDŽℷᗕߚᏗ˄೼㸼 5-4 Ёὖ䗄˅
ᰃ㒳䅵ᄺЁⷨおᕫ᳔䗣ᕏⱘὖ⥛ߚᏗПϔDŽབ㸼 5-4 ᠔⼎ˈℷᗕߚᏗᰃϔ䩳ᔶߚᏗˈ⬅݊ഛ
ؐ­੠ᷛ‫ޚ‬Ꮒ³ᅠܼᅮНDŽᇍѢ໻ⱘ nˈѠ乍ߚᏗ䴲ᐌ䖥ԐѢϔϾৠḋഛؐ੠ᮍᏂⱘℷᗕߚ
ᏗDŽ

П᠔ҹՓ⫼ℷᗕߚᏗᴹҷ᳓ˈϔϾॳ಴ᰃ໮᭄㒳䅵খ㗗䛑߫㸼㒭ߎњℷᗕߚᏗϟࣙ৿N
ˁⱘὖ⥛䋼䞣ⱘഛ਼ؐೈⱘऎ䯈ⱘ໻ᇣDŽ䖭ህᰃ䅵ㅫNˁ㕂ֵऎ䯈᠔䳔ⱘֵᙃDŽᅲ䰙Ϟ㸼 5-1
ℷᰃ䖭ḋϔϾ㸼DŽ㸼 5-1 Ё㒭ᅮⱘᐌ᭄zNᅮНⱘᰃ೼䩳ᔶℷᗕߚᏗϟˈࣙ৿Nˁὖ⥛䋼䞣ⱘ
ഛ਼ؐೈⱘ᳔ᇣऎ䯈ⱘᆑᑺDŽ᳈㊒⹂ഄ䇈ˈzNҹᷛ‫ޚ‬Ꮒ㒭ᅮњऎ䯈ⱘञᆑᑺ˄े೼ӏϔᮍ৥
䎱ഛؐⱘ䎱⾏˅ˈ೒ 5-1(a)㒭ߎњ䩜ᇍz80ⱘϔϾऎ䯈DŽ

㸼 5-4 ℷᗕ៪催ᮃߚᏗ

插图——原书页码:139

Normal distribution with mean 0, standard deviation 1˖ഛؐЎ 0ˈᷛ‫ޚ‬ᏂЎ 1 ⱘℷᗕߚᏗ

  ϔϾℷᗕߚᏗ˄г㹿⿄Ў催ᮃߚᏗ˅ᰃϔ䩳ൟߚᏗˈᅗᅮНЎϟ䴶ⱘὖ⥛ᆚᑺߑ᭄˖
2
1 § xP ·
1  ¨ ¸
2© V ¹
p ( x) e
2SV 2
ϔϾℷᗕߚᏗ⬅Ϟ䴶݀ᓣЁⱘϸϾখ᭄ᅠܼ⹂ᅮ˖­੠³DŽ
བᵰ䱣ᴎব䞣 X 䙉ᕾℷᗕߚᏗˈ߭˖
 X 㨑ܹࠄ(a, b)ⱘὖ⥛Ў˖
b

³ p( x)dx
a

 X ⱘᳳᳯؐ៪ഛؐ E[X]Ў˖
E[X]= ­
 X ⱘᮍᏂ Var(X)Ў
Var(X)=³2
 Xⱘᷛ‫ޚ‬ᏂЎ³XЎ˖
³X=³
  Ёᖗᵕ䰤ᅮ⧚˄5.4.1 㡖˅䇈ᯢ໻䞣⣀ゟৠߚᏗⱘ䱣ᴎব䞣ⱘ੠䙉ᕾⱘߚᏗ䖥ԐЎℷᗕߚᏗDŽ

插图——原书页码:140

೒ 5-1 ϔϾഛؐЎ 0ˈᷛ‫ޚ‬ᏂЎ 1 ⱘℷᗕߚᏗDŽ


(a)೼ 80%㕂ֵᑺϟˈ䱣ᴎব䞣ؐԡѢঠջऎ䯈[-1.28, 1.28]П䯈DŽ⊼ᛣz80˙1.28DŽ᳝ 10%㕂ֵᑺ݊㨑
ܹऎ䯈Ꮊջˈ10%㨑ܹऎ䯈েջDŽ(b)೼ 90%㕂ֵᑺϟˈ䱣ᴎব䞣ԡѢऩջऎ䯈[-Ğ, 1.28]ϞDŽ

ὖ㗠㿔Пˈབᵰ䱣ᴎব䞣 Y ᳡ҢℷᗕߚᏗˈഛؐЎ­ˈᷛ‫ޚ‬ᏂЎ³ˈ䙷М Y ⱘӏϔ㾖


ᆳؐ y ᳝ N%ⱘᴎӮ㨑ܹϟ䴶ⱘऎ䯈˖

­fzN³ ˄5.10˅

ⳌԐഄˈഛؐ­᳝ N%ⱘᴎӮ㨑ܹϟ䴶ⱘऎ䯈˖

yfzN³ ˄5.11˅

ᕜᆍᯧᇚℸ㒧䆎੠ࠡ䴶ⱘ㒧䆎㒧ড়䍋ᴹ᥼ᇐᓣ 5.1 ⱘ⾏ᬷؐ‫؛‬䆒ⱘNˁ㕂ֵऎ䯈ⱘϔ㠀


㸼䖒ᓣDŽ佪‫⬅ˈܜ‬ѢerrorS(h)䙉ҢѠ乍ߚᏗˈ݊ഛؐЎerrorD(h)ˈᷛ‫ޚ‬Ꮒབᓣ 5.9 ᠔⼎DŽ݊⃵ˈ
៥Ӏⶹ䘧ᇍѢ䎇໳໻ⱘḋᴀ໻ᇣnˈѠ乍ߚᏗ䴲ᐌ䖥ԐѢℷᗕߚᏗDŽ㄀ϝˈᓣ 5.11 ਞ䆝៥Ӏ
བԩЎԄ䅵ℷᗕߚᏗⱘഛؐ∖ߎNˁ㕂ֵऎ䯈DŽ಴ℸˈᇚerrorS(h)ⱘഛؐ੠ᷛ‫ޚ‬Ꮒҷܹࠄᓣ
5.11 Ёᇚᕫࠄᓣ 5.1 Ёᇍ⾏ᬷؐ‫؛‬䆒ⱘNˁ㕂ֵऎ䯈Ў˖

errorS (h)(1  errorS (h))


errorS (h) r z N
n

ಲᖚϔϟˈ೼㸼䖒ᓣⱘ᥼ᇐЁ᳝ϸϾ䖥Ԑ࣪˖

1.Ԅ䅵errorS(h)ⱘᷛ‫ޚ‬Ꮒ³ᯊˈ៥ӀᇚerrorD(h)䖥ԐЎerrorS(h)˄ेҢᓣ 5.8 ࠄᓣ 5.9 ⱘ᥼


ᇐ˅DŽ

2.Ѡ乍ߚᏗ⬅ℷᗕߚᏗ䖥ԐDŽ

㒳䅵ᄺЁⱘϔ㠀㾘߭㸼ᯢˈ䖭ϸϾ䖥Ԑ೼ nı30 ៪ np(1-p)ı5 ᯊᎹ԰ᕫᕜདDŽᇍѢ䕗ᇣ


ⱘ n ؐˈ᳔དՓ⫼߫㸼ⱘᔶᓣ㒭ߎѠ乍ߚᏗⱘ‫݋‬ԧؐDŽ

5.3.6 ਂ‫ૂם‬ঋ‫ם‬䗯⮂

Ϟ䗄ⱘ㕂ֵऎ䯈ᰃঠջⱘˈेᅗ㾘ᅮњԄ䅵䞣ⱘϞ⬠੠ϟ⬠DŽ೼ᶤѯᚙ‫މ‬ϟˈৃ㛑㽕⫼
ࠄऩջ䖍⬠DŽ՟བˈᦤߎ䯂乬ĀerrorD(h)㟇໮ЎUⱘὖ⥛āDŽ೼া㽕䰤ᅮhⱘ᳔໻䫭䇃⥛ˈ㗠
ϡ೼Тⳳᅲ䫭䇃⥛ᰃ৺ᇣѢԄ䅵䫭䇃⥛ᯊˈᕜ㞾✊Ӯᦤߎ䖭⾡䯂乬DŽ

া㽕ᇍϞ䗄ⱘ䖛⿟԰ϔᇣⱘׂᬍህৃ䅵ㅫऩջ䫭䇃⥛䖍⬠DŽᅗ᠔෎ѢⱘџᅲЎℷᗕߚᏗ
݇Ѣ݊ഛؐᇍ⿄DŽ಴ℸˈӏᛣℷᗕߚᏗϞⱘঠջ㕂ֵऎ䯈㛑໳䕀ᤶЎⳌᑨⱘऩջऎ䯈ˈ㕂ֵ
ᑺЎॳᴹⱘϸ‫ס‬DŽ˄㾕೒ 5-1(b)˅DŽᤶ㿔Пˈ⬅ϔϾ᳝ϟ⬠ L ੠Ϟ⬠ U ⱘ 100(1-¢)%㕂ֵऎ
䯈ˈৃᕫࠄϔϾϟ⬠Ў L ᮴Ϟ⬠ⱘ 100(1-¢/2)%㕂ֵऎ䯈ˈৠᯊгৃᕫߎϔϾ᳝Ϟ⬠ U ᮴
ϟ⬠ⱘ 100(1-¢/2)%㕂ֵऎ䯈DŽ䖭䞠¢ᇍᑨѢⳳᅲؐ㨑೼ᣛᅮऎ䯈໪ⱘὖ⥛DŽᤶহ䆱䇈ˈ¢
ᰃⳳᅲؐ㨑ܹ೒ 5-1(a)Ё᮴䰈ᕅ䚼ߚⱘὖ⥛ˈ¢/2 ᰃ㨑ܹ೒ 5-1˄b˅ⱘ᮴䰈ᕅ䚼ߚⱘὖ⥛DŽ

Ў䇈ᯢ䖭ϔ⚍ˈ‫⃵ݡ‬㗗㰥hѻ⫳r=12 Ͼ䫭䇃Ϩḋᴀ໻ᇣn=40 ⱘ䖭Ͼ՟ᄤDŽབϞ᠔䗄ˈᅗ


ᇐ㟈ϔϾঠջⱘ 95ˁ㕂ֵऎ䯈 0.3f0.14DŽ݊Ё 100(1-¢)=95ˁˈ᠔ҹ¢˙0.05DŽ಴ℸˈᑨ
⫼ҹϞ㾘߭ˈৃᕫ᳝ 100(1-¢/2)˙97.5ˁⱘ㕂ֵᑺerrorD(h)᳔໮Ў 0.30ˇ0.14˙0.44ˈ㗠ϡㅵ
errorD(h)ⱘϟ⬠DŽ಴ℸ೼errorD(h)Ϟⱘऩջ䫭䇃⥛䖍⬠↨Ⳍᑨⱘঠջ䖍⬠᳝ঠ‫ⱘס‬㕂ֵᑺ˄㾕
д乬 5.3˅DŽ

5.4 ᧞ሲ㖤‫ؗ‬॰䰪Ⲻж㡢ᯯ⌋

ࠡϔ㡖ҟ㒡ⱘᰃ䩜ᇍϔ⡍ᅮᚙ‫᥼މ‬ᇐ㕂ֵऎ䯈Ԅ䅵˖෎Ѣ⣀ゟᢑপⱘnḋᴀˈԄ䅵⾏ᬷ
ؐ‫؛‬䆒ⱘerrorD(h)DŽᴀ㡖ҟ㒡ⱘᮍ⊩ᰃ೼䆌໮Ԅ䅵䯂乬Ё⫼ࠄⱘ䗮⫼ⱘᮍ⊩DŽ⹂ߛഄ䆆ˈ៥
Ӏৃҹᇚℸⳟ԰ᰃ෎Ѣ໻ᇣЎnⱘ䱣ᴎᢑপḋᴀⱘഛؐˈᴹԄ䅵ᘏԧഛؐⱘ䯂乬DŽ

䗮⫼ⱘ䖛⿟ࣙ৿ҹϟℹ偸˖

1.⹂ᅮ෎‫ޚ‬ᘏԧЁ㽕Ԅ䅵ⱘখ᭄pˈ՟བerrorD(h)DŽ

2.ᅮНϔϾԄ䅵䞣Y˄བerrorS(h)˅ᅗⱘ䗝ᢽᑨЎ᳔ᇣᮍᏂⱘ᮴‫أ‬Ԅ䅵䞣DŽ

3.⹂ᅮԄ䅵䞣᠔᳡Ңⱘὖ⥛ߚᏗDYˈࣙᣀ݊ഛؐ੠ᮍᏂDŽ

4.⹂ᅮNˁ㕂ֵऎ䯈ˈ䗮䖛ᇏᡒ䯜ؐL੠UҹՓ䖭ϾᣝDYߚᏗⱘ䱣ᴎব䞣᳝NˁᴎӮ㨑ܹL
੠UП䯈DŽ

ৢ䴶ⱘ޴㡖ᇚᑨ⫼䆹䗮⫼ⱘᮍ⊩ࠄ݊Ҫ޴⾡ᴎ఼ᄺдЁᐌ㾕ⱘԄ䅵䯂乬DŽ佪‫ܜ‬៥Ӏ䳔㽕
䅼䆎Ԅ䅵⧚䆎ⱘϔϾ෎ᴀ៤ᵰˈ⿄ЎЁᖗᵕ䰤ᅮ⧚(Central Limit Theorem)DŽ

5.4.1 ѣᗹᶷ䲆ᇐ⨼

Ёᖗᵕ䰤ᅮ⧚ᰃㅔ࣪㕂ֵऎ䯈ⱘ᥼ᇐⱘϔϾ෎ᴀḍ᥂DŽ㗗㰥བϟⱘϔ㠀Ḛᶊ˖೼nϾ⣀
ゟᢑপⱘϨ᳡Ңৠḋὖ⥛ߚᏗⱘ䱣ᴎব䞣Y1ĂYnЁ㾖ᆳᅲ偠ؐ˄བৠϔ⹀Ꮥⱘn⃵ᡯᦋ˅DŽҸ
­ҷ㸼↣ϔব䞣Yi᳡Ңⱘ᳾ⶹߚᏗⱘഛؐˈᑊҸ³ҷ㸼ᷛ‫ޚ‬ᏂDŽ⿄䖭ѯব䞣YiЎ⣀ ⣀ゟৠߚᏗ
(independent, identically distributed)䱣ᴎব䞣ˈ಴ЎᅗӀᦣ䗄ⱘᰃ৘㞾⣀ゟᑊϨ᳡Ңৠḋὖ⥛
1 n
ߚᏗⱘᅲ偠DŽЎԄ䅵Yi᳡ҢⱘߚᏗⱘഛؐ­ˈ៥Ӏ䅵ㅫḋᴀⱘؐ Yn { ¦ Yi ˄བn⃵ᡩᦋ
n i1
DŽЁᖗᵕ䰤ᅮ⧚䇈ᯢ೼nėĞᯊ Yn ᠔᳡Ңⱘὖ⥛ߚᏗЎϔℷᗕߚᏗˈ
⹀ᏕЁߎ⦄ℷ䴶ⱘ↨՟˅
V
㗠ϡ䆎Yiᴀ䑿᳡ҢҔМḋⱘߚᏗDŽ᳈䖯ϔℹˈYn ᳡ҢⱘߚᏗഛؐЎ­㗠Ϩᷛ‫ޚ‬ᏂЎ ˈ㊒
n
⹂ⱘᅮНབϟ˖

ᅮ⧚ 5.1˖Ёᖗᵕ䰤ᅮ⧚DŽ㗗㰥⣀ゟৠߚᏗⱘ䱣ᴎব䞣Y1…Ynⱘ䲚ড়ˈᅗӀ᳡Ңϔӏᛣⱘὖ⥛ߚ
1 n
ᏗˈഛؐЎ­ˈ᳝䰤ᮍᏂ³2DŽᅮНḋᴀഛؐ Yn { ¦ Yi
n i1
DŽ߭ᔧnėĞᯊϟ䴶ⱘᓣᄤ

Yn  P
V
n

᳡ҢϔℷᗕߚᏗˈഛؐЎ 0 Ϩᷛ‫ޚ‬ᏂЎ 1DŽ
䖭ϔ㒧䆎䴲ᐌҸҎৗ᚞ˈ಴Ўᅗ䇈ᯢ೼ϡⶹ䘧⣀ゟⱘYi᠔᳡Ңⱘ෎‫ߚޚ‬Ꮧⱘᚙ‫މ‬ϟˈ៥
Ӏৃҹᕫⶹḋᴀഛؐ Y ⱘߚᏗᔶᓣDŽ᳈䖯ϔℹˈЁᖗᵕ䰤ᅮ⧚䇈ᯢњᗢḋՓ⫼ Y ⱘഛؐ੠
ᮍᏂᴹ⹂ᅮऩ⣀ⱘYiⱘഛؐ੠ᮍᏂDŽ

Ёᖗᵕ䰤ᅮ⧚ᰃϔϾ䴲ᐌ᳝⫼ⱘ㒧䆎ˈ಴Ўᅗ㸼⼎ӏᛣḋᴀഛؐⱘԄ䅵䞣˄བerrorS(h)
Ўഛؐ䫭䇃⥛˅᳡ҢⱘߚᏗ೼n䎇໳໻ᯊৃ䖥ԐЎℷᗕߚᏗDŽབᵰ䖬ⶹ䘧䖭ϔ䖥Ԑⱘℷᗕߚ
ᏗⱘᮍᏂˈህৃ⫼ᓣ 5.11 ᴹ䅵ㅫ㕂ֵऎ䯈DŽϔϾ䗮ᐌⱘ㾘߭ᰃ೼nı30 ᯊৃՓ⫼䖭ϔ䖥ԐDŽ
ࠡ䴶ⱘゴ㡖៥ӀℷᰃՓ⫼њℷᗕߚᏗᴹ䖥Ԑഄᦣ䗄errorS(h)᳡ҢⱘѠ乍ߚᏗDŽ

5.5 њ‫ٽ‬䇴䭏䈥⦽䰪Ⲻᐤᔸ

⦄㗗㰥ᇍᶤ⾏ᬷⳂᷛߑ᭄᳝ϸϾ‫؛‬䆒h1੠h2DŽ‫؛‬䆒h1೼ϔᢹ᳝n1Ͼ⣀ゟᢑপḋ՟ⱘḋᴀ
S1Ϟ⌟䆩ˈϨh2೼n2Ͼৠḋᢑপⱘḋ՟ⱘḋᴀS2Ϟ⌟䆩DŽ‫؛‬ᅮ㽕Ԅ䅵䖭ϸϾ‫؛‬䆒ⱘⳳᅲ䫭䇃
⥛䯈ⱘᏂᓖ˖

d { errorD (h1 )  errorD (h2 )

ৃՓ⫼㡖 5.4 Ёᦣ䗄ⱘಯℹ偸ᴹ᥼ᇐ d ⱘ㕂ֵऎ䯈Ԅ䅵DŽ೼⹂ᅮ d ЎᕙԄ䅵ⱘখ᭄ৢˈ


ϟ䴶㽕ᅮНϔԄ䅵䞣DŽᕜᰒ✊ˈ䖭䞠ৃ䗝ᢽḋᴀ䫭䇃⥛П䯈ⱘᏂᓖ԰ЎԄ䅵䞣ˈᷛ䆄Ў d̂ ˖

dˆ { errorS1 (h1 )  errorS 2 (h2 )

೼ℸϡࡴ䆕ᯢഄՓ⫼ d̂ ेЎ d ⱘ᮴‫أ‬Ԅ䅵䞣ˈे E[dˆ ] dDŽ

䱣ᴎব䞣 dˆ ᳡Ңⱘὖ⥛ߚᏗᰃҔМ˛Ңࠡ䴶ⱘゴ㡖Ёˈ៥Ӏⶹ䘧ᇍѢ䕗໻ⱘn1੠n2˄↨
བ䛑ı30˅ˈerrorS1(h1)੠errorS2(h2)䛑䖥Ԑ䙉ҢℷᗕߚᏗDŽ⬅ѢϸℷᗕߚᏗⱘᏂҡЎϔℷᗕߚ
Ꮧˈ಴ℸ dˆ г䖥Ԑ䙉ҢℷᗕߚᏗˈഛؐЎdDŽৠᯊˈৃᕫ䆹ߚᏗⱘᮍᏂЎerrorS1(h1)੠errorS2(h2)
ⱘᮍᏂⱘ੠DŽՓ⫼ᓣ 5.9 㦋ᕫ䖭ϸϾߚᏗⱘ䖥ԐᮍᏂˈ᳝˖

errorS1 (h1 )(1  errorS1 (h1 )) errorS 2 (h2 )(1  errorS 2 (h2 ))
V d2ˆ |  ˄5.12˅
n1 n2

⦄೼Ꮖ⹂ᅮњԄ䅵䞣 d̂ ᠔᳡Ңⱘὖ⥛ߚᏗˈᕜᆍᯧᇐߎ㕂ֵऎ䯈ҹ䇈ᯢՓ⫼ d̂ ᴹԄ䅵d


ⱘৃ㛑䇃ᏂDŽ䱣ᴎব䞣 dˆ ᳡ҢഛؐdᮍᏂ³2ⱘℷᗕߚᏗˈ݊Nˁ㕂ֵऎ䯈Ԅ䅵Ў dˆ r z N V DŽ
Փ⫼Ϟ䴶㒭ߎⱘᮍᏂ V d̂ ⱘ䖥Ԑؐˈdⱘ䖥ԐⱘNˁ㕂ֵऎ䯈Ԅ䅵Ў˖
2

errorS1 (h1 )(1  errorS1 (h1 )) errorS 2 (h2 )(1  errorS 2 (h2 ))
dˆ r z N  (5.13)
n1 n2

݊ЁzNᰃ㸼 5-1 Ёᦣ䗄ⱘᐌ᭄DŽϞᓣ㒭ߎњϔ㠀ⱘঠջ㕂ֵऎ䯈ˈҹԄ䅵ϸϾ‫؛‬䆒䫭䇃


⥛П䯈ⱘᏂᓖDŽ᳝ᯊৃ㛑䳔㽕ᶤϔ㕂ֵᑺϟⱘऩջⱘ䖍⬠üü㽕М⬠ᅮ᳔໻ৃ㛑Ꮒᓖˈ㽕М
Ў᳔ᇣⱘDŽऩջ㕂ֵऎ䯈ৃҹ⫼ 5.3.6 㡖Ёᦣ䗄ⱘᮍ⊩ᴹׂᬍϞᓣ㗠ᕫࠄDŽ
㱑✊Ϟ䴶ⱘߚᵤ㗗㰥ࠄњh1੠h2೼ⳌѦ⣀ゟⱘ᭄᥂ḋᴀϞ⌟䆩ˈ᳈䗮ᐌⱘᚙ‫މ‬ᰃ೼ϔϾ
ḋᴀS˄Sҡ✊⣀ゟѢh1੠h2˅DŽ䖭ḋˈ d̂ 㹿䞡ᮄᅮНЎ˖

dˆ { errorS (h1 )  errorS (h2 )

ᔧՓ⫼Sᴹҷ᳓S1੠S2ᯊˈᮄⱘ d̂ ЁⱘᮍᏂ䗮ᐌᇣѢ 5.12 ᓣ㒭ߎⱘᮍᏂDŽ䖭ᰃ಴ЎˈՓ


⫼ऩϾⱘḋᴀS⍜䰸њ⬅S1੠S2ⱘ㒘ড়ᏺᴹⱘ䱣ᴎᏂᓖDŽ䖭ḋˈ⬅ᓣ 5.13 㒭ߎⱘ㕂ֵऎ䯈ϔ
㠀䇈ᴹӮ䖛ѢֱᅜˈԚҡ✊ᰃℷ⹂ⱘDŽ

5.5.1 ‫ٽ‬䇴Ỷ僂

᳝ᯊ៥Ӏᛳ݈䍷ⱘᰃᶤ⡍ᅮⱘ⣰ᛇℷ⹂ⱘὖ⥛ˈ㗠ϡᰃᇍᶤখ᭄ⱘऎ䯈Ԅ䅵DŽ↨བϟ䴶
ⱘ䯂乬ĀerrorD(h1)>errorD(h2)ⱘৃ㛑ᗻ᳝໮໻˛āDŽҡՓ⫼ࠡϔ㡖ⱘᴵӊ䆒ᅮˈ‫؛‬ᅮ㽕⌟䞣h1
੠h2ⱘḋᴀ䫭䇃⥛ˈՓ⫼໻ᇣЎ 100 ⱘ⣀ゟḋᴀS1੠S2ˈᑊϨⶹ䘧errorS1(h1)˙0.30 ϨerrorS2(h2)
˙0.20ˈ಴ℸᏂᓖ d̂ Ў 0.10DŽᔧ✊ˈ⬅Ѣ᭄᥂ḋᴀⱘ䱣ᴎᗻˈेՓerrorD(h1)İ errorD(h2)ˈ
ҡ᳝ৃ㛑ᕫࠄ䖭ḋⱘᏂᓖDŽ೼䖭䞠ˈ㒭ᅮḋᴀ䫭䇃⥛ d̂ ˙0.10ˈerrorD(h1)>errorD (h2)ⱘὖ⥛
ᰃ໮ᇥ˛ㄝӋഄˈབԩ䅵ㅫ೼ d̂ ˙0.10 ᯊd>0 ⱘὖ⥛˛

⊼ᛣὖ⥛ Pr(d˚0)ㄝѢ dˆ 䖛催Ԅ䅵 d ϡ໮Ѣ 0.1 ⱘὖ⥛DŽгेˈ䖭Ͼὖ⥛Ў d̂ 㨑ܹऩջ


ऎ䯈 d̂ <d+0.10 ⱘὖ⥛DŽ⬅Ѣ d ᰃ d̂ ᠔᳡ҢߚᏗⱘഛؐˈϞᓣㄝӋѢ dˆ  P dˆ  0.10 DŽ

ὖᣀഄ䇈ˈὖ⥛ Pr(d˚0)ㄝѢ d̂ 㨑ܹऩջऎ䯈 dˆ  P dˆ  0.10 ⱘὖ⥛DŽ⬅Ѣࠡϔ㡖៥Ӏ

Ꮖ䅵ㅫߎ d̂ ⱘ໻㟈ߚᏗˈህৃҹ䗮䖛 d̂ ߚᏗ೼䆹ऎ䯈ⱘὖ⥛䋼䞣ᴹ⹂ᅮ d̂ 㨑ܹ䖭Ͼऩջऎ


䯈ⱘὖ⥛DŽ

佪‫ܜ‬ᇚऎ䯈 dˆ  P dˆ  0.10 㸼⼎Ў‫ܕ‬䆌Ңഛؐ‫ⱘ⾏أ‬ᷛ‫ޚ‬Ꮒ᭄DŽՓ⫼ᓣ 5.12 ৃᕫ


V dˆ | 0.061 ˈ᠔ҹ䖭ϔऎ䯈ৃ䖥Ԑ㸼⼎Ў

dˆ  P dˆ  1.64V dˆ

ϢℸℷᗕߚᏗⱘऩջऎ䯈Ⳍ݇㘨ⱘ㕂ֵᑺᰃ໮ᇥ˛ᶹ㸼 5-1ˈৃᕫഛ਼ؐೈⱘ 1.64 ᷛ‫ޚ‬


Ꮒᇍᑨ㕂ֵᑺ 90ˁⱘঠջऎ䯈DŽ಴ℸ䖭Ͼऩջऎ䯈‫݋‬᳝㕂ֵᑺ 95ˁDŽ

಴ℸˈ㒭ᅮ㾖ᆳࠄⱘ d̂ ˙0.1ˈerrorD(h1)>errorD(h2)ⱘὖ⥛㑺Ў 0.95DŽḍ᥂㒳䅵ᄺⱘᴃ䇁ˈ


ৃ㸼䗄Ў˖᥹ফ˄accept˅ĀerrorD(h1)>errorD(h2)ā䖭ϔ‫؛‬䆒ˈ㕂ֵᑺЎ 0.95DŽᤶϔ⾡䇈⊩ˈ
ৃ㸼䗄Ў៥Ӏᢦ㒱˄reject˅ᇍゟ‫؛‬䆒˄ᐌ⿄Ў䳊‫؛‬䆒˅ˈҹ(1-0.95)=0.05 ⱘᬜᑺ˄significance
level˅DŽ

5.6 ᆜҖ㇍⌋∊䖹

᳝ᯊ៥Ӏ᳈ᛳ݈䍷Ѣ↨䕗ϸϾᄺдㅫ⊩LA੠LBⱘᗻ㛑ˈ㗠ϡᰃϸϾ⡍ᅮ‫؛‬䆒DŽᗢḋ䖥Ԑ
ഄẔ偠໮Ͼᄺдㅫ⊩ˈབԩ⹂ᅮϸϾㅫ⊩П䯈ⱘᏂᓖ೼㒳䅵Ϟᰃ᳝ᛣНⱘ˛㱑✊ˈ೼ᴎ఼ᄺ
дⷨお乚ඳˈᇍѢ↨䕗ⱘᮍ⊩ҡ೼ѝ䆎Ёˈϡ䖛䖭䞠ҟ㒡њϔϾড়⧚ⱘ䗨ᕘDŽ݇Ѣϡৠᮍ⊩
ⱘ䅼䆎㾕Dietterich˄1996˅
DŽ

ᓔྟ‫ܜ‬ᣛᅮ㽕Ԅ䅵ⱘখ᭄DŽ‫؛‬ᅮ᳝LA੠LBϸϾㅫ⊩ˈ㽕⹂ᅮЎњᄺдϔ⡍ᅮⳂᷛߑ᭄f
ᑇഛᴹ䇈䙷Ͼㅫ⊩᳈ӬDŽᅮНĀᑇഛāⱘϔ⾡ড়⧚ᮍ⊩ᰃˈҢϔ෎‫ޚ‬ᅲ՟ߚᏗDЁᢑপ᠔᳝
ࣙ৿nϾḋ՟ⱘ䆁㒗䲚ড়ˈ೼᠔᳝䖭ḋⱘ䲚ড়Ё⌟䞣ϸϾㅫ⊩ⱘᑇഛᗻ㛑DŽᤶহ䆱䇈ˈ䳔㽕
Ԅ䅵‫؛‬䆒䫭䇃⥛П䯈Ꮒᓖⱘᳳᳯؐ˖

E [errorD ( L A ( S ))  errorD ( L B ( S ))] (5.14)


S D

݊ЁL(S)ҷ㸼㒭ᅮ䆁㒗ḋᴀSᯊᄺдㅫ⊩L䕧ߎⱘ‫؛‬䆒ˈϟᷛSD㸼⼎ᳳᳯؐᰃ೼෎‫ߚޚ‬
ᏗDЁᢑপⱘḋᴀSϞ䅵ㅫDŽϞ䗄㸼䖒ᓣᦣ䗄ⱘᰃᄺдㅫ⊩LA੠LBⱘᏂⱘᳳᳯؐDŽ

೼ᅲ䰙ⱘᄺдㅫ⊩↨䕗Ёˈ៥Ӏা᳝ϔϾ᳝䰤ⱘḋᴀD0DŽ೼䖭⾡ᚙ‫މ‬ϟˈᕜᰒ✊ˈ㽕
Ԅ䅵Ϟ䗄ⱘ䞣䳔㽕ᇚD0ߚࡆ៤䆁㒗䲚ড়S0੠ϡⳌѸⱘ⌟䆩䲚ড়T0DŽ䆁㒗᭄᥂ৃҹ⫼ᴹ᮶䆁㒗
LAজ䆁㒗LBˈ㗠⌟䆩᭄᥂߭⫼ᴹ↨䕗ϸϾᄺдࠄⱘ‫؛‬䆒ⱘ‫⹂ޚ‬ᑺˈгህᰃˈՓ⫼ϟᓣᴹ䅵ㅫ˖

errorT0 ( L A ( S 0 ))  errorT0 ( LB ( S 0 )) ˄5.15˅

ϞᓣϢ 5.14 ᓣⱘ䅵ㅫ᳝ϸϾ݇䬂ⱘϡৠDŽ佪‫ܜ‬៥ӀՓ⫼errorT0(h)ᴹ䖥Ԑ errorD(h)DŽ㄀


Ѡˈ䫭䇃⥛ⱘᏂᓖ⌟䞣ᰃ೼ϔϾ䆁㒗䲚ড়S0Ϟ㗠ϡᰃ೼ҢߚᏗDЁᢑপⱘ᠔᳝ⱘḋᴀSϞ䅵ㅫ
ᳳᳯؐDŽ

ᬍ䖯 5.15 ᓣⱘϔ⾡ᮍ⊩ᰃᇚ᭄᥂D0໮⃵ߚࡆЎϡⳌѸⱘ䆁㒗੠⌟䆩䲚ড়ˈ✊ৢ೼݊Ё
䅵ㅫ䫭䇃⥛ⱘᑇഛؐDŽ䖭ϔ䖛⿟೼㸼 5-5 Ё߫ߎˈᅗ೼ϔৃ⫼᭄᥂ⱘ೎ᅮḋᴀD0ϞԄ䅵ϸϾ
ᄺдㅫ⊩䫭䇃⥛П䯈ⱘᏂᓖDŽ䆹䖛⿟佪‫ܜ‬ᇚ᭄᥂ᢚߚЎkϾϡⳌѸⱘⳌㄝᄤ䲚ˈᄤ䲚໻ᇣ㟇
ᇥЎ 30DŽ✊ৢ䆁㒗੠⌟䆩ㅫ⊩k⃵ˈ↣⃵Փ⫼݊ЁϔϾᄤ䲚԰Ў⌟䆩᭄᥂䲚ˈ݊Ҫk-1 Ͼᄤ
䲚Ў䆁㒗䲚DŽՓ⫼䖭⾡ࡲ⊩ˈᄺдㅫ⊩೼kϾ⣀ゟ⌟䆩䲚Ϟ⌟䆩ˈ㗠䫭䇃⥛ⱘᏂᓖⱘഛؐ G
԰ЎϸϾᄺдㅫ⊩䯈ᏂᓖⱘԄ䅵DŽ

㸼 5-5 Ԅ䅵ϸᄺдㅫ⊩LA੠LB䫭䇃⥛Ꮒᓖⱘϔ⾡ᮍ⊩

䖥Ԑⱘ㕂ֵऎ䯈ᇚ೼ℷ᭛Ё㒭ߎDŽ

1.ᇚৃ⫼᭄᥂D0ߚࡆ៤kϾⳌৠ໻ᇣⱘϡⳌѸᄤ䲚T1, T2, …, TkDŽ݊໻ᇣ㟇ᇥЎ 30DŽ


2.Ҹ i Ң 1 ࠄ k ᕾ⦃ˈ‫خ‬ϟ䴶ⱘ᪡԰˖
Փ⫼Ti԰Ў⌟䆩䲚ড়ˈ㗠࠽ԭⱘ᭄᥂԰Ў䆁㒗䲚ড়Si

 S i m {D0  Ti }
 hA m LA (S i )
 hB m LB ( S i )
 G i m errorT (hA )  errorT (hB )
i i

3.䖨ಲؐ G ˈ݊Ё

1 k
G { ¦G i
k i1
㸼 5-5 䖨ಲⱘ G ৃ㹿⫼԰ᇍᓣ 5.14 ᠔䳔㒧ᵰⱘϔϾԄ䅵DŽ᳈ড়䗖ⱘ䇈⊩ᰃᡞ G ⳟ԰ϟ
ᓣⱘԄ䅵˖

E [errorD ( L A ( S ))  errorD ( L B ( S ))] ˄5.16˅


S  D0

k 1
݊ЁSҷ㸼ϔϾ໻ᇣЎ D0 ˈҢD0Ёϔ㟈ᢑপⱘ䱣ᴎḋᴀDŽ೼䆹ᓣ੠ 5.14 Ёॳᴹ
k
ⱘ㸼䖒ᓣП䯈ˈᚳϔⱘᏂ߿೼Ѣ݊ᳳᳯؐⱘ䅵ㅫᰃ೼ৃ⫼᭄᥂ⱘᄤ䲚D0Ϟ䅵ㅫˈ㗠ϡᰃ೼
ҢᭈϾߚᏗDϞᢑপⱘᄤ䲚Ϟ䅵ㅫDŽ

Ԅ䅵 5.16 ᓣⱘ䖥Ԑⱘ Nˁ㕂ֵऎ䯈ৃՓ⫼ G 㸼⼎Ў˖

G r t N ,k 1 ˜ sG ˄5.17˅

݊ЁtN, k-1ᰃϔᐌ᭄ˈ݊ᛣН㉏ԐѢࠡ䴶㕂ֵऎ䯈㸼䖒ᓣЁⱘzNˈ㗠 G s ҷ㸼ᇍ G ᠔᳡Ң


ⱘὖ⥛ߚᏗⱘᷛ‫ޚ‬ᏂⱘԄ䅵ˈ⹂ߛⱘ䆆ˈ sG ᅮНЎ˖

k
1
sG { ¦
k (k  1) i 1
(G i  G ) 2 ˄5.18˅

⊼ᛣ 5.17 Ёⱘᐌ䞣tN, k-1᳝ϸϾϟᷛDŽ㄀ϔϾҷ㸼᠔䳔ⱘ㕂ֵᑺˈབࠡ䴶ⱘᐌ᭄zNЁ䙷ḋDŽ


㄀ѠϾখ᭄⿄Ў㞾⬅ᑺ˄degree of freedom˅ˈᐌ㹿䆄԰vˈᅗϢ⫳៤䱣ᴎব䞣 G ⱘؐᯊ⣀ゟ
ⱘ䱣ᴎџӊ᭄ⳂⳌ݇DŽ೼ᔧࠡⱘᴵӊϟˈ㞾⬅ᑺ᭄ؐЎk-1DŽখ᭄tⱘ޴⾡পؐ೼㸼 5-6 Ё߫
ߎDŽ⊼ᛣᔧkėĞᯊˈtN, k-1ⱘؐ䍟Ѣᐌ᭄zNDŽ

⊼ᛣ䖭䞠ᦣ䗄ⱘ↨䕗ᄺдㅫ⊩ⱘ䖛⿟㽕೼ৠḋⱘ⌟䆩䲚ড়Ϟ⌟䆩ϸϾ‫؛‬䆒DŽ䖭Ϣ 5.5 㡖
Ёᦣ䗄ⱘ↨䕗ϸϾ⫼⣀ゟ⌟䆩䲚ড়䆘Ԅ䖛ⱘ‫؛‬䆒ϡৠDŽՓ⫼Ⳍৠḋᴀᴹ⌟䆩‫؛‬䆒㹿⿄Ў䜡ᇍ
⌟䆩(paired test)DŽ䜡ᇍ⌟䆩䗮ᐌӮѻ⫳᳈㋻ᆚⱘ㕂ֵऎ䯈DŽ಴Ў೼䜡ᇍ⌟䆩ЁӏᛣⱘᏂᓖ䛑
ᴹ⑤Ѣ‫؛‬䆒П䯈ⱘᏂᓖDŽⳌডˈ㢹‫؛‬䆒೼ߚᓔⱘ᭄᥂ḋᴀϞⱘ⌟䆩ˈϸϾḋᴀ䫭䇃⥛П䯈ⱘ
Ꮒᓖгৃ㛑䚼ߚᴹ⑤ѢϸϾḋᴀ㒘៤ϞⱘϡৠDŽ

㸼 5-6 ঠջ㕂ֵऎ䯈tN,vⱘؐDŽᔧvėĞᯊˈtN,v䍟䖥ѢzNDŽ

㕂ֵᑺ N
90% 95% 98% 99%
v=2 2.92 4.30 6.96 9.92
v=5 2.02 2.57 3.36 4.03
v=10 1.81 2.23 2.76 3.17
v=20 1.72 2.09 2.53 2.84
v=30 1.70 2.04 2.46 2.75
v=120 1.66 1.98 2.36 2.62
v=Ğ 1.64 1.96 2.33 2.58

5.6.1 䞃ሯ t ⎁䈋

Ϟ䴶ᦣ䗄њ೼㒭ᅮ೎ᅮ᭄᥂䲚ᯊ↨䕗ϸϾᄺдㅫ⊩ⱘ䖛⿟DŽᴀ㡖䅼䆎䖭ϔ䖛⿟ҹঞ 5.17
੠ 5.18 ᓣЁ㕂ֵऎ䯈ⱘ㒳䅵ᄺ䆎䆕DŽབᵰ㄀ϔ⃵䯙䇏ˈৃҹ䏇䖛ᅗ㗠ϡ༅䖲㓁ᗻDŽ

Ўњ⧚㾷 5.17 ᓣЁⱘ㕂ֵऎ䯈ˈ㗗㰥ҹϟⱘԄ䅵䯂乬˖


z 㒭ᅮϔ㋏߫⣀ゟৠߚᏗⱘ䱣ᴎব䞣Y1,Y2…Ykⱘ㾖ᆳؐDŽ
z 㽕Ԅ䅵䖭ѯYi᠔᳡Ңⱘὖ⥛ߚᏗⱘഛؐ­DŽ
z Փ⫼ⱘԄ䅵䞣Ўḋᴀഛؐ Y
1 k
Y { ¦ Yi
k i1
䖭ϔ෎Ѣḋᴀഛؐ Y Ԅ䅵ߚᏗഛؐ­ⱘ䯂乬䴲ᐌᐌ㾕DŽ՟བˈᅗ㽚Ⲫњᮽ‫⫼ܜ‬errorS(h)
ᴹԄ䅵errorD(h)ⱘ䯂乬DŽ˄݊ЁˈYiЎ 0 ៪ 1 㸼⼎hᰃ৺ᇍϔऩ⣀ⱘSḋ՟ѻ⫳䇃ߚ㉏ˈ㗠errorD(h)
Ў෎‫ߚޚ‬Ꮧⱘഛؐ­DŽ˅⬅ᓣᄤ 5.17 ੠ 5.18 ᦣ䗄ⱘt⌟䆩ᑨ⫼Ѣ䆹䯂乬ⱘϔ⡍⅞ᚙᔶüüे
↣Ͼऩ⣀ⱘYi䙉ᕾℷᗕߚᏗDŽ

⦄㗗㰥↨䕗ᄺдㅫ⊩ⱘ㸼 5-5 䖛⿟ⱘϔϾ⧚ᛇ࣪ᴵӊDŽ‫؛‬ᅮϡᰃᢹ᳝೎ᅮḋᴀ᭄᥂D0ˈ


㗠ᰃҢ෎‫ޚ‬ᅲ՟ߚᏗЁᢑপᮄⱘ䆁㒗ḋ՟DŽ೼䖭䞠៥Ӏׂᬍ㸼 5-5 Ёⱘ䖛⿟ˈՓ↣ϔ⃵ᕾ⦃
⫳៤ϔϾᮄⱘ䱣ᴎ䆁㒗䲚Si੠ᮄⱘ䱣ᴎ⌟䆩䲚Tiˈ⫳៤ᮍ⊩ᰃҢ෎‫ߚޚ‬ᏗЁᢑপ㗠ϡᰃҢ೎
ᅮḋᴀD0ЁᢑপDŽ䖭ϔ⧚ᛇ࣪ᮍ⊩㛑ᕜདഄऍ䜡Ϟ䴶ⱘԄ䅵䯂乬DŽ⡍߿ഄˈ䆹䖛⿟᠔⌟䞣
ⱘ¥i⦄ᇍᑨࠄ⣀ゟৠߚℹⱘ䱣ᴎব䞣YiDŽ݊ߚᏗⱘഛؐ­ᇍᑨϸᄺдㅫ⊩䫭䇃⥛ⱘᳳᳯᏂᓖ
DŽḋᴀഛؐ Y Ў䖭ϔ⧚ᛇ࣪ᮍ⊩䅵ㅫߎⱘ G DŽ⦄Ꮰᳯಲㄨ˖Ā G ᰃ৺㛑䕗དഄ
˄ेᓣ 5.14˅
Ԅ䅵­āDŽ

佪‫⊼ˈܜ‬ᛣࠄ⌟䆩䲚Tiⱘ໻ᇣ㟇ᇥࣙ৿ 30 Ͼḋ՟DŽ಴ℸˈऩ⣀ⱘ¥iᇚ䖥Ԑ䙉ᕾℷᗕߚ
Ꮧ˄⬅Ёᖗᵕ䰤ᅮ⧚˅DŽ಴ℸˈ៥Ӏ᳝ϔ⡍⅞ᴵӊेYi᳡Ң䖥ԐⱘℷᗕߚᏗDŽৃҹᕫࠄˈϔ
㠀ഄˈᔧ↣ϾYi䙉ᕾℷᗕߚᏗᯊˈḋᴀഛؐ Y г䙉ᕾℷᗕߚᏗDŽ⬅ℸˈৃҹ㗗㰥Փ⫼ࠡ䴶䅵
ㅫ㕂ֵऎ䯈ⱘ㸼䖒ᓣ˄ㄝᓣ 5.11˅ˈ݊ЁⱘԄ䅵䞣ℷᰃ䙉ᕾњℷᗕߚᏗDŽ✊㗠ˈ䆹ㄝᓣ㽕∖
ⶹ䘧ߚᏗⱘᷛ‫ޚ‬ᏂˈԚ䖭䞠᳾ⶹDŽ

t ⌟䆩ℷད⫼Ѣ䖭ḋⱘᚙᔶˈेԄ䅵ϔ㋏߫⣀ゟৠℷᗕߚᏗⱘ䱣ᴎব䞣ⱘḋᴀഛؐDŽ೼
䖭䞠ˈৃՓ⫼ᓣ 5.17 ੠ 5.18 Ёⱘ㕂ֵऎ䯈ˈᅗৃ㹿䞡ᮄ㸼䗄Ў˖

P Y r t N ,k 1 ˜ sY

݊Ё sY ЎԄ䅵ⱘḋᴀഛؐⱘᷛ‫ޚ‬Ꮒ˖

k
1
sY { ¦ (Yi  Y )2
k (k  1) i 1

㗠tN, k-1㉏ԐѢࠡ䴶ⱘzNⱘᐌ䞣DŽᅲ䰙Ϟˈᐌ䞣tN, k-1ᦣ䗄ⱘᰃ⿄ЎtߚᏗⱘὖ⥛ߚᏗϟⱘऎ


ඳˈℷབᐌ᭄zNᦣ䗄њℷᗕߚᏗϟⱘऎඳDŽtߚᏗᰃϔ㉏ԐѢℷᗕߚᏗⱘ䩳ᔶߚᏗˈԚ᳈ᆑ
Ϩ᳈ⷁˈҹড᯴⬅ѢՓ⫼ sY ᴹ䖥Ԑⳳᅲᷛ‫ޚ‬Ꮒ V Y ᯊᏺᴹⱘ᳈໻ⱘᮍᏂDŽᔧk䍟䖥Ѣ᮴かᯊˈ
tߚᏗ䍟䖥ѢℷᗕߚᏗ˄಴ℸtN, k-1䍟䖥ѢzN˅DŽ䖭೼Ⳉ㾝Ϟᰃℷ⹂ⱘˈ಴Ў៥ӀᏠᳯḋᴀ໻ᇣk
๲ࡴᯊ sY ᬊᬯࠄⳳᅲⱘᷛ‫ޚ‬Ꮒ V Y ˈϨ಴Ўᔧᷛ‫ޚ‬Ꮒ⹂ߛᏆⶹᯊৃՓ⫼zNDŽ
5.6.2 ᇔ䱻Ⲻ㘹㲇

Ϟ䴶ⱘ䅼䆎䆕ᯢњ೼Փ⫼ḋᴀഛؐ Y ᴹԄ䅵ϔϾࣙ৿kϾ⣀ゟৠℷᗕߚᏗⱘ䱣ᴎব䞣
ⱘḋᴀഛؐᯊˈՓ⫼ᓣ 5.17 ᴹԄ䅵㕂ֵऎ䯈DŽ䖭ऍ䜡њ៥Ӏⱘ⧚ᛇⱘᴵӊˈे‫؛‬ᅮᇍѢⳂ
ᷛߑ᭄ⱘḋ՟ৃ䖯㸠᮴䰤ᄬপDŽ೼ᅲ䰙Ёˈ㢹᭄᥂䲚D0᳝䰤ˈϨㅫ⊩Փ⫼㸼 5-5 ᦣ䗄ⱘᅲ䰙
ᮍ⊩ˈ䖭ϔ䆕ᯢᑊϡϹḐ䗖⫼DŽᅲ䰙ⱘ䯂乬ᰃˈЎѻ⫳¥iা᳝䞡ᮄ䞛ḋD0ˈҹ঺໪ⱘᮍ⊩
ᡞᅗߚࡆЎ⌟䆩䲚੠䆁㒗䲚DŽ¥iℸᯊⳌѦᑊϡ⣀ゟˈ಴ЎᅗӀ෎ѢҢ᳝䰤ᄤ䲚D0Ёᢑপⱘ
ⳌѦ䞡঴ⱘ䆁㒗ḋ՟ˈ㗠ϡᰃҢᭈϾߚᏗDЁᢑপDŽ

ᔧা᳝ϔϾ᳝䰤ⱘ᭄᥂ḋᴀD0ৃ⫼ᯊˈ᳝޴⾡ᮍ⊩⫼ᴹ䞡䞛ḋD0DŽ㸼 5-5 ᦣ䗄ⱘᰃk-fold


ᮍ⊩ˈ݊ЁD0㹿ߚЎkϾϡⳌѸⱘㄝ໻ᇣⱘᄤ䲚ˈ೼䖭⾡k-foldᮍ⊩ЁˈD0Ё↣ϔḋ՟䛑᳝ϔ
⃵⫼Ѣ⌟䆩ˈ㗠k-1 ⃵⫼Ѣ䆁㒗DŽ঺ϔ⾡ᐌ⫼ⱘᮍ⊩ᰃҢD0Ё䱣ᴎᢑপ㟇ᇥ 30 Ͼḋ՟ⱘ䲚
ড়ˈ‫࠽⫼ݡ‬ԭⱘḋ՟ᴹ䆁㒗ˈ䞡໡䖭ϔ䖛⿟Ⳉࠄ䎇໳ⱘ⃵᭄DŽ䖭⾡䱣ᴎᮍ⊩ⱘད໘ᰃ㛑໳䞡
໡᮴䰤⃵ˈҹ‫ޣ‬ᇣ㕂ֵऎ䯈ࠄ䳔㽕ⱘᆑᑺDŽⳌডˈk-foldᮍ⊩ফ䰤Ѣḋ՟ⱘᘏ᭄ˈ䖭ᰃ಴Ў
↣Ͼḋ՟া᳝ϔ⃵⫼Ѣ⌟䆩ˈϨᏠᳯḋᴀ໻ᇣ㟇ᇥЎ 30DŽ✊㗠ˈ䱣ᴎᮍ⊩ⱘ㔎⚍ᰃˈ⌟䆩
䲚ড়ϡ‫ݡ‬㛑ⳟ԰ᰃҢ෎‫ߚޚ‬ᏗD⣀ゟᢑপDŽⳌডˈk-foldѸঝ偠䆕⫳៤ⱘ⌟䆩䲚ড়ᰃ⣀ゟⱘˈ
಴Ўϔᅲ՟া೼⌟䆩䲚ড়Ёߎ⦄ϔ⃵DŽ

ὖᣀഄ䇈ˈ෎Ѣ᳝䰤᭄᥂ⱘᄺдㅫ⊩ⱘ↨䕗Ё≵᳝ϔϾऩ⣀ⱘᮍ⊩㛑⒵䎇៥ӀᏠᳯⱘ᠔
᳝㑺ᴳDŽ᳝ᖙ㽕䆄ԣ㒳䅵ᄺ῵ൟ೼᭄᥂᳝䰤ᯊᕜᇥ㛑ᅠ㕢ഄऍ䜡ᄺдㅫ⊩偠䆕ⱘ᠔᳝㑺ᴳDŽ
✊㗠ᅗӀ⹂ᅲᦤկњ䖥Ԑⱘ㕂ֵऎ䯈ˈ᳝ࡽѢ㾷䞞ᄺдㅫ⊩ⱘᅲ偠ᗻ↨䕗DŽ

5.7 ቅ㔉ૂ㺛‫ݻ‬䈱⢟

ᴀゴⱘ㽕⚍ࣙᣀ˖
z 㒳䅵⧚䆎ᦤկњϔϾ෎⸔ˈҢ㗠෎Ѣ೼᭄᥂ḋᴀSϞⱘ㾖ᆳ䫭䇃⥛errorS(h)ˈԄ
䅵‫؛‬䆒hⱘⳳᅲ䫭䇃⥛errorD(h)DŽ՟བˈབᵰhЎϔ⾏ᬷؐ‫؛‬䆒ˈ㗠Ϩ᭄᥂ḋᴀࣙ
ᣀnı30 Ͼϡձ䌪hϨⳌѦ⣀ゟⱘḋ՟ᯊˈ䙷МerrorD(h)ⱘNˁ㕂ֵऎ䯈䖥ԐЎ˖
errorS (h)(1  errorS (h))
errorS (h) r z N
n
݊ЁzNⱘؐ⬅㸼 5-1 㒭ߎDŽ
z ϔ㠀ഄˈԄ䅵㕂ֵऎ䯈ⱘ䯂乬ৃ䗮䖛⹂ᅮϔᕙԄ䅵ⱘখ᭄˄བerrorD (h)˅ҹঞⳌ
ᇍᑨⱘԄ䅵䞣˄errorS (h)˅ᴹᅠ៤DŽ⬅ѢԄ䅵䞣ᰃϔ䱣ᴎব䞣˄བerrorS(h)ձ䌪
Ѣ䱣ᴎḋᴀS˅ˈᅗৃ⬅݊᳡Ңⱘὖ⥛ߚᏗᴹᦣ䗄DŽ㕂ֵऎ䯈ⱘ䅵ㅫৃ䗮䖛⹂ᅮ
䆹ߚᏗϟࣙ৿᠔䳔ὖ⥛䋼䞣ⱘऎ䯈ᴹᦣ䗄DŽ
z Ԅ䅵‫؛‬䆒㊒ᑺⱘϔ⾡䇃Ꮒৃ㛑ЎԄ䅵‫أ‬Ꮒ˄estimation bias˅DŽབᵰYЎᇍᶤখ᭄
pⱘԄ䅵䞣ˈYⱘԄ䅵‫أ‬ᏂЎYⱘᳳᳯؐ੠pП䯈ⱘᏂDŽ՟བˈབᵰSᰃ⫼ᴹᔶ៤‫؛‬
䆒hⱘ䆁㒗᭄᥂ˈ߭errorS(h)㒭ߎњⳳᅲ䫭䇃⥛errorD(h)ⱘϔϾ‫أ‬ѢФ㾖࣪ⱘԄ
䅵DŽ
z Ԅ䅵ѻ⫳䇃Ꮒⱘ㄀Ѡ⾡ॳ಴ᰃԄ䅵ᮍᏂ˄variance˅DŽेՓᇍѢ᮴‫أ‬Ԅ䅵ˈԄ䅵
䞣ⱘ㾖ᆳؐг᳝ৃ㛑೼৘ᅲ偠ЁϡৠDŽԄ䅵䞣ߚᏗⱘᮍᏂ³2ᦣ䗄њ䆹Ԅ䅵Ϣⳳ
ᅲؐⱘϡৠ᳝໮໻DŽ䆹ᮍᏂ೼᭄᥂ḋᴀ๲໻ᯊ䰡ԢDŽ
z ↨䕗ϸᄺдㅫ⊩ᬜᵰⱘ䯂乬೼᭄᥂੠ᯊ䯈᮴䰤ᯊᰃϔϾⳌᇍᆍᯧⱘԄ䅵䯂乬ˈ
Ԛ೼䌘⑤᳝䰤ᯊ㽕ೄ䲒ᕫ໮DŽᴀゴᦣ䗄ⱘϔ⾡䗨ᕘᰃ೼ৃ⫼᭄᥂ⱘϡৠᄤ䲚Ϟ
䖤㸠ᄺдㅫ⊩ˈ೼࠽ԭ᭄᥂Ϟ⌟䆩ᄺࠄⱘ‫؛‬䆒ˈ✊ৢᇚ䖭ѯᅲ偠ⱘ㒧ᵰᑇഛDŽ
z 䖭䞠᠔㗗㰥ⱘ໮᭄ᚙ‫މ‬ϟˈ᥼ᇐ㕂ֵऎ䯈䳔㽕䖯㸠໮Ͼ‫؛‬ᅮ੠䖥ԐDŽ՟བϞ䴶
ⱘerrorD (h)ⱘ㕂ֵऎ䯈䳔㽕ᇚѠ乍ߚᏗ䖥ԐЎℷᗕߚᏗ˗䖥Ԑ䅵ㅫߚᏗⱘᮍᏂ˗
ҹঞ‫؛‬ᅮᅲ՟Ңϔ೎ᅮϡবⱘὖ⥛ߚᏗЁ⫳៤DŽ෎Ѣ䖭ѯ䖥Ԑᕫࠄⱘऎ䯈াᰃ
䖥Ԑ㕂ֵऎ䯈ˈԚᅗӀҡᦤկњ䆒䅵੠㾷䞞ᴎ఼ᄺдᅲ偠㒧ᵰⱘ᳝ᬜᣛᇐDŽ

ᴀゴҟ㒡ⱘ݇䬂㒳䅵ᄺᅮН೼㸼 5-2 Ё߫ߎDŽ

Փ⫼㒳䅵ⱘᮍ⊩ᴹԄ䅵੠⌟䆩‫؛‬䆒䖭ϔЏ乬᳝໻䞣ⱘ᭛⤂DŽᴀゴাҟ㒡њ෎ᴀὖᗉˈ㒚
㡖ⱘ䯂乬ৃ೼䆌໮к㈡੠᭛ゴЁᡒࠄDŽBillingsley et al.˄1986˅ᦤկњᇍ㒳䅵ᄺⱘϔϾᕜㅔ
ᯢⱘҟ㒡ˈ䆺ሑᦣ䗄њ䖭䞠᠔䅼䆎ⱘϔѯ䯂乬DŽ݊Ҫ᭛⤂ࣙᣀ DeGroot˄1986˅˗ Casella &
Berger˄1990˅DŽDuda & Hart˄1973˅೼᭄ؐ῵ᓣ䆚߿乚ඳᦤߎњ䖭ѯ䯂乬ⱘ㾷‫އ‬DŽ

ˈEtzioni & Etzioni˄1994˅


Segre et al.˄1991ˈ1996˅ ˈҹঞ Gordon & Segre˄1996˅䅼
䆎њ䆘Ԅᄺдㅫ⊩ⱘ㒳䅵ᛣН⌟䆩ˈㅫ⊩ⱘᗻ㛑ḍ᥂݊ᬍ䖯䅵ㅫᬜ⥛ⱘ㛑࡯ᴹ䆘⌟DŽ

Geman et al.˄1992˅䅼䆎њ೼ৠᯊ᳔ᇣ࣪‫أ‬Ꮒ੠᳔ᇣ࣪ᮍᏂП䯈԰ߎⱘᡬЁDŽ䖭ϔҢ
᳝䰤᭄᥂Ёᄺд੠↨䕗‫؛‬䆒ⱘЏ乬ҡ೼ѝ䆎ЁDŽ՟བˈDietterich˄1996˅䅼䆎њ೼ϡৠⱘ䆁
㒗-⌟䆩᭄᥂ߚࡆϟՓ⫼䜡ᇍᏂᓖ t ⌟䆩ᏺᴹⱘ亢䰽DŽ
д乬

5.1 ‫؛‬ᅮẔ偠ϔ‫؛‬䆒hˈᑊথ⦄೼ϔࣙ৿n=1000 Ͼ䱣ᴎᢑপḋ՟ⱘḋᴀSϞˈᅗߎ⦄r=300


Ͼ䫭䇃DŽerrorS(h)ⱘᷛ‫ޚ‬ᏂᰃҔМ˛ᇚℸ㒧ᵰϢ 5.3.4 㡖᳿ሒⱘ՟ᄤЁᷛ‫ޚ‬ᏂⳌ↨䕗Ӯᕫߎ
ҔМ㒧䆎˛

5.2 㗗㰥ᶤᏗᇨؐὖᗉЁᄺࠄⱘ‫؛‬䆒hDŽᔧh೼ 100 Ͼḋ՟ⱘ䲚ড়Ϟ⌟䆩ᯊˈ᳝ 83 Ͼߚ㉏


ℷ⹂DŽ䙷Мⳳᅲ䫭䇃⥛errorD(h)ⱘᷛ‫ޚ‬Ꮒ੠ 95ˁ㕂ֵऎ䯈ᰃ໮ᇥ˛

5.3 བᵰ‫؛‬䆒h೼n=65 ⱘ⣀ゟᢑপḋᴀϞߎ⦄r=10 Ͼ䫭䇃DŽⳳᅲ䫭䇃⥛ⱘ 90ˁ㕂ֵऎ䯈


˄ঠջⱘ˅ᰃ໮ᇥDŽ95ˁऩջ㕂ֵऎ䯈˄ेϔϾϞ⬠UˈՓᕫ᳝ 95ˁ㕂ֵᑺerrorD(h)İU˅
ᰃ໮ᇥ˛90ˁऩջऎ䯈ᰃ໮ᇥ˛

5.4 㽕⌟䆩ˉ‫؛‬䆒hˈ݊errorD(h)Ꮖⶹ೼ 0.2 ੠ 0.6 㣗ೈ‫ݙ‬DŽ㽕ֱ䆕 95ˁঠջ㕂ֵऎ䯈ⱘ


ᆑᑺᇣѢ 0.1ˈ᳔ᇥᑨ᧰䲚ⱘḋ՟᭄ᰃ໮ᇥDŽ

5.5 ᇍѢ೼ϡৠ᭄᥂ḋᴀϞ⌟䆩ⱘϸ‫؛‬䆒䫭䇃⥛ⱘᏂˈ㒭ߎ䅵ㅫऩջϞ⬠੠ऩջϟ⬠ⱘ
Nˁ㕂ֵऎ䯈ⱘ䗮⫼㸼䖒ᓣDŽ

5.6 㾷䞞ЎҔМᓣ 5.17 㒭ߎⱘ㕂ֵऎ䯈Ԅ䅵ৃ⫼ѢԄ䅵ᓣ 5.16ˈ㗠ϡ㛑Ԅ䅵ᓣ 5.14DŽ


ㅢ6ㄖ 䍓ਬᯥᆜҖ

䋱৊ᮃ᥼⧚ᦤկњ᥼⧚ⱘϔ⾡ὖ⥛᠟↉DŽᅗ෎Ѣབϟⱘ‫؛‬ᅮˈेᕙ㗗ᶹⱘ䞣䙉ᕾᶤὖ⥛
ߚᏗˈϨৃḍ᥂䖭ѯὖ⥛ঞᏆ㾖ᆳࠄⱘ᭄᥂䖯㸠᥼⧚ˈҹ԰ߎ᳔Ӭⱘ‫އ‬ㄪDŽ䋱৊ᮃ᥼⧚ᇍᴎ
఼ᄺдकߚ䞡㽕ˈ಴ЎᅗЎ㸵䞣໮Ͼ‫؛‬䆒ⱘ㕂ֵᑺᦤկњᅮ䞣ⱘᮍ⊩DŽ䋱৊ᮃ᥼⧚ЎⳈ᥹᪡
԰ὖ⥛ⱘᄺдㅫ⊩ᦤկњ෎⸔ˈ㗠ϨᅗгЎ݊Ҫㅫ⊩ⱘߚᵤᦤկњ⧚䆎ḚᶊDŽ

6.1 ԁ㔃

䋱৊ᮃᄺдৠ៥Ӏⱘᴎ఼ᄺдⷨおⳌ݇ˈ᳝ϸϾॳ಴DŽ佪‫ˈܜ‬䋱৊ᮃᄺдㅫ⊩㛑໳䅵ㅫ
ᰒᓣⱘ‫؛‬䆒ὖ⥛ˈབᴈ㋴䋱৊ᮃߚ㉏఼ˈᅗᰃ㾷‫Ⳍއ‬ᑨᄺд䯂乬ⱘ᳔᳝ᅲ䰙Ӌؐⱘᮍ⊩ПϔDŽ
՟བˈMichie et al.˄1994˅䆺㒚ⷨお↨䕗њᴈ㋴䋱৊ᮃߚ㉏఼˄naïve Bayesian classifier˅੠
݊Ҫᄺдㅫ⊩ˈࣙᣀ‫އ‬ㄪᷥ੠⼲㒣㔥㒰DŽҪӀথ⦄ᴈ㋴䋱৊ᮃߚ㉏఼೼໮᭄ᚙ‫މ‬ϟϢ݊Ҫᄺ
дㅫ⊩ᗻ㛑Ⳍᔧˈ೼ᶤѯᚙ‫މ‬ϟ䖬ӬѢ݊Ҫㅫ⊩DŽᴀゴᦣ䗄њᴈ㋴䋱৊ᮃߚ㉏఼ˈᑊᦤկњ
ϔϾ䆺㒚՟ᄤ˖ेᅗᑨ⫼Ѣ᭛ᴀ᭛ḷߚ㉏ⱘᄺд䯂乬˄བ⬉ᄤᮄ䯏ߚ㉏˅DŽᇍѢ䖭ḋⱘᄺд
ӏࡵˈᴈ㋴䋱৊ᮃߚ㉏ᰃ᳔᳝ᬜⱘㅫ⊩ПϔDŽ

䋱৊ᮃᮍ⊩ᇍѢᴎ఼ᄺдⷨおⱘ䞡㽕ᗻ䖬ԧ⦄೼ˈᅗЎ⧚㾷໮᭄ᄺдㅫ⊩ᦤկњϔ⾡᳝
ᬜⱘ᠟↉ˈ㗠䖭ѯㅫ⊩ϡϔᅮⳈ᥹᪡԰ὖ⥛᭄᥂DŽ՟བˈᴀゴߚᵤњ㄀ 2 ゴⱘ Find-S ੠‫׭‬
䗝⍜䰸ㅫ⊩ˈҹ߸ᮁ೼㒭ᅮ᭄᥂ᯊાϔϾㅫ⊩ᇚ䕧ߎ᳔᳝ৃ㛑ⱘ‫؛‬䆒DŽ៥Ӏ䖬Փ⫼䋱৊ᮃߚ
ᵤ䆕ᯢњ⼲㒣㔥㒰ᄺдЁⱘϔϾ݇䬂ᗻⱘ䗝ᢽ˖े೼᧰㋶⼲㒣㔥㒰ぎ䯈ᯊˈ䗝ᢽՓ䇃Ꮒᑇᮍ
੠᳔ᇣ࣪ⱘ⼲㒣㔥㒰DŽ៥Ӏ䖬᥼ᇐߎ঺ϔ⾡䇃Ꮒߑ᭄˖Ѹঝ➉DŽᅗ೼ᄺд乘⌟ὖ⥛Ⳃᷛߑ᭄
ᯊ↨䇃Ꮒᑇᮍ੠᳈ড়䗖DŽᴀゴ䖬⫼䋱৊ᮃⱘ᠟↉ߚᵤњ‫އ‬ㄪᷥⱘᔦ㒇‫أ‬㕂˄ेӬ䗝᳔ⷁⱘ‫އ‬
ㄪᷥ˅ˈᑊ㗗ᶹњᆚߛⳌ݇ⱘ᳔ᇣᦣ䗄䭓ᑺ˄Minimum Description Length˅ॳ߭DŽᇍ䋱৊ᮃ
ᮍ⊩ⱘ෎ᴀњ㾷ˈᇍѢ⧚㾷੠ࠏ⬏ᴎ఼ᄺдЁ䆌໮ㅫ⊩ⱘ᪡԰ᕜ䞡㽕DŽ

䋱৊ᮃᄺдᮍ⊩ⱘ⡍ᗻࣙᣀ˖
x 㾖ᆳࠄⱘ↣Ͼ䆁㒗ḋ՟ৃҹ๲䞣ᓣഄ䰡Ԣ៪छ催ᶤ‫؛‬䆒ⱘԄ䅵ὖ⥛DŽ䖭ᦤկњ
ϔ⾡↨݊Ҫㅫ⊩᳈ড়⧚ⱘᄺд䗨ᕘDŽ݊Ҫㅫ⊩Ӯ೼ᶤϾ‫؛‬䆒Ϣӏϔḋ՟ϡϔ㟈
ᯊᅠܼএᥝ䆹‫؛‬䆒DŽ
x ‫ܜ‬偠ⶹ䆚ৃҹϢ㾖ᆳ᭄᥂ϔ䍋‫އ‬ᅮ‫؛‬䆒ⱘ᳔㒜ὖ⥛DŽ೼䋱৊ᮃᄺдЁˈ‫ܜ‬偠ⶹ
䆚ⱘᔶᓣৃҹᰃ˄1˅↣Ͼ‫׭‬䗝‫؛‬䆒ⱘ‫ܜ‬偠ὖ⥛˄2˅↣Ͼৃ㛑‫؛‬䆒೼ৃ㾖ᆳ᭄
᥂Ϟⱘὖ⥛ߚᏗDŽ
x 䋱৊ᮃᮍ⊩ৃ‫ܕ‬䆌‫؛‬䆒‫ߎخ‬ϡ⹂ᅮᗻⱘ乘⌟DŽ˄↨བ䖭ḋⱘ‫؛‬䆒˖䖭ϔ㚎♢⮙
Ҏ᳝ 93%ⱘᴎӮᒋ໡˅DŽ
x ᮄⱘᅲ՟ߚ㉏ৃ⬅໮Ͼ‫؛‬䆒ϔ䍋԰ߎ乘⌟ˈҹᅗӀⱘὖ⥛Ўᴗ䞡DŽ
x ेՓ೼䋱৊ᮃᮍ⊩䅵ㅫ໡ᴖᑺ䕗催ᯊˈᅗӀҡৃ‫خ‬ЎϔϾ᳔Ӭⱘ‫އ‬ㄪⱘᷛ‫ޚ‬㸵
䞣݊Ҫᮍ⊩DŽ

೼ᅲ䏉Ёᑨ⫼䋱৊ᮃᮍ⊩ⱘ䲒ᑺПϔ೼ѢˈᅗӀ䳔㽕ὖ⥛ⱘ߱ྟⶹ䆚DŽᔧ䖭ὖ⥛乘‫ܜ‬᳾
ⶹᯊˈৃҹ෎Ѣ㚠᱃ⶹ䆚ǃ乘‫ޚܜ‬໛དⱘ᭄᥂ҹঞ݇Ѣ෎‫ߚޚ‬Ꮧⱘ‫؛‬ᅮᴹԄ䅵䖭ѯὖ⥛DŽ঺
ϔᅲ䰙ೄ䲒೼Ѣˈϔ㠀ᚙ‫މ‬ϟ⹂ᅮ䋱৊ᮃ᳔Ӭ‫؛‬䆒ⱘ䅵ㅫҷӋ↨䕗໻˄ৠ‫׭‬䗝‫؛‬䆒ⱘ᭄䞣៤
㒓ᗻ݇㋏˅DŽ೼ᶤѯ⡍ᅮᚙᔶϟˈ䖭⾡䅵ㅫҷӋৃҹ㹿໻໻䰡ԢDŽ
ᴀゴ࠽ԭ䚼ߚⱘ㒘៤བϟDŽ6.2 㡖ҟ㒡њ䋱৊ᮃ⧚䆎ˈᑊᅮНњᵕ໻Ԑ✊˄maximum
likelihood˅‫؛‬䆒੠ᵕ໻ৢ偠ὖ⥛‫؛‬䆒˄maximum a posteriori probability hypotheses˅DŽ᥹ϟᴹ
ⱘಯ㡖ᇚℸὖ⥛Ḛᶊᑨ⫼Ѣߚᵤࠡ䴶ゴ㡖ⱘⳌ݇䯂乬੠ᄺдㅫ⊩DŽ՟བˈ៥Ӏ䆕ᯢњ೼⡍ᅮ
ࠡᦤϟˈ޴Ͼࠡ䗄ⱘㅫ⊩㛑䕧ߎᵕ໻Ԑ✊‫؛‬䆒DŽ࠽ԭⱘ޴㡖߭ҟ㒡њ޴⾡Ⳉ᥹᪡԰ὖ⥛ⱘᄺ
дㅫ⊩DŽࣙᣀ䋱৊ᮃ᳔Ӭߚ㉏఼ǃGibbs ㅫ⊩੠ᴈ㋴䋱৊ᮃߚ㉏఼DŽ᳔ৢˈ៥Ӏ䅼䆎њ䋱৊
ᮃ㕂ֵ㔥ˈᅗᰃϔ⾡෎Ѣὖ⥛᥼⧚ⱘ䕗ᮄⱘᄺдᮍ⊩˗ҹঞ EM ㅫ⊩ˈᰃᔧᄬ೼᳾㾖⌟ࠄব
䞣ᯊᑓ⊯Փ⫼ⱘᄺдㅫ⊩DŽ

6.2 䍓ਬᯥ⌋ࡏ

೼ᴎ఼ᄺдЁˈ䗮ᐌ៥Ӏᛳ݈䍷ⱘᰃ೼㒭ᅮ䆁㒗᭄᥂ D ᯊˈ⹂ᅮ‫؛‬䆒ぎ䯈 H Ёⱘ᳔Շ


‫؛‬䆒DŽ᠔䇧᳔Շ‫؛‬䆒ˈϔ⾡ࡲ⊩ᰃᡞᅗᅮНЎ೼㒭ᅮ᭄᥂ D ҹঞ H Ёϡৠ‫؛‬䆒ⱘ‫ܜ‬偠ὖ⥛
ⱘ᳝݇ⶹ䆚ᴵӊϟⱘ᳔ৃ㛑˄most probable˅‫؛‬䆒DŽ䋱৊ᮃ⧚䆎ᦤկњ䅵ㅫ䖭⾡ৃ㛑ᗻⱘϔ
⾡Ⳉ᥹ⱘᮍ⊩DŽ᳈㊒⹂ഄ䆆ˈ䋱৊ᮃ⊩߭ᦤկњϔ⾡䅵ㅫ‫؛‬䆒ὖ⥛ⱘᮍ⊩ˈᅗ෎Ѣ‫؛‬䆒ⱘ‫ܜ‬
偠ὖ⥛ǃ㒭ᅮ‫؛‬䆒ϟ㾖ᆳࠄϡৠ᭄᥂ⱘὖ⥛ǃҹঞ㾖ᆳⱘ᭄᥂ᴀ䑿DŽ

㽕㊒⹂ഄᅮН䋱৊ᮃ⧚䆎ˈ‫ܜ‬ᓩܹϔѯ䆄োDŽ៥Ӏ⫼ P(h)ᴹҷ㸼䖬≵᳝䆁㒗᭄᥂ࠡˈ‫؛‬
䆒 h ᢹ᳝ⱘ߱ྟὖ⥛DŽP(h)ᐌ㹿⿄Ў h ⱘ‫ܜ‬偠ὖ⥛˄prior probability ˅ˈᅗড᯴њ៥Ӏ᠔ᢹ
᳝ⱘ݇Ѣ h ᰃϔℷ⹂‫؛‬䆒ⱘᴎӮⱘ㚠᱃ⶹ䆚DŽབᵰ≵᳝䖭ϔ‫ܜ‬偠ⶹ䆚ˈ䙷Мৃҹㅔऩഄᇚ↣
ϔ‫׭‬䗝‫؛‬䆒䌟ќⳌৠⱘ‫ܜ‬偠ὖ⥛DŽⳌԐഄˈৃ⫼ P(D)ҷ㸼ᇚ㽕㾖ᆳⱘ䆁㒗᭄᥂ D ⱘ‫ܜ‬偠ὖ
⥛˄ᤶ㿔Пˈ೼≵᳝⹂ᅮᶤϔ‫؛‬䆒៤ゟᯊˈD ⱘὖ⥛˅DŽϟϔℹˈҹ P(D|h)ҷ㸼‫؛‬䆒 h ៤ゟ
ⱘᚙᔶϟ㾖ᆳࠄ᭄᥂ D ⱘὖ⥛DŽ᳈ϔ㠀ഄˈ៥ӀՓ⫼ P(x|y)ҷ㸼㒭ᅮ y ᯊ x ⱘὖ⥛DŽ೼ᴎ఼
ᄺдЁˈ៥Ӏᛳ݈䍷ⱘᰃ P(h|D)ˈे㒭ᅮ䆁㒗᭄᥂ D ᯊ h ៤ゟⱘὖ⥛DŽP(h|D)㹿⿄Ў h ⱘৢ
偠ὖ⥛˄posterior probability˅ˈ಴Ўᅗড᯴њ೼ⳟࠄ䆁㒗᭄᥂ D ৢ h ៤ゟⱘ㕂ֵᑺDŽᑨ⊼ᛣˈ
ৢ偠ὖ⥛ P(h|D)ড᯴њ䆁㒗᭄᥂ D ⱘᕅડ˗Ⳍডˈ‫ܜ‬偠ὖ⥛ P(h)ᰃ⣀ゟѢ D ⱘDŽ

䋱৊ᮃ⊩߭ᰃ䋱৊ᮃᄺдᮍ⊩ⱘ෎⸔ˈ಴ЎᅗᦤկњҢ‫ܜ‬偠ὖ⥛ P(h)ҹঞ P(D)੠ P(D|h)


䅵ㅫৢ偠ὖ⥛ P(h|D)ⱘᮍ⊩DŽ

䋱৊ᮃ݀ᓣ

P ( D | h) P ( h)
P(h | D) ˄6.1˅
P( D)

Ⳉ㾖ৃⳟߎˈP(h|D)䱣ⴔ P(h)੠ P(D|h)ⱘ๲䭓㗠๲䭓DŽৠᯊгৃⳟߎ P(h|D)䱣 P(D)ⱘ๲


ࡴ㗠‫ޣ‬ᇥˈ䖭ᰃᕜড়⧚ⱘˈ಴Ўབᵰ D ⣀ゟѢ h 㹿㾖ᆳࠄⱘৃ㛑ᗻ䍞໻ˈ䙷М D ᇍ h ⱘᬃ
ᣕᑺ䍞ᇣDŽ

೼䆌໮ᄺдഎ᱃Ёˈᄺд఼㗗㰥‫׭‬䗝‫؛‬䆒䲚ড়Hᑊ೼݊Ёᇏᡒ㒭ᅮ᭄᥂Dᯊৃ㛑ᗻ᳔໻
ⱘ‫؛‬䆒hęH˄៪㗙ᄬ೼໮Ͼ䖭ḋⱘ‫؛‬䆒ᯊ䗝ᢽ݊ЁПϔ˅DŽ䖭ḋⱘ‫݋‬᳔᳝໻ৃ㛑ᗻⱘ‫؛‬䆒㹿
⿄Ўᵕ໻ৢ偠˄maximum a posteriori, MAP˅‫؛‬䆒DŽ⹂ᅮMAP‫؛‬䆒ⱘᮍ⊩ᰃ⫼䋱৊ᮃ݀ᓣ䅵
ㅫ↣Ͼ‫׭‬䗝‫؛‬䆒ⱘৢ偠ὖ⥛DŽ᳈㊒⹂ഄ䇈ᔧϟᓣ៤ゟᯊˈ⿄hMAPЎüMAP‫؛‬䆒˖

hMAP { arg max P(h | D)


hH
P ( D | h) P ( h)
arg max
hH P( D)
arg max P( D | h) P(h) ˄6.2˅
hH

⊼ᛣ೼᳔ৢϔℹ៥Ӏএᥝњ P(D)ˈ಴Ўᅗᰃϡձ䌪Ѣ h ⱘᐌ䞣DŽ

೼ ᶤ ѯ ᚙ ‫ މ‬ϟ ˈ ৃ ‫ ؛‬ᅮ H Ё ↣ Ͼ ‫ ؛‬䆒 ᳝ Ⳍ ৠ ⱘ ‫ ܜ‬偠 ὖ ⥛ ˄ े ᇍ H Ё ӏ ᛣ hi ੠ hj ˈ


P(hi)=P(hj)˅DŽ䖭ᯊৃᡞㄝᓣ 6-2 䖯ϔℹㅔ࣪ˈা䳔㗗㰥P(D|h)ᴹᇏᡒᵕ໻ৃ㛑‫؛‬䆒DŽP(D|h)
ᐌ⿄Ў㒭ᅮ h ᯊ᭄᥂Dⱘ Ԑ✊ᑺ˄likelihood˅ˈ㗠ՓP(D|h)᳔໻ⱘ‫؛‬䆒 㹿⿄Ўᵕ໻ Ԑ✊
˄maximum likelihoodˈML˅‫؛‬䆒hMLDŽ

hML { arg max P( D | h) ˄6.3˅


hH

ЎњՓϞ䴶ⱘ䅼䆎Ϣᴎ఼ᄺд䯂乬Ⳍ㘨㋏ˈ៥Ӏᡞ᭄᥂ D ⿄԰ᶤⳂᷛߑ᭄ⱘ䆁㒗ḋ՟ˈ
㗠ᡞ H ⿄Ў‫׭‬䗝Ⳃᷛߑ᭄ぎ䯈DŽᅲ䰙Ϟˈ䋱৊ᮃ݀ᓣ᳝ⴔ᳈Ў᱂䘡ⱘᛣНDŽᅗৠḋৃҹᕜ
དഄ⫼ѢӏᛣѦ᭹ੑ乬ⱘ䲚ড় Hˈা㽕䖭ѯੑ乬ⱘὖ⥛П੠Ў 1˄՟བ˖Ā໽ぎᰃ݄㡆ⱘā
੠Ā໽ぎϡᰃ݄㡆ⱘā˅DŽᴀゴЁ᳝ᯊᇚ H ԰Ўࣙ৿Ⳃᷛߑ᭄ⱘ‫؛‬䆒ぎ䯈ˈ㗠 D ԰Ў䆁㒗՟
䲚ড়DŽ݊Ҫϔѯᯊ‫׭‬㗗㰥ᇚ H ⳟ԰ϔѯѦ᭹ੑ乬ⱘ䲚ড়ˈ㗠 D Ўᶤ⾡᭄᥂DŽ

6.2.1 ⽰ׁ

Ў䇈ᯢ䋱৊ᮃ㾘߭ˈৃ㗗㰥ϔए⭫䆞ᮁ䯂乬ˈ݊Ё᳝ϸϾৃ䗝ⱘ‫؛‬䆒˖ ˄1˅⮙Ҏ᳝ᶤ⾡
㉏ൟⱘⰠ⮛ˈ ˄2˅⮙Ҏ᮴Ⱐ⮛DŽৃ⫼ⱘ᭄᥂ᴹ㞾Ѣϔ࣪偠⌟䆩ˈᅗ᳝ϸ⾡ৃ㛑ⱘ䕧ߎ˖†˄ℷ˅
੠ ˄䋳˅DŽ៥Ӏ᳝‫ܜ‬偠ⶹ䆚˖೼᠔᳝ҎষЁা᳝ 0.008 ⱘҎᙷ᳝䆹⮒⮙DŽ঺໪ˈ䆹࣪偠⌟
䆩াᰃ䆹⮙ⱘϔϾϡᅠܼⱘ乘䅵DŽ䆹⌟䆩䩜ᇍ⹂ᅲ᳝⮙ⱘᙷ㗙᳝ 98%ⱘৃ㛑䖨ಲℷ⹂ⱘ†㒧
ᵰˈ㗠ᇍ᮴䆹⮙ⱘᙷ㗙᳝ 97%ⱘৃ㛑ℷ⹂䖨ಲ  㒧ᵰDŽ䰸ℸҹ໪ˈ⌟䆩䖨ಲⱘ㒧ᵰᰃ䫭䇃
ⱘDŽϞ䴶ⱘᚙ‫⬅ৃމ‬ҹϟⱘὖ⥛ᓣὖᣀ˖

P (cancer ) 0.008 , P (™cancer ) 0.992


P († | cancer ) 0.98 , P (4 | cancer ) 0.02
P († | ™cancer ) 0.03 , P (4 | ™cancer ) 0.97

‫؛‬ᅮ⦄᳝ϔᮄ⮙Ҏˈ࣪偠⌟䆩䖨ಲњ†㒧ᵰDŽᰃ৺ᑨᇚ⮙ҎᮁᅮЎ᳝Ⱐ⮛ਸ਼˛ᵕ໻ৢ偠
‫؛‬䆒ৃ⫼ᓣ 6.2 ᴹ䅵ㅫ˖

P († | cancer ) P (cancer ) (0.98) ˜ (0.008) 0.0078


P († | ™cancer ) P (™cancer ) (0.03) ˜ (0.992) 0.0298

಴ℸˈhMAP=™cancerDŽ⹂ߛⱘৢ偠ὖ⥛ৃᇚϞ䴶ⱘ㒧ᵰᔦϔ࣪ҹՓᅗӀⱘ੠Ўü ˄े
0.0078
P(cancer|†)= =0.21˅DŽ䆹ℹ偸ⱘḍ᥂೼Ѣˈ䋱৊ᮃ݀ᓣ䇈ᯢৢ偠ὖ⥛ህᰃ
0.0078  0.0298
Ϟ䴶ⱘ䞣䰸ҹ᭄᥂P(†)DŽ㱑✊P(†)≵᳝԰Ў䯂乬䰜䗄ⱘϔ䚼ߚⳈ᥹㒭ߎˈԚ಴ЎᏆⶹ
ˈ಴ℸৃҹ䖯㸠ᔦ
P(cancer|†)੠P(™cancer|†)ⱘ੠ᖙЎ 1˄े䆹⮙Ҏ㽕М᳝Ⱐ⮛ˈ㽕М≵᳝˅
ϔ࣪DŽ⊼ᛣ㱑✊᳝Ⱐ⮛ⱘৢ偠ὖ⥛↨‫ܜ‬偠ὖ⥛㽕໻ˈԚ᳔ৃ㛑ⱘ‫؛‬䆒ҡЎℸҎ≵᳝Ⱐ⮛DŽ
བϞ՟᠔⼎ˈ䋱৊ᮃ᥼⧚ⱘ㒧ᵰᕜ໻ഄձ䌪Ѣ‫ܜ‬偠ὖ⥛ˈ㽕Ⳉ᥹ᑨ⫼䆹ᮍ⊩ᖙ乏‫ܜ‬㦋প
䆹ؐDŽ䖬㽕⊼ᛣ䆹՟Ёᑊ≵᳝ᅠܼഄ㹿᥹ফ៪ᢦ㒱‫؛‬䆒ˈ㗠াᰃ೼㾖ᆳࠄ䕗໮ⱘ᭄᥂ৢ‫؛‬䆒
ⱘৃ㛑ᗻ๲໻៪‫ޣ‬ᇣњDŽ

䅵ㅫὖ⥛ⱘ෎ᴀ݀ᓣ೼㸼 6-1 Ё߫ВDŽ

 Ь⊩݀ᓣ(Product rule)˖ϸџӊ A ੠ B ⱘѸⱘὖ⥛ P(AšB)


P( A š B) P(A | B)P(B) P(B | A)P(A)
 ࡴ⊩݀ᓣ(Sum Rule)˖ϸџӊ A ੠ B ⱘᑊⱘὖ⥛ P(A›B)
P( A › B) P(A)  P(B) - P(A š B)
 䋱৊ᮃ⊩߭(Bayes theorem)˖㒭ᅮ D ᯊ h ⱘৢ偠ὖ⥛ P(h|D)

P ( D | h) P ( h)
P(h | D)
P( D)

¦
n
 ܼὖ⥛݀ᓣ(Theorem of total probability)˖བᵰџӊA1, …, AnѦ᭹Ϩ P( Ai ) 1 ˈ߭˖
i 1

n
P( B) ¦ P( B | A ) P( A )
i 1
i i

㸼 6-1 ෎ᴀὖ⥛݀ᓣ㸼

6.3 䍓ਬᯥ⌋ࡏૂᾸᘫᆜҖ

䋱৊ᮃ⊩߭੠ὖᗉᄺд䯂乬ⱘ݇㋏ᰃҔМ˛಴Ў䋱৊ᮃ⊩߭Ў䅵ㅫ㒭ᅮ䆁㒗᭄᥂ϟӏ
ϔ‫؛‬䆒ⱘৢ偠ὖ⥛ᦤկњॳ߭ᗻᮍ⊩ˈ៥ӀৃⳈ᥹ᇚ݊԰ЎϔϾ෎ᴀⱘᄺдㅫ⊩˖䅵ㅫ↣Ͼ
‫؛‬䆒ⱘὖ⥛ˈ‫ݡ‬䕧ߎ݊Ёὖ⥛᳔໻ⱘDŽᴀ㡖㗗㰥њ䖭ḋϔϾ Brute-Force 䋱৊ᮃὖᗉᄺдㅫ
⊩ˈ✊ৢᇚ݊Ϣ㄀ 2 ゴҟ㒡ⱘὖᗉᄺдㅫ⊩Ⳍ↨䕗DŽ䗮䖛↨䕗ৃҹⳟࠄϔϾ᳝䍷ⱘ㒧䆎ˈे
೼⡍ᅮᴵӊϟˈࠡ䴶ᦤࠄⱘ޴⾡ㅫ⊩䛑䕧ߎϢ Brute-Force 䋱৊ᮃㅫ⊩Ⳍৠⱘ‫؛‬䆒ˈাϡ䖛
ࠡ䴶ⱘㅫ⊩ϡᯢ⹂䅵ㅫὖ⥛ˈ㗠Ϩ೼Ⳍᔧ⿟ᑺϞᬜ⥛᳈催DŽ

6.3.1 Brute-Force 䍓ਬᯥᾸᘫᆜҖ

㗗㰥㄀ 2 ゴ佪‫ⱘࠄᦤܜ‬ὖᗉᄺд䯂乬DŽ݊Ёˈ៥Ӏ‫؛‬ᅮᄺд఼㗗㰥ⱘᰃᅮН೼ᅲ՟ぎ䯈
XϞⱘ᳝䰤ⱘ‫؛‬䆒ぎ䯈HˈӏࡵᰃᄺдᶤϾⳂᷛὖᗉc:Xė{0,1}DŽབ䗮ᐌ䙷ḋˈ‫؛‬ᅮ㒭ќᄺд
఼ᶤ䆁㒗ḋ՟ᑣ߫LJLJx1ˈd1ˈLjĂLJxmˈdmLjLjˈ݊ЁxiЎXЁⱘᶤᅲ՟ˈdiЎxiⱘⳂᷛߑ᭄ؐ
˄ेdi=c(xi)˅
DŽЎㅔ࣪䅼䆎ˈ‫؛‬ᅮᅲ՟ᑣ߫LJx1ĂxmLjᰃ೎ᅮϡবⱘˈ಴ℸ䆁㒗᭄᥂Dৃ㹿ㅔ
ऩഄ‫ݭ‬԰Ⳃᷛߑ᭄ؐᑣ߫˖D=LJd1ĂdmLjDŽৃҹⳟࠄ˄㾕д乬 6.4˅ˈ䖭ϔㅔ࣪ϡӮᬍবᴀ㡖
ⱘЏ㽕㒧䆎DŽ

෎Ѣ䋱৊ᮃ⧚䆎ⱘⳈ᥹ὖᗉᄺдㅫ⊩ᅮНབϟ˖

Brute-Force MAP ᄺдㅫ⊩

1ˊᇍѢ H Ё↣Ͼ‫؛‬䆒 hˈ䅵ㅫৢ偠ὖ⥛˖


P ( D | h) P ( h)
P(h | D)
P( D)

2ˊ䕧ߎ᳔᳝催ৢ偠ὖ⥛ⱘ‫؛‬䆒hMAP

hMAP { arg max P(h | D)


hH

ℸㅫ⊩䳔㽕䕗໻ⱘ䅵ㅫ䞣ˈ಴Ўᅗᇍ H Ё↣Ͼ‫؛‬䆒䛑ᑨ⫼њ䋱৊ᮃ݀ᓣҹ䅵ㅫ P(h|D)DŽ


㱑✊ᇍѢ໻ⱘ‫؛‬䆒ぎ䯈䖭ᕜϡߛᅲ䰙ˈԚ䆹ㅫ⊩ҡ✊ؐᕫ݇⊼ˈ಴ЎᅗᦤկњϔϾᷛ‫ˈޚ‬ҹ
߸ᮁ݊Ҫὖᗉᄺдㅫ⊩ⱘᗻ㛑DŽ

ϟ䴶Ў Brute-Force MAP ᄺдㅫ⊩ᣛᅮϔᄺд䯂乬ˈ៥Ӏᖙ乏⹂ᅮ P(h)੠ P(D|h)ߚ߿ᑨ


পԩؐ˄ৃҹⳟߎˈP(D)ⱘؐӮձ䖭ϸ㗙㗠ᅮ˅DŽ៥Ӏৃҹҹӏᛣᮍ⊩䗝ᢽ P(h)੠ P(D|h)ⱘ
ὖ⥛ߚᏗˈҹᦣ䗄䆹ᄺдӏࡵⱘ‫ܜ‬偠ⶹ䆚DŽ䖭䞠Ҹ݊Ϣϟ䴶ⱘࠡᦤϔ㟈˖

˗
1ˊ䆁㒗᭄᥂Dᰃ᮴ాໄⱘ˄ेdi=c(xi)˅

2ˊⳂᷛὖᗉ c ࣙ৿೼‫؛‬䆒ぎ䯈 H Ё˗

3ˊ≵᳝ӏԩ⧚⬅䅸Ўᶤ‫؛‬䆒↨݊Ҫⱘ‫؛‬䆒ⱘৃ㛑ᗻ໻DŽ

᳝њ䖭ѯ‫؛‬ᅮˈབԩ⹂ᅮ P(h)ⱘؐ˛⬅Ѣӏϔ‫؛‬䆒ϡ↨݊Ҫ‫؛‬䆒ৃ㛑ᗻ໻ˈᕜᰒ✊ৃᇍ
H Ё↣Ͼ‫؛‬䆒 h 䌟ҹⳌৠⱘ‫ܜ‬偠ὖ⥛DŽ䖯ϔℹഄˈ⬅ѢⳂᷛὖᗉ೼ H Ёˈ᠔ҹৃ㽕∖ H Ё
᠔᳝‫؛‬䆒ⱘὖ⥛੠Ў 1DŽᇚ䖭ѯ䰤ࠊড়䍋ᴹৃᕫ˖

1
ᇍ H Ёӏϔ h ˈ P ( h)
H

བԩ䗝ᢽP(D|h)ⱘؐ˛P(D|h)ᰃᏆⶹ‫؛‬䆒h៤ゟⱘᴵӊϟ˄ेᏆⶹhЎⳂᷛὖᗉcⱘℷ⹂ᦣ
䗄˅ˈ㾖ᆳࠄⳂᷛؐD=LJd1…dmLjⱘὖ⥛DŽ⬅Ѣ‫؛‬ᅮ䆁㒗᭄᥂᮴ాໄˈ䙷М㒭ᅮhᯊˈབᵰ
di=h(xi)߭ߚ㉏diЎ 1ˈབᵰdiĮh(xi)߭diЎ 0DŽ಴ℸ˖

1 བᵰᇍ D Ё᠔᳝ diˈdi=h(xi)


P(D|h)= ˄6.4˅
0 ݊Ҫᚙ‫މ‬

ᤶ㿔Пˈ㒭ᅮ‫؛‬䆒 hˈ᭄᥂ D ⱘὖ⥛೼݊Ϣ‫؛‬䆒 h ϔ㟈ᯊؐЎ 1ˈ৺߭ؐЎ 0DŽ

᳝њ P(h)੠ P(D|h)ⱘؐˈ⦄೼៥ӀᇍѢϞ䴶ⱘ Brute-Force MAP ᄺдㅫ⊩᳝њϔϾᅠᭈ


ᅮНⱘ䯂乬DŽ᥹ϟᴹ㗗㰥䆹ㅫ⊩ⱘ㄀ϔℹˈՓ⫼䋱৊ᮃ݀ᓣ䅵ㅫ↣Ͼ‫؛‬䆒 h ⱘৢ偠ὖ⥛
P(h|D)˖

P ( D | h) P ( h)
P(h | D)
P( D)

佪‫ܜ‬㗗㰥 h Ϣ䆁㒗᭄᥂ D ϡϔ㟈ⱘᚙᔶDŽ⬅Ѣᓣ 6.4 ᅮНᔧ h Ϣ D ϡϔ㟈ᯊ P(D|h)Ў 0ˈ


᳝˖
0 ˜ P ( h)
P(h | D) 0 ˈᔧ h Ϣ D ϡϔ㟈DŽ
P( D)

Ϣ D ϡϔ㟈ⱘ‫؛‬䆒 h ⱘৢ偠ὖ⥛Ў 0DŽ

‫ݡ‬㗗㰥 h Ϣ D ϔ㟈ⱘᚙ‫މ‬DŽ⬅Ѣᓣ 6.4 ᅮНᔧ h Ϣ D ϔ㟈ᯊ P(D |h)Ў 1ˈ᳝˖


1

H
P(h|D)
P( D)
1

H
VS H , D
H
1
ᔧ h Ϣ D ϔ㟈
VS H , D

݊ЁVSH,DᰃHЁϢDϔ㟈ⱘ‫؛‬䆒ᄤ䲚˄ेVSH,DᰃⳌᇍѢDⱘবൟぎ䯈ˈབ㄀ 2 ゴⱘᅮН˅DŽ
VS H , D
ᕜᆍᯧৃ偠䆕P(D)= ˈ಴Ў೼᠔᳝‫؛‬䆒ϞP(h|D)ⱘ੠ᖙЎ 1ˈᑊϨHЁϢDϔ㟈ⱘ‫؛‬
H
䆒᭄䞣Ў|VSH,D|DŽ঺໪ˈৃҢܼὖ⥛݀ᓣ˄㾕㸼 6-1˅ҹঞ᠔᳝‫؛‬䆒ᰃѦ᭹ⱘᴵӊ˄े
(i z j )( P(hi š h j ) 0) ˅ˈ᥼ᇐߎP(D)ⱘؐ˖

P(D) ¦ P( D | h ) P (h )
hi H
i i

1 1
¦
hi VS H , D
1˜  ¦ 0˜
H hi VS H ,D H
1
¦
hi VS H , D

H
VS H , D
H

ὖ㗠㿔Пˈ䋱৊ᮃ݀ᓣ䇈ᯢ೼៥Ӏⱘ P(h)੠ P(D|h)ⱘᅮНϟˈৢ偠ὖ⥛ P(h|D)Ў˖


1
བᵰ h Ϣ D ϔ㟈
P(h|D)= VS H , D ˄6.5˅
0 ݊Ҫᚙ‫މ‬
݊Ё|VSH,D|ᰃHЁϢDϔ㟈ⱘ‫؛‬䆒᭄䞣DŽ‫؛‬䆒ⱘὖ⥛ⓨ࣪ᚙ‫މ‬བ೒ 6-1 Ё᠔⼎DŽ߱ྟᯊ˄೒
6-1a˅᠔᳝‫؛‬䆒‫݋‬᳝Ⳍৠⱘὖ⥛DŽᔧ䆁㒗᭄᥂䗤ℹߎ⦄ৢˈ˄೒ 6-1b੠ 6-1c˅ˈϡϔ㟈‫؛‬䆒ⱘ
ὖ⥛বЎ 0ˈ㗠ᭈϾὖ⥛ⱘ੠ҡЎ 1ˈᅗӀഛࣔഄߚᏗࠄ࠽ԭⱘϔ㟈‫؛‬䆒ЁDŽ

Ϟ䴶ⱘߚᵤ䇈ᯢˈ೼៥Ӏ䗝ᅮⱘP(h)੠P(D|h)পؐϟˈ↣Ͼϔ㟈ⱘ‫؛‬䆒ৢ偠ὖ⥛Ў
˄1/|VSH,D|˅
ˈ↣Ͼϡϔ㟈‫؛‬䆒ৢ偠ὖ⥛Ў 0DŽ಴ℸˈ↣Ͼϔ㟈ⱘ‫؛‬䆒䛑ᰃMAP‫؛‬䆒DŽ
原书页码: 162

hypotheses: ‫؛‬䆒

೒ 6-1 ৢ偠ὖ⥛䱣ⴔ䆁㒗᭄᥂๲䭓ⱘⓨ࣪

(a)ᇍ↣Ͼ‫؛‬䆒䌟ќഛࣔⱘ‫ܜ‬偠ὖ⥛DŽᔧ䆁㒗᭄᥂佪‫ܜ‬๲䭓ࠄ D1(b)ˈ✊ৢ๲䭓ࠄ D1ġD2(c)ˈ


ϡϔ㟈‫؛‬䆒ⱘৢ偠ὖ⥛ব៤ 0ˈ㗠ֱ⬭೼বൟぎ䯈Ёⱘ‫؛‬䆒ⱘৢ偠ὖ⥛๲ࡴDŽ

6.3.2 MAP ‫ٽ‬䇴ૂж㠪ᆜҖಞ

Ϟ䴶ⱘߚᵤ䇈ᯢ೼㒭ᅮᴵӊϟˈϢDϔ㟈ⱘ↣Ͼ‫؛‬䆒䛑ᰃMAP‫؛‬䆒DŽḍ᥂䖭ϔ㒧䆎ৃⳈ
᥹ᕫࠄϔ㉏᱂䘡ⱘᄺд఼ˈ⿄Ўϔ㟈ᄺд఼DŽᶤᄺдㅫ⊩㹿⿄Ўϔ㟈ᄺд఼ˈ䇈ᯢᅗ䕧ߎⱘ
‫؛‬䆒೼䆁㒗՟Ϟ᳝䳊䫭䇃⥛DŽ⬅ҹϞⱘߚᵤৃᕫˈབᵰ‫؛‬ᅮHϞ᳝ഛࣔⱘ‫ܜ‬偠ὖ⥛˄े
P(hi)=P(hj)ˈᇍ᠔᳝ⱘi,j˅
ˈϨ䆁㒗᭄᥂ᰃ⹂ᅮᗻⱘ੠᮴ాໄⱘ˄ेᔧD੠hϔ㟈ᯊˈP(D|h)=1˅
ˈ
৺߭Ў 0˅ᯊˈӏᛣϔ㟈ᄺд఼ᇚ䕧ߎϔϾMAP‫؛‬䆒DŽ

՟བ㄀ 2 ゴ䅼䆎ⱘ Find-S ὖᗉᄺдㅫ⊩DŽFind-S ᣝ✻⡍⅞ࠄϔ㠀ⱘ乎ᑣ᧰㋶‫؛‬䆒ぎ䯈 Hˈ


ᑊ䕧ߎϔϾᵕ໻⡍⅞ᗻⱘϔ㟈‫؛‬䆒ˈৃⶹ೼Ϟ䴶ᅮНⱘ P(h)੠ P(D|h)ὖ⥛ߚᏗϟˈᅗ䕧ߎ
MAP ‫؛‬䆒DŽᔧ✊ˈFind-S ᑊϡⳈ᥹᪡԰ὖ⥛ˈᅗাㅔऩഄ䕧ߎবൟぎ䯈ⱘᵕ໻⡍⅞ᗻ៤ਬDŽ
✊㗠ˈ䗮䖛‫އ‬ᅮ P(h)੠ P(D|h)ⱘߚᏗˈҹՓ݊䕧ߎЎ MAP ‫؛‬䆒ˈ៥Ӏ᳝њϔ⾡ࠏ⬏ Find-S
ㅫ⊩ⱘ᳝ᬜ䗨ᕘDŽ

ᰃ৺䖬᳝݊Ҫৃ㛑ⱘP(h)੠P(D|h)ߚᏗˈՓFind-S䕧ߎMAP‫؛‬䆒˛ಲㄨᰃ㚃ᅮⱘDŽ಴Ў
Find-SҢবൟぎ䯈Ё䕧ߎᵕ໻⡍⅞ᗻ(maximally specific)‫؛‬䆒ˈ᠔ҹᇍѢ‫ܜ‬偠ὖ⥛‫أ‬㹦Ѣ᳈⡍
⅞‫؛‬䆒ⱘӏԩὖ⥛ߚᏗˈᅗ䕧ߎⱘ‫؛‬䆒䛑ᇚᰃMAP‫؛‬䆒DŽ᳈㊒⹂ഄ䆆ˈ‫؛‬བHᰃHϞӏᛣὖ
⥛ߚᏗP(h)ˈᅗ೼h1↨h2᳈⡍⅞ᯊ䌟ќP(h1)ıP(h2)DŽৃ㾕ˈ೼‫؛‬ᅮ᳝‫ܜ‬偠ߚᏗH੠ϢϞ䴶Ⳍ
ৠⱘP(D|h)ߚᏗᯊˈFind-S䕧ߎϔMAP‫؛‬䆒DŽ

ὖᣀҹϞ䅼䆎ˈ䋱৊ᮃḚᶊᦤߎњϔ⾡ࠏ⬏ᄺдㅫ⊩˄བ Find-S ㅫ⊩˅㸠Ўⱘᮍ⊩ˈ


ेՓ䆹ᄺдㅫ⊩ϡ䖯㸠ὖ⥛᪡԰DŽ䗮䖛⹂ᅮㅫ⊩䕧ߎ᳔Ӭ˄བ MAP˅‫؛‬䆒ᯊՓ⫼ⱘὖ⥛ߚ
Ꮧ P(h)੠ P(D|h)ˈৃҹࠏ⬏ߎㅫ⊩‫݋‬᳔᳝Ӭ㸠Ўᯊⱘ䱤৿‫؛‬ᅮDŽ

Փ⫼䋱৊ᮃⱘ䗨ᕘࠏ⬏ᄺдㅫ⊩ˈϢᧁ⼎ᄺд఼Ёⱘᔦ㒇‫أ‬㕂೼ᗱᛇϞᰃⳌ㉏ԐⱘDŽ⊼
ᛣ೼㄀ 2 ゴᇚᄺдㅫ⊩ⱘᔦ㒇‫أ‬㕂ᅮНЎᮁ㿔䲚ড় Bˈ䗮䖛ᅗৃ‫ߚܙ‬ഄⓨ㒢᥼ᮁߎᄺд఼᠔
ᠻ㸠ⱘᔦ㒇᥼⧚㒧ᵰDŽ՟བˈ‫׭‬䗝⍜䰸ㅫ⊩ⱘᔦ㒇‫أ‬㕂Ўˈ‫؛‬ᅮⳂᷛὖᗉ c ࣙ৿೼‫؛‬ᅮぎ䯈
H ЁDŽ䖯ϔℹഄˈ៥Ӏ䖬䆕ᯢᄺдㅫ⊩ⱘ䕧ߎᰃ⬅݊䕧ܹҹঞ䖭ϔ䱤৿ⱘᔦ㒇‫أ‬㕂‫؛‬ᅮ᠔ⓨ
㒢ᕫߎⱘDŽϞ䴶ⱘ䋱৊ᮃ㾷䞞ᇍѢᦣ䗄ᄺдㅫ⊩Ёⱘ䱤৿‫؛‬ᅮᦤկњ঺ϔ⾡ᮍ⊩DŽ䖭䞠ˈϡ
ᰃ⫼ϔㄝᬜⱘⓨ㒢㋏㒳এᇍᔦ㒇᥼⧚ᓎ῵ˈ㗠ᰃ⫼෎Ѣ䋱৊ᮃ⧚䆎ⱘϔϾㄝᬜⱘὖ⥛᥼⧚
˄probabilistic reasoning˅㋏㒳DŽ䖭䞠ᑨ⫼Ѣᄺд఼ⱘ䱤৿‫؛‬ᅮᔶᓣЎ˖ĀH Ϟⱘ‫ܜ‬偠ὖ⥛⬅
P(h)ߚᏗ㒭ߎˈ㗠᭄᥂ᢦ㒱៪᥹ফ‫؛‬䆒ⱘᔎᑺ⬅ P(D|h)㒭ߎDŽ āᴀкⱘ P(h)੠ P(D|h)ᅮНࠏ
⬏њ‫׭‬䗝⍜䰸੠ Find-S ㋏㒳Ёⱘ䱤৿‫؛‬ᅮDŽ೼Ꮖⶹ䖭ѯ‫؛‬ᅮⱘὖ⥛ߚᏗৢˈϔϾ෎Ѣ䋱৊
ᮃ⧚䆎ⱘὖ⥛᥼⧚㋏㒳ᇚѻ⫳ㄝᬜѢ䖭ѯㅫ⊩ⱘ䕧ܹ-䕧ߎ㸠ЎDŽ
ᴀ㡖Ёⱘ䅼䆎ᰃ䋱৊ᮃ᥼⧚ⱘϔ⾡⡍⅞ᔶᓣˈ಴Ў៥Ӏা㗗㰥њ P(D|h)পؐা㛑Ў 0
៪ 1 ⱘᚙ‫ˈމ‬ᅗড᯴њ‫؛‬䆒乘⌟ⱘ⹂ᅮᗻҹঞ᮴ాໄ᭄᥂ⱘࠡᦤDŽབৢϔ㡖᠔⼎ˈ䖬ৃҹ䗮
䖛‫ܕ‬䆌 P(D|h)পؐЎ 0 ੠ 1 П໪ⱘؐˈҹঞ೼ P(D|h)Ёࣙ৿䰘ࡴⱘᦣ䗄ҹ㸼⼎ాໄ᭄᥂ⱘߚ
Ꮧᚙ‫ˈމ‬ᴹ῵ᢳҢ᳝ాໄ䆁㒗᭄᥂Ёᄺдⱘ㸠ЎDŽ

6.4 ᶷཝղ❬ૂᴶቅ䈥ᐤᒩᯯ‫ٽ‬䇴

བϞ㡖᠔⼎ˈ䋱৊ᮃߚᵤৃ⫼ᴹ㸼ᯢϔϾ⡍ᅮᄺдㅫ⊩Ӯ䕧ߎ MAP ‫؛‬䆒ˈेՓ䆹ㅫ⊩


≵᳝ᰒᓣഄՓ⫼䋱৊ᮃ㾘߭ˈ៪ҹᶤ⾡ᔶᓣ䅵ㅫὖ⥛DŽ

ᴀ㡖㗗㰥ᄺд䖲㓁ؐⳂᷛߑ᭄ⱘ䯂乬ˈ䖭ᰃ೼䆌໮ᄺдㅫ⊩Ё䛑Ӯ䘛ࠄⱘˈབ⼲㒣㔥㒰
ᄺдǃ㒓ᗻಲᔦǃҹঞ໮乍ᓣ᳆㒓ᢳড়DŽ䗮䖛ㅔऩⱘ䋱৊ᮃߚᵤˈৃҹ㸼ᯢ೼⡍ᅮࠡᦤϟˈ
ӏϔᄺдㅫ⊩བᵰՓ䕧ߎⱘ‫؛‬䆒乘⌟੠䆁㒗᭄᥂П䯈ⱘ䇃Ꮒᑇᮍ᳔ᇣ࣪ˈᅗᇚ䕧ߎϔᵕ໻Ԑ
✊‫؛‬䆒DŽ䖭ϔ㒧䆎ⱘᛣН೼ѢˈᇍѢ䆌໮⼲㒣㔥㒰੠᳆㒓ᢳড়ⱘᮍ⊩ˈབᵰᅗӀ䆩೒೼䆁㒗
᭄᥂ϞՓ䇃Ꮒᑇᮍ੠᳔ᇣ࣪ˈℸ㒧䆎ᦤկњϔ⾡䋱৊ᮃⱘ䆎䆕ᮍ⊩˄೼⡍ᅮࠡᦤϟ˅DŽ

䆒ᛇ䯂乬ᅮНབϟˈᄺд఼LᎹ԰೼ᅲ՟ぎ䯈X੠‫؛‬䆒ぎ䯈HϞˈHЁⱘ‫؛‬䆒ЎXϞᅮН
ⱘᶤ⾡ᅲ᭄ؐߑ᭄˄ेˈHЁ↣ϾhЎϔߑ᭄˖h: Xėƒˈ݊Ёƒҷ㸼ᅲ᭄䲚˅DŽL䴶Јⱘ䯂乬
ᰃᄺдϔϾҢHЁᢑপߎⱘ᳾ⶹⳂᷛߑ᭄f˖XėƒDŽ㒭ᅮmϾ䆁㒗ḋ՟ⱘ䲚ড়ˈ↣Ͼḋ՟ⱘ
Ⳃᷛؐ㹿ᶤ䱣ᴎాໄᑆᡄˈℸ䱣ᴎాໄ᳡ҢℷᗕߚᏗDŽ᳈㊒⹂ഄ䆆ˈ↣Ͼ䆁㒗ḋ՟ᰃᑣ‫ي‬LJxi,
diLjˈ݊Ёdi=f(xi)+eiDŽ䖭䞠f(xi)ᰃⳂᷛߑ᭄ⱘ᮴ాໄؐˈeiᰃϔҷ㸼ాໄⱘ䱣ᴎব䞣DŽ‫؛‬ᅮeiⱘ
ؐᰃ⣀ゟᢑপⱘˈᑊϨᅗӀⱘߚᏗ᳡Ң䳊ഛؐⱘℷᗕߚᏗDŽᄺд఼ⱘӏࡵᰃ೼᠔᳝‫؛‬䆒᳝Ⳍ
ㄝⱘ‫ܜ‬偠ὖ⥛ࠡᦤϟˈ䕧ߎᵕ໻ৃ㛑‫؛‬䆒˄ेMAP‫؛‬䆒˅ˈ DŽ

㱑✊៥Ӏⱘߚᵤᑨ⫼Ѣӏᛣᅲ᭄ؐߑ᭄ᄺдˈ✊㗠ৃҹ⫼ϔϾㅔऩⱘ՟ᄤᴹᦣ䗄䖭ϔ䯂
乬ˈेᄺд㒓ᗻߑ᭄DŽ೒ 6-2 ᠔⼎Ўϔ㒓ᗻⳂᷛߑ᭄f˄ҹᅲ㒓㸼⼎˅ˈҹঞ䆹Ⳃᷛߑ᭄ⱘ᳝
ాໄ䆁㒗ḋ՟䲚DŽ㰮㒓ᇍᑨ᳔᳝ᇣᑇᮍ䆁㒗䇃Ꮒⱘ‫؛‬䆒hMLˈгेᵕ໻Ԑ✊‫؛‬䆒DŽ⊼ᛣˈ݊
Ёᵕ໻Ԑ✊‫؛‬䆒ϡϔᅮㄝѢℷ⹂‫؛‬䆒fˈ಴ЎᅗᰃҢ᳝䰤ⱘᏺాໄ᭄᥂Ё᥼䆎ᕫߎⱘDŽ

原书页码: 164

೒ 6-2 ᄺдϔᅲؐߑ᭄DŽ

Ⳃᷛߑ᭄fᇍᑨᅲ㒓DŽ‫؛‬ᅮ䆁㒗ḋ՟LJxi, diLjЎⳳᅲⳂᷛؐࡴϞϔ䳊ഛؐⱘℷᗕߚᏗాໄeiDŽ㰮
㒓ҷ㸼Փ䇃ᏂᑇᮍП੠᳔ᇣⱘ㒓ᗻߑ᭄DŽ಴ℸˈᅗህᰃ䖭 5 Ͼ䆁㒗ḋ՟ϟⱘᵕ໻Ԑ✊‫؛‬䆒hMLDŽ

䖭䞠ⱘ䇃Ꮒᑇᮍ੠᳔ᇣⱘ‫؛‬䆒ेЎᵕ໻Ԑ✊‫؛‬䆒ˈЎ䇈ᯢ䖭ϔ⚍ˈ佪‫ܜ‬ᖿ䗳ഄಲ乒ϔϟ
㒳䅵⧚䆎ЁⱘϸϾ෎ᴀὖᗉ˖ὖ⥛ᆚᑺ੠ℷᗕߚᏗDŽ佪‫ˈܜ‬Ў䅼䆎‫ڣ‬e䖭ḋⱘ䖲㓁ব䞣Ϟⱘ
ὖ⥛ˈ៥Ӏᓩܹὖ⥛ᆚᑺ˄probability density˅DŽㅔऩⱘ㾷䞞ᰃˈ៥Ӏ䳔㽕䱣ᴎব䞣᠔᳝ৃ㛑
ؐⱘὖ⥛੠Ў 1DŽ⬅Ѣব䞣ᰃ䖲㓁ⱘˈ಴ℸϡ㛑Ў䱣ᴎব䞣ⱘ᮴䰤⾡ৃ㛑ⱘؐ䌟ќϔϾ᳝䰤
ὖ⥛DŽ䖭䞠䳔㽕⫼ὖ⥛ᆚᑺᴹҷ᳓ˈҹՓe䖭ḋⱘ䖲㓁ব䞣೼᠔᳝ؐϞⱘὖ⥛ᆚᑺⱘ⿃ߚЎ
1DŽϔ㠀ഄˈ⫼ᇣ‫ݭ‬ᄫ↡pᴹҷ㸼ὖ⥛ᆚᑺߑ᭄ˈҹऎߚ᳝䰤ὖ⥛P˄ᅗ᳝ᯊজ⿄Ўὖ⥛䋼䞣
˄probability mass˅˅DŽὖ⥛ᆚᑺp(x0)ᰃᔧ¦䍟䖥Ѣ 0 ᯊˈxপؐ೼[x0, x0+¦)ऎ䯈‫ⱘݙ‬ὖ⥛Ϣ
1/¦Ь⿃ⱘᵕ䰤DŽ

ὖ⥛ᆚᑺߑ᭄˖

1
p ( x 0 ) { lim P( x0 d x  x 0  H )
H o0 H

݊⃵ˈ䖭䞠ᮁᅮ䱣ᴎాໄব䞣 e ⬅ℷᗕߚᏗ⫳៤DŽℷᗕߚᏗᰃϔᑇ⒥ⱘ䩳ᔶߚᏗˈᅗৃ
⬅݊ഛؐ­੠ᷛ‫ޚ‬Ꮒ³ᅠܼࠏ⬏DŽ㾕㸼 5-4 Ёⱘ㊒⹂ᅮНDŽ

᳝њҹϞⱘϸϾὖᗉˈ‫ݡ‬ᴹ䅼䆎೼៥Ӏⱘ䯂乬䞠ЎҔМ᳔ᇣ䇃Ꮒᑇᮍ‫؛‬䆒ᅲ䰙Ϟህᰃᵕ
໻Ԑ✊‫؛‬䆒DŽ䆕ᯢⱘ䖛⿟‫ܜ‬Փ⫼ࠡ䴶ⱘᓣ 6-3 ⱘᅮНᴹ᥼ᇐᵕ໻ৃ㛑‫؛‬䆒ˈԚՓ⫼ᇣ‫ ⱘݭ‬p
ҷ㸼ὖ⥛ᆚᑺ˖

hML arg max P( D | h)


hH

བࠡ᠔䗄ˈ‫؛‬ᅮ᳝ϔ೎ᅮⱘ䆁㒗ᅲ՟䲚ড়LJx1…xmLjˈ಴ℸা㗗㰥ⳌᑨⱘⳂᷛؐᑣ߫D=
LJd1…dmLjDŽ䖭䞠di=f(xi)+eiDŽ‫؛‬ᅮ䆁㒗ḋ՟ᰃⳌѦ⣀ゟⱘˈ㒭ᅮhᯊˈৃᇚP(D|h)‫ݭ‬៤৘p(di|h)
ⱘ⿃˖

m
hML arg max – p (d i | h)
hH i 1

བᵰ䇃Ꮒei᳡Ң䳊ഛؐ੠᳾ⶹᮍᏂ³2ⱘℷᗕߚᏗˈ↣Ͼdiгᖙ乏᳡ҢℷᗕߚᏗˈ݊ᮍᏂ
Ў³2ˈ㗠ϨҹⳳᅲⱘⳂᷛؐf(xi)ЎЁᖗ˄㗠ϡᰃ 0˅DŽ಴ℸˈp(di)ⱘৃ㹿‫ݭ‬ЎᮍᏂ³2ˈഛؐ
­=f(xi)ⱘℷᗕߚᏗDŽ⦄Փ⫼㸼 5-4 ЁⱘℷᗕߚᏗ݀ᓣᑊᇚⳌᑨⱘ­੠³2ҷܹˈ‫ᦣߎݭ‬䗄p(di|h)
ⱘℷᗕߚᏗDŽ⬅Ѣὖ⥛diⱘ㸼䖒ᓣᰃ೼hЎⳂᷛߑ᭄fⱘℷ⹂ᦣ䗄ᴵӊϟⱘˈ᠔ҹ䖬㽕᳓ᤶ­
=f(xi)=h(xi)DŽᕫࠄDŽ

m 1
1  ( di  P )2
hML arg max – e 2V 2
hH i 1 2SV 2

m 1
1  ( d i  h ( xi )) 2
arg max – e 2V 2
hH i 1 2SV 2

⦄೼Փ⫼ϔϾᵕ໻Ԑ✊䅵ㅫЁᐌ⫼ⱘ䕀ᤶ˖ϡᰃ⫼Ϟ䴶䖭Ͼ໡ᴖⱘ㸼䖒ᓣপ᳔໻ؐˈ㗠
ᰃՓ⫼݊ᇍ᭄প᳔໻ˈ䖭ḋ䕗ᆍᯧDŽॳ಴ᰃ lnp ᰃ p ⱘऩ䇗ߑ᭄DŽ಴ℸՓ lnp ᳔໻гህՓ p
᳔໻˖

m
1 1
hML arg max ¦ ln  (d i  h( xi )) 2
hH i 1 2SV 2 2V 2

ℸ㸼䖒ᓣЁ㄀ϔ乍Ўϔ⣀ゟѢ h ⱘᐌ᭄ˈৃ㹿ᗑ⬹ˈ಴ℸᕫࠄ˖
m
1
hML arg max ¦  (d i  h( xi )) 2
hH i 1 2V 2

ՓϔϾ䋳ⱘ䞣᳔໻ㄝᬜѢՓⳌᑨⱘℷⱘ䞣᳔ᇣ˖

m
1
hML arg min ¦ (d i  h( xi )) 2
hH i 1 2V 2

᳔ৢˈৃҹ‫ݡ‬ϔ⃵ᗑ⬹ᥝϢ h ᮴݇ⱘᐌ᭄˖

m
hML arg min ¦ (d i  h( xi )) 2 (6.6)
hH i 1

䖭ḋˈᓣ 6.6 䇈ᯢњᵕ໻Ԑ✊‫؛‬䆒hMLЎˈՓ䆁㒗ؐdi੠‫؛‬䆒乘⌟ؐh(xi)П䯈ⱘ䇃Ꮒⱘᑇ


ᮍ੠᳔ᇣⱘ䙷ϔϾDŽ䆹㒧䆎ࠡᦤᰃ㾖ᆳⱘ䆁㒗ؐdi⬅ⳳᅲⳂᷛؐࡴϞ䱣ᴎాໄѻ⫳ˈ݊Ё䱣
ᴎాໄᰃҢϔ䳊ഛؐⱘℷᗕߚᏗЁ⣀ゟᢑপⱘDŽҢϞ䴶ⱘ᥼ᇐЁৃᯢ⹂ⳟߎˈ䇃Ꮒᑇᮍ乍
(di-h(xi))2ᰃҢℷᗕߚᏗᅮНЁⱘᣛ᭄乍ЁᕫᴹDŽབᵰ‫؛‬ᅮాໄߚᏗ᳝঺໪ⱘᔶᓣˈৃ䖯㸠㉏
Ԑⱘ᥼ᇐᕫࠄϡৠⱘ㒧ᵰDŽ

⊼ᛣϞ䴶ⱘ᥼ᇐࣙ৿њ䗝ᢽ‫؛‬䆒ՓԐ✊ⱘᇍ᭄ؐ˄lnp(D|h)˅Ў᳔໻ˈҹ⹂ᅮ᳔ৃ㛑ⱘ
‫؛‬䆒DŽབࠡ᠔䗄ˈ䖭ᇐ㟈њϢՓ p(D|h)䖭ϾԐ✊ᗻ᳔໻࣪Ⳍৠⱘ㒧ᵰDŽ䖭ϔ⫼ᇍ᭄Ԑ✊ᗻᴹ
䅵ㅫⱘᮍ⊩೼䆌໮䋱৊ᮃߚᵤЁ䛑⫼ࠄњˈ಴Ўᅗ↨Ⳉ᥹䅵ㅫԐ✊ᗻ䳔㽕ⱘ᭄ᄺ䖤ㅫ䞣ᇣᕜ
໮DŽᔧ✊ˈབࠡ᠔䗄ˈᵕ໻Ԑ✊‫؛‬䆒г䆌ϡᰃ MAP ‫؛‬䆒ˈԚབᵰ᠔᳝‫؛‬䆒᳝Ⳍㄝⱘ‫ܜ‬偠ὖ
⥛ˈϸ㗙ⳌৠDŽ

ЎҔМ⫼ℷᗕߚᏗᴹᦣ䗄ాໄᰃড়⧚ⱘ˛ϔϾᖙ乏ᡓ䅸ⱘॳ಴ᰃЎњ᭄ᄺ䅵ㅫⱘㅔ⋕
ᗻDŽ঺ϔॳ಴ᰃˈ䖭ϔᑇ⒥ⱘ䩳ᔶߚᏗᇍ䆌໮⠽⧚㋏㒳ⱘాໄ䛑ᰃ㡃དⱘ䖥ԐDŽᅲ䰙Ϟˈ㄀
5 ゴ䅼䆎ⱘЁᖗᵕ䰤ᅮᕟᰒ⼎ˈ䎇໳໮ⱘ⣀ゟৠߚᏗ䱣ᴎব䞣ⱘ੠᳡ҢϔℷᗕߚᏗˈ㗠ϡ䆎
⣀ゟব䞣ᴀ䑿ⱘߚᏗᰃҔМDŽ䖭䇈ᯢ⬅䆌໮⣀ゟৠߚᏗⱘ಴㋴ⱘ੠᠔⫳៤ⱘాໄᇚ៤Ўℷᗕ
ߚᏗDŽᔧ✊ˈ೼⦄ᅲЁϡৠⱘߚ䞣ᇍాໄⱘ䋵⤂г䆌ϡᰃৠߚᏗⱘˈ䖭ḋ䆹ᅮ⧚ᇚϡ㛑䆕ᯢ
៥Ӏⱘ䗝ᢽDŽ

Փ䇃Ꮒᑇᮍ᳔ᇣ࣪ⱘᮍ⊩㒣ᐌ㹿⫼Ѣ⼲㒣㔥㒰ǃ᳆㒓ᢳড়ঞ݊Ҫᅲߑ᭄䘐䖥ⱘ䆌໮ㅫ⊩
ЁDŽ㄀ 4 ゴ䅼䆎њẃᑺϟ䰡ᮍ⊩ˈᅗ೼⼲㒣㔥㒰Ё᧰㋶᳔ᇣ䇃Ꮒᑇᮍⱘ‫؛‬䆒DŽ

೼㒧ᴳ䖭䞠݇Ѣᵕ໻Ԑ✊‫؛‬䆒੠᳔ᇣᑇᮍ䇃Ꮒ‫؛‬䆒ⱘ݇㋏ⱘ䅼䆎Пࠡˈᖙ乏䅸䆚ࠄ䆹䯂
乬ḚᶊЁⱘᶤѯ䰤ࠊDŽϞ䴶ⱘߚᵤা㗗㰥њ䆁㒗ḋ՟ⱘⳂᷛؐЁⱘాໄˈ㗠≵᳝㗗㰥ᅲ՟ሲ
ᗻЁⱘాໄDŽ՟བˈབᵰᄺд䯂乬ᰃ෎ѢᶤҎⱘᑈ啘੠催ᑺˈ乘⌟Ҫⱘ䞡䞣ˈ䙷МϞ䴶ⱘߚ
ᵤ㽕∖ˈ䞡䞣ⱘ⌟䞣Ёৃҹ᳝ాໄˈ㗠ᑈ啘੠催ᑺⱘ⌟䞣ᖙ乏ᰃ㊒⹂ⱘDŽབᵰᇚ䖭ѯㅔ࣪‫؛‬
ᅮএᥝˈߚᵤ䖛⿟ᇚकߚ໡ᴖDŽ

6.5 ⭞ӄ人⎁Ᾰ⦽Ⲻᶷཝղ❬‫ٽ‬䇴

೼ࠡϔゴⱘ䯂乬ḚᶊЁˈ៥Ӏ⹂ᅮњᵕ໻Ԑ✊‫؛‬䆒ᰃՓ݊೼䆁㒗ḋ՟Ϟⱘ䇃Ꮒᑇᮍ੠᳔
ᇣⱘ‫؛‬䆒DŽᴀ㡖ᇚ᥼ᇐϔϾ㉏Ԑⱘ‫ˈ߭ޚ‬ᅗ䩜ᇍ⼲㒣㔥㒰ᄺд䖭ḋⱘ䯂乬˖ेᄺд乘⌟ὖ⥛DŽ
㗗㰥䯂乬ⱘḚᶊЎᄺдϔϾϡ⹂ᅮᗻ˄ὖ⥛ⱘ˅ߑ᭄ f˖Xė{0, 1}ˈᅗ᳝ϸϾ⾏ᬷⱘؐ
䕧ߎDŽ՟བˈᅲ՟ぎ䯈 X ҷ㸼᳝ᶤѯ⮛⢊ⱘ⮙ҎˈⳂᷛߑ᭄ f(x)೼⮙Ҏ㛑ᄬ⌏ϟᴹᯊЎ 1ˈ
৺߭Ў 0DŽ៪㗙䇈ˈX ҷ㸼‫׳‬䋻⬇䇋㗙ˈ㸼⼎Ў݊䖛এⱘֵ⫼ग़৆ˈབᵰҪ㛑៤ࡳഄᔦ䖬ϟ
ϔ⃵‫׳‬䌋ˈf(x)Ў 1ˈ৺߭Ў 0DŽ䖭ϸ⾡ᚙ‫މ‬ϟ䛑㽕 f ᳝ϡ⹂ᅮᗻDŽ՟བˈϔ㕸᳝Ⳍৠ⮛⢊ⱘ
⮙ҎЎ 92%ৃҹᄬ⌏ˈ8%ϡ㛑DŽ䖭⾡ϡৃ乘⌟ᗻᴹ⑤Ѣ᳾㛑㾖ᆳࠄⱘ⮛⢊⡍ᕕˈ៪㗙ᰃ⮒
⮙䕀࣪Ё⹂ᅲᄬ೼ⱘϡ⹂ᅮᗻᴎࠊDŽ᮴䆎䯂乬ⱘᴹ⑤ᰃҔМˈ㒧ᵰ䛑ᰃ㽕∖Ⳃᷛߑ᭄ⱘ䕧ߎ
Ў䕧ܹⱘὖ⥛ߑ᭄DŽ

᳝њ䖭ḋⱘ䯂乬ᦣ䗄ˈ៥ӀᏠᳯᄺдᕫࠄⱘ⼲㒣㔥㒰˄៪݊Ҫᅲߑ᭄䘐䖥఼˅ⱘ䕧ߎᰃ
f(x)=1 ⱘὖ⥛DŽᤶ㿔Пˈ䳔㽕ᡒࠄⳂᷛߑ᭄ f´=Xė[0, 1]ˈՓ f´=P(f(x)=1˅
DŽ೼Ϟ䴶ⱘ⮙Ҏᄬ
⌏乘⌟ⱘ՟ᄤЁˈབᵰ x Ўᄬ⌏⥛ᰃ 92%ⱘ⮙ҎПϔˈ䙷М f´(x)=0.92ˈὖ⥛ߑ᭄ f(x)ᇚ᳝
92%ⱘᴎӮㄝѢ 1ˈ࠽ԭⱘ 8%ⱘᴎӮㄝѢ 0DŽ

བԩՓ⫼ϔϾ⼲㒣㔥㒰ᴹᄺд f´˛ϔϾᕜᯢᰒⱘǃ㳂࡯ⱘᮍ⊩ᰃ佪‫ܜ‬ᬊ䲚ᇍ x ⱘ↣Ͼৃ


㛑ؐ㾖ᆳࠄⱘ 1 ੠ 0 ⱘ乥⥛ˈ✊ৢ䆁㒗⼲㒣㔥㒰ˈᇍ↣Ͼ x 䕧ߎⳂᷛ乥⥛DŽϟ䴶ᇚ㾕ࠄˈ៥
ӀৃҹⳈ᥹Ң f ⱘ䆁㒗ḋ՟Ё䆁㒗⼲㒣㔥㒰ˈ㗠Ϩҡ㛑᥼ᇐߎ f´ⱘᵕ໻ৃ㛑ᗻ‫؛‬䆒DŽ

೼ℸᚙ‫މ‬ϟЎᇏᡒᵕ໻Ԑ✊‫؛‬䆒ˈᑨՓ⫼ᗢḋⱘӬ࣪‫˛߭ޚ‬Ўಲㄨ䆹䯂乬佪‫ܜ‬䳔㽕㦋ᕫ
P(D|h)ⱘ㸼⼎DŽ䖭䞠‫؛‬ᅮ䆁㒗᭄᥂DⱘᔶᓣЎD={LJx1ˈd1LjĂLJxmˈdmLj}ˈ݊ЁdiЎ㾖ᆳࠄ
ⱘf(xi)ⱘ 0 ៪ 1 ؐDŽ

ಲᖚࠡϔ㡖Ёⱘᵕ໻Ԑ✊ঞ᳔ᇣ䇃Ꮒᑇᮍߚᵤˈ݊Ёㅔऩഄ‫؛‬ᅮᅲ՟LJx1ˈĂxmLjᰃ೎
ᅮⱘDŽ䖭ḋህৃҹা⫼Ⳃᷛؐdiᴹࠏ⬏᭄᥂DŽ㱑✊䖭䞠гৃҹ԰䖭ḋⱘㅔऩ‫؛‬ᅮˈԚ៥Ӏ䖭
䞠ৃҹ䙓‫ܡ‬䖭ϔ‫؛‬ᅮҹ䇈ᯢ䖭ᇍ᳔ৢⱘ䕧ߎ≵᳝ᕅડDŽᇚxi੠di䛑ⳟ԰䱣ᴎব䞣ˈᑊ‫؛‬ᅮ↣
Ͼ䆁㒗ḋ՟䛑ᰃ⣀ゟᢑপⱘˈৃᡞP(D|h)‫ݭ‬԰˖

m
P ( D | h) – P( x , d
i 1
i i | h) ˄6.7˅

䖯ϔℹഄˈৃҹ‫؛‬ᅮ䘛ࠄ↣ϔ⡍ᅮᅲ՟xiⱘὖ⥛⣀ゟѢ‫؛‬䆒hDŽ՟བˈ䆁㒗᭄᥂䲚Ёࣙ
৿ϔ⡍ᅮ⮙Ҏxiⱘὖ⥛⣀ゟѢ݇Ѣᄬ⌏⥛ⱘ‫؛‬䆒˄㱑✊⮙Ҏⱘᄬ⌏Ϣ৺di⹂ᅲᔎ⚜ձ䌪Ѣh˅
DŽ
ᔧx⣀ゟѢhᯊˈৃᇚϞᓣ䞡‫˄ݭ‬ᑨ⫼㸼 6-1 ⱘЬ⊩㾘߭˅Ў˖

m m
P ( D | h) – P ( x i , d i | h)
i 1
– P(d
i 1
i | h, xi ) P( xi ) ˄6.8˅

⦄೼䅵ㅫ೼‫؛‬䆒h៤ゟⱘᴵӊϟˈᇍϔϾᅲ՟xi㾖ᆳࠄdi=1 ⱘὖ⥛P(di|h, xi˅DŽ⊼ᛣhᰃᇍ


ᑨⳂᷛߑ᭄ⱘ‫؛‬䆒ˈᅗℷད㛑䅵ㅫ䖭ϔὖ⥛DŽ಴ℸˈP(di=1|h, xi˅=h(xi)ˈᑊϨϔ㠀ᚙ‫މ‬ϟ˖

P(di|h, xi)= ˄6.9˅


h(xi) བᵰ di=1
(1-h(xi)) བᵰ di=0
Ўᇚ݊ҷܹࠄᓣ 6.8 Ё∖ P(D|h)ˈ佪‫ܜ‬ᇚ݊㸼䖒Ўϔৃ᭄ᄺ᪡԰ᔶᓣDŽ

P (d i | h, xi ) h( xi ) d i (1  h( xi ))1 di ˄6.10˅
1 d i
ᆍᯧ偠䆕ˈㄝᓣ 6.9 ੠ 6.10 ᰃㄝӋⱘDŽ⊼ᛣᔧdi=1 ᯊˈᓣ 6-10 Ё㄀Ѡ乍 (1  h( xi ))
ㄝѢ 1DŽ಴ℸP(di=1|h, xi˅=h(xi)ˈᅗϢᓣ 6.9 ㄝӋDŽৠḋৃߚᵤdi=0 ᯊⱘᚙᔶDŽ

ᇚᓣ 6.10 ҷᤶᓣ 6.8 ЁⱘP(di|h, xi)ᕫࠄ˖

m
P ( D | h) – h( x )
i 1
i
di
(1  h( xi ))1 d i P ( xi ) ˄6.11˅

⦄‫ߎݭ‬ᵕ໻Ԑ✊‫؛‬䆒ⱘ㸼䖒ᓣ˖

m
hML arg max – h( xi ) d i (1  h( xi ))1 d i P ( xi )
hH i 1

᳔ৢϔ乍Ў⣀ゟѢ h ⱘᐌ䞣ˈৃএᥝ˖

m
hML arg max – h( xi ) di (1  h( xi ))1 di (6.12)
hH i 1

ᓣ 6.12 Ёে䖍ⱘ㸼䖒ᓣৃⳟ԰ᰃ㸼 5-3 ЁѠ乍ߚᏗ˄Binomial distribution˅ⱘϔ㠀࣪ᔶ


ᓣDŽ䆹ᓣᦣ䗄ⱘὖ⥛ⳌᔧѢᡩᦋmϾϡৠ⹀Ꮥˈ䕧ߎᕫࠄLJd1…dmLjⱘὖ⥛ˈ݊Ё‫؛‬ᅮ↣Ͼ
⹀Ꮥxiѻ⫳ℷ䴶ⱘὖ⥛Ўh(xi)DŽ⊼ᛣ㸼 5-3 ᦣ䗄ⱘѠ乍ߚᏗᕜㅔऩˈԚᅗ䰘ࡴњϔϾ‫؛‬ᅮˈ
े᠔᳝⹀Ꮥᦋߎℷ䴶ⱘὖ⥛ᰃⳌৠⱘ˄ेh(xi)=h(xj), i, j˅DŽϸ⾡ᚙ‫މ‬ϟ៥Ӏ䛑‫؛‬ᅮ⹀Ꮥᡩᦋ
ⱘ䕧ߎᰃⳌѦ⣀ゟⱘˈ䖭ϔ‫؛‬䆒г䗖⫼Ѣᔧࠡⱘ䯂乬DŽ

Ϣࠡ䴶ⱘᚙ‫Ⳍމ‬ৠˈབᵰ⫼Ԑ✊ᗻⱘᇍ᭄䅵ㅫӮ↨䕗ᆍᯧˈᕫࠄ˖

m
hML arg max ¦ d i ln h( xi )  (1  d i ) ln(1  h( xi )) ˄6.13˅
hH i 1

ᓣ 6.13 ᦣ䗄њ೼៥Ӏⱘ䯂乬Ёᖙ乏㹿᳔໻࣪ⱘ䞣DŽℸ㒧ᵰৃϢࠡ䴶ⱘՓ䇃Ꮒᑇᮍ᳔ᇣ
࣪ⱘߚᵤⳌ㉏↨DŽ⊼ᛣᓣ 6.13 Ϣ➉ߑ᭄ⱘϔ㠀ᓣ-›ipilogpi˄೼㄀ 3 ゴ䅼䆎䖛˅ⱘⳌԐᗻDŽ
ℷ಴ЎℸⳌԐᗻˈҹϞ䞣ⱘ䋳᳝ؐᯊ㹿⿄ЎѸঝ➉˄cross entropy˅DŽ

6.5.1 ൞⾔㔅㖇㔒ѣụᓜᩒ㍘ԛ䗴ࡦղ❬ᙝᴶཝौ

Ϟ䴶䅼䆎њՓᓣ 6.13 Ёⱘ䞣᳔໻࣪ৃᕫࠄᵕ໻ৃ㛑‫؛‬䆒DŽ⦄⫼ G(h, D)ҷ㸼䆹䞣DŽᴀ㡖


Ў⼲㒣㔥㒰ᄺд᥼ᇐϔϾᴗؐ䆁㒗㾘߭ˈᅗՓ⫼ẃᑺϞछҹՓ G(h, D)᳔໻࣪DŽ

བ㄀ 4 ゴЁⱘ䅼䆎ˈG(h, D)ⱘẃᑺৃ⬅G(h, D) ݇Ѣϡৠⱘ㔥㒰ᴗؐⱘ‫أ‬ᇐⱘ৥䞣㒭ߎˈ


ᅗᅮНњ⬅ℸᄺдࠄⱘ㔥㒰㸼⼎ⱘ‫؛‬䆒h˄㾕㄀ 4 ゴЁẃᑺϟ䰡᧰㋶ⱘϔ㠀䅼䆎ˈҹঞ䖭䞠
᠔Փ⫼ⱘᴃ䇁ⱘ㒚㡖˅DŽ೼ℸᚙ‫މ‬ϟˈᇍᑨѢᴗؐwjk˄Ң䕧ܹkࠄऩ‫ܗ‬j˅ⱘG(h, D)ⱘ‫أ‬ᇐЎ˖

wG (h, D) m
wG (h, D) wh( xi )
ww jk
¦
i 1 wh( xi ) ww jk
m
w (d i ln h( xi )  (1  d i ) ln(1  h( xi ))) wh( xi )
¦
i 1 wh( xi ) ww jk

m
d i  h( x i ) wh( xi )
¦ h( x )(1  h( x ))
i 1 ww jk
˄6.14˅
i i

ЎՓߚᵤ䖛⿟ㅔᯢˈ‫؛‬ᅮ⼲㒣㔥㒰ҢϔϾऩሖⱘ sigmoid ऩ‫ܗ‬ᓎゟDŽ䖭⾡ᚙ‫މ‬ϟ᳝˖

wh( xi )
V c( xi ) xijk h( xi )(1  h( xi )) xijk
wZ jk

݊Ёxijkᰃᇍ㄀iϾḋ՟ⱘࠄऩ‫ ܗ‬jⱘ㄀kϾ䕧ߎˈ㗠³´(x)Ўsigmoid ᣸य़˄squashing˅ߑ


᭄ⱘᇐ᭄˄㾕㄀ 4 ゴ˅DŽ᳔ৢˈᇚℸ㸼䖒ᓣҷܹࠄㄝᓣ 6.14ˈৃᕫࠄ㒘៤ẃᑺⱘᇐ᭄ⱘㅔऩ
㸼⼎˖

wG (h, D) m

ww jk
¦ (d
i 1
i  h( xi )) xijk

಴Ў䳔㽕Փ⫼ P(D|h)᳔໻࣪㗠ϡᰃ᳔ᇣ࣪ˈ᠔ҹ៥Ӏᠻ㸠ẃᑺϞछ᧰㋶㗠ϡᰃẃᑺϟ䰡
᧰㋶DŽ೼᧰㋶ⱘ↣ϔ⃵䗁ҷЁˈᴗؐ৥䞣ᣝẃᑺⱘᮍ৥䇗ᭈˈՓ⫼ᴗؐ᳈ᮄ㾘߭˖

w jk m w jk  'w jk

݊Ё˖

m
'w jk K ¦ (d i  h( xi )) xijk ˄6.15˅
i 1

݊Ё¨ᰃϔᇣⱘℷᐌ䞣ˈ㸼⼎ẃᑺϞछ᧰㋶ⱘℹ䖯໻ᇣDŽ

ᇚ䖭ϔᴗؐ᳈ᮄ㾘߭Ϣড৥Ӵ᪁ㅫ⊩˄݊⫼䗨ᰃՓ乘⌟੠㾖ᆳⱘ㔥㒰䕧ߎⱘ䇃Ꮒᑇᮍ੠
᳔ᇣ࣪˅Ё⫼ࠄⱘᴗؐ᳈ᮄ㾘߭Ⳍ↨䕗ˈৃҹᕫࠄ᳝䍷ⱘ㒧䆎DŽ⫼Ѣ䕧ߎऩ‫ܗ‬ᴗؐⱘড৥Ӵ
᪁᳈ᮄ㾘߭˄㾕㄀ 4 ゴ˅
ˈՓ⫼䖭䞠ⱘ䆄োৃ䞡ᮄ㸼⼎Ў˖

w jk m w jk  'w jk

݊Ё

m
'w jk K ¦ h( xi )(1  h( xi ))(d i  h( xi )) xijk
i 1

⊼ᛣᅗϢᓣ 6.15 Ёⱘ㾘߭ⳌԐˈাᰃ䰸њϔ乍h(xi)(1-h(xi))ˈᅗᰃsigmoidߑ᭄ⱘᇐ᭄DŽ

ὖᣀϔϟˈ䖭ϸϾᴗؐ᳈ᮄ㾘߭೼ϸ⾡ϡৠⱘ䯂乬㚠᱃ϟᬊᬯࠄᵕ໻Ԑ✊‫؛‬䆒DŽՓ䇃Ꮒ
ᑇᮍ᳔ᇣ࣪ⱘ㾘߭ᇏᡒࠄᵕ໻Ԑ✊‫؛‬䆒෎Ѣⱘࠡᦤᰃˈ䆁㒗᭄᥂ৃҹ⬅Ⳃᷛߑ᭄ؐࡴϞℷᗕ
ߚᏗాໄᴹ῵ᢳDŽՓѸঝ➉᳔ᇣ࣪ⱘ㾘߭ᇏᡒᵕ໻Ԑ✊‫؛‬䆒෎Ѣⱘࠡᦤᰃˈ㾖ᆳࠄⱘᏗᇨؐ
Ў䕧ܹᅲ՟ⱘὖ⥛ߑ᭄DŽ

6.6 ᴶቅᨅ䘦䮵ᓜ߼ࡏ

ಲᖚϔϟ㄀ 3 ゴ݇ѢĀ༹ഢൊࠗߔāⱘ䅼䆎ˈ䖭ᰃϔϾᕜᐌ⫼ⱘᔦ㒇‫أ‬㕂ˈᅗৃ㹿ὖᣀ
Ў˖ĀЎ㾖ᆳࠄⱘ᭄᥂䗝ᢽ᳔ⷁⱘ㾷䞞āDŽᴀゴ៥Ӏ㽕䅼䆎೼ᇍ༹ഢൊࠗߔⱘ䭓ᳳѝ䆎Ёⱘ޴
Ͼ䆎⚍DŽ䖭䞠ᇍℸ㒭ߎϔϾ䋱৊ᮃⱘߚᵤˈᑊ䅼䆎ϔ㋻ᆚⳌ݇ⱘ‫⿄ˈ߭ޚ‬Ў᳔ᇣᦣ䗄䭓ᑺ‫ޚ‬
߭˄Minimum Description Length, MDL˅DŽ

ᦤߎ᳔ᇣᦣ䗄䭓ᑺⱘⳂⱘᰃЎњḍ᥂ֵᙃ䆎Ёⱘ෎ᴀὖᗉᴹ㾷䞞hMAPⱘᅮНDŽ‫⃵ݡ‬㗗㰥
Ꮖᕜ❳ᙝⱘhMAPᅮН˖

hMAP arg max P( D | h) P(h)


hH

ৃ㹿ㄝӋഄ㸼⼎ЎՓҹ 2 Ўᑩⱘᇍ᳔᭄໻࣪˖

hMAP arg max log 2 P( D | h)  log 2 P(h)


hH

៪Փℸ᳔ⱘ䋳᳔ؐᇣ࣪˖

hMAP arg min  log 2 P( D | h)  log 2 P(h) ˄6.16˅


hH

ҸҎৗ᚞ⱘᰃˈᓣ 6.16 ৃ㹿㾷䞞Ў೼⡍ᅮⱘ‫؛‬䆒㓪ⷕ㸼⼎ᮍḜϞĀӬ‫ܜ‬䗝ᢽⷁⱘ‫؛‬䆒āDŽ


Ў㾷䞞䖭ϔ⚍ˈ‫ܜ‬ᓩֵܹᙃ䆎ЁⱘϔϾ෎ᴀ㒧䆎DŽ䆒ᛇ㽕Ў䱣ᴎӴ䗕ⱘ⍜ᙃ䆒䅵ϔϾ㓪ⷕˈ
݊Ё䘛ࠄ⍜ᙃiⱘὖ⥛ᰃpiDŽ䖭䞠᳔ᛳ݈䍷ⱘᰃ᳔ㅔⷁⱘ㓪ⷕˈेЎњӴ䕧䱣ᴎֵᙃⱘ㓪ⷕ᠔
㛑ᕫࠄⱘ᳔ᇣᳳᳯӴ䗕ԡ᭄DŽᰒ✊ˈЎՓᳳᳯⱘ㓪ⷕ䭓ᑺ᳔ᇣˈᖙ乏Ўৃ㛑ᗻ䕗໻ⱘ⍜ᙃ䌟
ќ䕗ⷁⱘ㓪ⷕDŽShannon & Weaver˄1949˅䆕ᯢ᳔Ӭ㓪ⷕ˄Փᕫᳳᳯ⍜ᙃ䭓ᑺ᳔ⷁⱘ㓪ⷕ˅
ᇍ⍜ᙃiⱘ㓪ⷕ䭓ᑺЎ-log2piԡDŽ៥ӀᇚՓ⫼ҷⷕCᴹ㓪ⷕ⍜ᙃi᠔䳔ⱘԡ᭄⿄Ў⍜ᙃiⱘ݇ѢC
ⱘᦣ䗄䭓ᑺ˄description length of message i with respect to C˅DŽᷛ䆄ЎLC(i)DŽ

ϟ䴶ᇚՓ⫼ҹϞ㓪ⷕ⧚䆎ⱘ㒧䆎ᴹ㾷䞞ㄝᓣ 6.16˖
x -log2P(h)ᰃ೼‫؛‬䆒ぎ䯈Hⱘ᳔Ӭ㓪ⷕϟhⱘᦣ䗄䭓ᑺDŽᤶ㿔Пˈ䖭ᰃ‫؛‬䆒hՓ⫼݊
᳔Ӭ㸼⼎ᯊⱘ໻ᇣDŽҹ䖭䞠ⱘ䆄োˈLCH(h)= -log2P(h)ˈ݊ЁCHЎ‫؛‬䆒ぎ䯈Hⱘ
᳔Ӭ㓪ⷕDŽ
x -log2P(D|h)ᰃ೼㒭ᅮ‫؛‬䆒hᯊ䆁㒗᭄᥂Dⱘᦣ䗄䭓ᑺ˄೼ℸ᳔Ӭ㓪ⷕϟ˅DŽҹ䖭䞠
ⱘ䆄ো㸼⼎ˈLCD|h(D|h)= -log2P(D|h)ˈ݊Ё˟D|hᰃ‫؛‬ᅮথ䗕㗙੠᥹䗕㗙䛑ⶹ䘧‫؛‬
䆒hᯊᦣ䗄᭄᥂Dⱘ᳔Ӭ㓪ⷕDŽ
x ಴ℸৃᡞᓣ 6.16 䞡‫ˈݭ‬ҹᰒ⼎ߎhMAPᰃՓ‫؛‬䆒ᦣ䗄䭓ᑺ੠㒭ᅮ‫؛‬䆒ϟ᭄᥂ᦣ䗄
䭓ᑺП੠᳔ᇣ࣪ⱘ‫؛‬䆒hDŽ
hMAP arg min LCH (h)  LCD|h ( D | h)
h
݊ЁCH੠CD|hߚ߿ЎHⱘ᳔Ӭ㓪ⷕ੠㒭ᅮhᯊDⱘ᳔Ӭ㓪ⷕˈ᳔ᇣᦣ䗄䭓ᑺ
˄Minimum Description Length, MDL˅‫߭ޚ‬ᓎ䆂ˈᑨ䗝ᢽՓ䖭ϸϾᦣ䗄䭓ᑺⱘ੠
᳔ᇣ࣪ⱘ‫؛‬䆒DŽᔧ✊Ўᑨ⫼ℸ‫ˈ߭ޚ‬೼ᅲ䏉Ёᖙ乏䗝ᢽ䗖ড়Ѣᄺдӏࡵⱘ⡍ᅮ
㓪ⷕ៪㸼⼎DŽ‫؛‬ᅮՓ⫼ҷⷕC1੠C2ᴹ㸼⼎‫؛‬䆒੠㒭ᅮ‫؛‬䆒ϟⱘ᭄᥂ˈৃᇚMDL
‫߭ޚ‬䰜䗄Ў˖

᳔ᇣᦣ䗄䭓ᑺ‫˖߭ޚ‬䗝ᢽhMDLՓ

hMDL arg min LC1 (h)  LC2 ( D | h) ˄6.17˅


hH

Ϟ䴶ⱘߚᵤᰒ⼎ˈབᵰ䗝ᢽC1Ў‫؛‬䆒ⱘ᳔Ӭ㓪ⷕCHˈᑊϨ䗝ᢽC2Ў᳔Ӭ㓪ⷕCD|hˈ䙷М
hMDL=hMAPDŽ

Ⳉ㾝Ϟˈৃᇚ MDL ‫߭ޚ‬ᛇ䈵Ў䗝ᢽ᳔ⷁⱘᮍ⊩ᴹ䞡ᮄ㓪ⷕ䆁㒗᭄᥂ˈ݊Ёϡҙ䅵ㅫ‫؛‬


䆒ⱘ໻ᇣˈᑊϨ䅵ㅫ㒭ᅮ‫؛‬䆒ᯊ㓪ⷕ᭄᥂ⱘ䰘ࡴᓔ䫔DŽ

В՟䇈ᯢˈ‫؛‬ᅮᇚMDL‫߭ޚ‬ᑨ⫼ࠄ‫އ‬ㄪᷥᄺдⱘ䯂乬ᔧЁDŽᗢḋ䗝ᢽ‫؛‬䆒੠᭄᥂ⱘ㸼
⼎C1੠C2˛ᇍѢC1ˈৃҹᕜ㞾✊ഄ䗝ᢽᶤ⾡ᯢ⹂ⱘ‫އ‬ㄪᷥ㓪ⷕᮍ⊩ˈ݊Ёᦣ䗄䭓ᑺ䱣ⴔᷥЁ
㡖⚍੠䖍ⱘ๲䭓㗠๲ࡴDŽབԩ䗝ᢽ㒭ᅮϔ‫އ‬ㄪᷥᯊ‫؛‬䆒ⱘ᭄᥂㓪ⷕC2ਸ਼˛ЎՓ䅼䆎ㅔऩ࣪ˈ
‫؛‬ᅮᅲ՟ᑣ߫LJx1…xmLjᰃ᥹ᬊ㗙੠থ䗕㗙䛑ⶹ䘧ⱘˈ䙷МৃҹাӴ䕧ߚ㉏㒧ᵰLJf(x1)…f(xm)LjDŽ
˄⊼ᛣӴ䗕ᅲ՟ⱘᓔ䫔⣀ゟѢℷ⹂ⱘ‫؛‬䆒ˈ಴ℸᅗϡӮᕅડࠄhMDLⱘ䗝ᢽDŽ˅⦄೼ˈབᵰ䆁
㒗ߚ㉏LJf(x1)…f(xm)LjϢ‫؛‬䆒ⱘ乘䅵Ⳍㄝˈ䙷Мህ≵ᖙ㽕Ӵ䕧᳝݇䖭ѯḋ՟ⱘӏԩֵᙃ˄᥹
ᬊ㗙ৃ೼݊ᬊࠄ‫؛‬䆒ৢ䅵ㅫ䖭ѯؐ˅DŽ಴ℸ೼ℸᚙ‫މ‬ϟˈ㒭ᅮ‫؛‬䆒ⱘߚ㉏ᚙ‫މ‬ᯊⱘᦣ䗄䭓ᑺ
Ў 0DŽབᵰᶤѯḋ՟㹿h䇃ߚ㉏ˈ䙷Мᇍ↣ϔ䇃ߚ㉏䳔㽕Ӵ䗕ϔϾ⍜ᙃҹ⹂ᅮાϾḋ՟㹿䇃
ߚ㉏њ˄ৃ⫼㟇໮log2mԡӴ䗕˅ˈᑊӴ䗕݊ℷ⹂ߚ㉏ؐ˄ৃ⫼㟇໮log2kԡˈ݊ЁkЎৃ㛑ߚ
㉏ؐⱘ᭄Ⳃ˅ DŽ೼㓪ⷕC1੠C2ϟhMDL䖭ϔ‫؛‬䆒ህᰃՓ䖭ѯᦣ䗄䭓ᑺ੠᳔ᇣⱘ‫؛‬䆒DŽ

಴ℸˈMDL ‫ᦤ߭ޚ‬կњϔ⾡ᮍ⊩ҹ೼‫؛‬䆒ⱘ໡ᴖᗻ੠‫؛‬䆒ѻ⫳䫭䇃ⱘ᭄䞣П䯈䖯㸠ᡬ
Ёˈᅗ᳝ৃ㛑䗝ᢽϔϾѻ⫳ᇥ䞣䫭䇃䕗ⷁⱘ‫؛‬䆒˗㗠ϡᰃ㛑ᅠ㕢ഄߚ㉏䆁㒗᭄᥂ⱘ䭓ⱘ‫؛‬䆒DŽ
ⳟࠄ䖭ϔ⚍ˈህ᳝њϔ⾡໘⧚᭄᥂䖛ᑺᢳড়ⱘᮍ⊩DŽ

Quinlan & Rivest˄1989˅ᦣ䗄њᑨ⫼ MDL ‫߭ޚ‬ҹ䗝ᢽ‫އ‬ㄪ᳔ᷥՇ໻ᇣⱘ޴Ͼᅲ偠DŽ᡹


ਞᣛߎ෎Ѣ MDL ⱘᮍ⊩ѻ⫳ⱘ‫އ‬ㄪᷥⱘ㊒ᑺⳌᔧѢ㄀ 3 ゴЁ䅼䆎ⱘᷛ‫ⱘޚ‬ׂᷥ࠾ᮍ⊩DŽ
Mehta et al.˄1995˅ᦣ䗄њ঺ϔϾ෎Ѣ MDL ⱘᮍ⊩䖯㸠‫އ‬ㄪׂᷥ࠾ˈᑊᅲ偠䆕ᯢ䆹ᮍ⊩ᕫ
ࠄⱘ㒧ᵰϢᷛ‫ޚ‬ׂᷥ࠾ᮍ⊩ⳌᔧDŽ

Ң᳔ᇣᦣ䗄䭓ᑺⱘॳ߭ⱘߚᵤЁৃᕫࠄҔМ㒧䆎˛ᰃ৺䇈ᯢ᠔᳝ᚙ‫މ‬ϟⷁ‫؛‬䆒䛑᳔
ད˛㒧䆎ᰃ৺ᅮⱘDŽᏆ㒣䆕ᯢⱘাᰃˈᔧ䗝ᅮ‫؛‬䆒㸼⼎ҹՓ‫؛‬䆒hⱘ໻ᇣЎ-log2P(h)ˈᑊϨ
䗝ᢽ՟໪ᚙ‫ⱘމ‬㸼⼎ҹՓ㒭ᅮhϟDⱘ㓪ⷕ䭓ᑺㄝѢ-log2P(D|h)ᯊˈMDL‫߭ޚ‬ѻ⫳MAP‫؛‬䆒DŽ
✊㗠Ў䇈ᯢҹϞϸ㗙ৃҹབℸ㸼⼎ˈᖙ乏ⶹ䘧᠔᳝ⱘ‫ܜ‬偠ὖ⥛P(h)ˈҹঞP(D|h)DŽ≵᳝⧚⬅
ⳌֵMDL‫؛‬䆒ᇍѢӏᛣ㓪ⷕC1੠C2䛑ᰃ᳔དⱘDŽߎѢᅲ䰙ⱘ㗗㰥ˈ᳈ᆍᯧⱘࡲ⊩ᰃ⬅䆒䅵
㗙ᣛᅮϔϾ㸼⼎ˈҹᤩ㦋᳝݇‫؛‬䆒ὖ⥛ⱘⶹ䆚ˈ㗠ϡᰃᅠᭈഄᣛᅮ↣Ͼ‫؛‬䆒ⱘὖ⥛DŽᄺᴃ⬠
ᇍMDLᑨ⫼ࠄᅲ䰙䯂乬ⱘѝ䆎ˈЏ㽕Ў䗝ᢽC1੠C2㓪ⷕᦤկᶤ⾡ᔶᓣⱘ䆎䆕DŽ

6.7 䍓ਬᯥᴶՎ࠼㊱ಞ

䖘Ҟ៥ӀᏆ䅼䆎њ䯂乬Ā㒭ᅮ䆁㒗᭄᥂ˈ᳔ৃ㛑ⱘ‫؛‬䆒ᰃҔМ˛āᅲ䰙Ϟˈ䆹䯂乬䗮ᐌ
Ϣ঺ϔ᳈᳝ᛣНⱘ䯂乬㋻ᆚⳌ݇˖Ā㒭ᅮ䆁㒗᭄᥂ˈᇍᮄᅲ՟ⱘ᳔ৃ㛑ߚ㉏ᰃҔМ˛ā㱑✊
ৃⳟߎ㄀ѠϾ䯂乬ৃㅔऩഄ⬅ᑨ⫼ MAP ‫؛‬䆒ࠄᮄᅲ՟ᴹᕫࠄˈᅲ䰙Ϟ䖬ৃ㛑᳈དⱘㅫ⊩DŽ
Ўњ᳈Ⳉ㾖ѯˈ㗗㰥ϔࣙ৿ϝϾ‫؛‬䆒h1ˈh2ˈh3ⱘ‫؛‬䆒ぎ䯈DŽ‫؛‬ᅮᏆⶹ䆁㒗᭄᥂ᯊϝϾ
‫؛‬䆒ⱘৢ偠ὖ⥛ߚ߿Ў 0.4ˈ0.3ˈ0.3DŽ಴ℸˈh1ЎMAP‫؛‬䆒DŽ㢹ϔᮄᅲ՟x㹿h1ߚ㉏Ўℷˈ
Ԛ㹿h2੠h3ߚ㉏ЎডDŽ䅵ㅫ᠔᳝‫؛‬䆒ˈxЎℷ՟ⱘὖ⥛Ў 0.4˄ेϢh1Ⳍ㘨㋏ⱘὖ⥛˅ˈ㗠Ўড
՟ⱘὖ⥛ᰃ 0.6DŽ䖭ᯊ᳔ৃ㛑ⱘߚ㉏˄ড՟ ˅ϢMAP‫؛‬䆒⫳៤ⱘߚ㉏ϡৠDŽ

ϔ㠀ⱘ䇈ˈᮄᅲ՟ⱘ᳔ৃ㛑ߚ㉏ৃ䗮䖛ড়ᑊ᠔᳝‫؛‬䆒ⱘ乘⌟ᕫࠄˈ݊ᴗ䞡ЎᅗӀⱘৢ偠
ὖ⥛DŽབᵰᮄⱘḋ՟ⱘৃ㛑ⱘߚ㉏ৃপᶤ䲚ড়VЁⱘӏϔؐvjˈ䙷Мὖ⥛P(vj|D)Ўᮄᅲ՟ℷ
⹂ߚ㉏Ўvjⱘὖ⥛ˈ݊ؐЎ˖

P (v j | D ) ¦ P (v
hi H
j | hi ) P (hi | D)

ᮄᅲ՟ⱘ᳔Ӭߚ㉏ЎP(vj|D)Ў᳔໻ᯊⱘvjؐDŽ

䋱৊ᮃ᳔Ӭߚ㉏఼

arg max ¦ P(v j | hi ) P(hi | D) ˄6.18˅


v j V hi H

⫼Ϟ䴶ⱘ՟ᄤ䇈ᯢˈᮄᅲ՟ⱘৃ㛑ߚ㉏䲚ড়Ў V={†,}ˈ㗠

P(h1|D)=0.4, P(|h1)=0, P(†|h1)=1

P(h2|D)=0.3, P(|h2)=1, P(†|h2)=0

P(h3|D)=0.3, P(|h3)=1, P(†|h3)=0

಴ℸ

¦ P († | h ) P ( h
hi H
i i | D) 0.4

¦ P (4 | h ) P ( h
hi H
i i | D) 0.6

ᑊϨ

arg max ¦ P(v j | hi ) P(hi | D) 4


v j {† ,4} h H
i

ᣝ✻ᓣ 6.18 ߚ㉏ᮄᅲ՟ⱘ㋏㒳㹿Ў䋱৊ᮃ᳔Ӭߚ㉏఼˄Bayes optimal classifier˅ˈ៪䋱


৊ᮃ᳔Ӭᄺд఼DŽՓ⫼Ⳍৠⱘ‫؛‬䆒ぎ䯈੠Ⳍৠⱘ‫ܜ‬偠ὖ⥛ˈ≵᳝݊Ҫᮍ⊩㛑↨݊ᑇഛᗻ㛑᳈
དDŽ䆹ᮍ⊩೼㒭ᅮৃ⫼᭄᥂ǃ‫؛‬䆒ぎ䯈ঞ䖭ѯ‫؛‬䆒ⱘ‫ܜ‬偠ὖ⥛ϟՓᮄᅲ՟ⱘℷ⹂ߚ㉏ⱘৃ㛑
ᗻ䖒ࠄ᳔໻DŽ

՟བˈ೼Ꮧᇨὖᗉᄺд䯂乬ЁˈՓ⫼ࠡ䴶ゴ㡖ⱘবൟぎ䯈ᮍ⊩ˈᇍϔᮄᅲ՟ⱘ䋱৊ᮃ᳔
Ӭߚ㉏ᰃ೼বൟぎ䯈ⱘ᠔᳝៤ਬЁ䖯㸠ࡴᴗ䗝В㦋ᕫⱘˈ↣Ͼ‫׭‬䗝‫؛‬䆒ⱘᴗ䞡Ў݊ৢ偠ὖ
⥛DŽ
䋱৊ᮃ᳔Ӭߚ㉏఼ⱘϔϾᵕ᳝䍷ⱘሲᗻᰃˈᅗ᠔‫ৃ㉏ߚⱘخ‬ҹᇍᑨѢ H Ёϡᄬ೼ⱘ‫؛‬
䆒DŽ䆒ᛇՓ⫼ᓣ 6.18 ᴹߚ㉏ X Ё↣Ͼᅲ՟DŽᣝℸᅮНⱘⱘᅲ՟ᷛ⊼ϡᖙᇍᑨѢ H Ёⱘӏϔ
ऩϾ‫؛‬䆒 h ⱘᇍᅲ՟ⱘᷛ⊼DŽ⧚㾷䆹ੑ乬ⱘϔ⾡ᮍ⊩ᰃᇚ䋱৊ᮃߚ㉏఼ⳟ៤ᰃϡৠѢ‫؛‬䆒ぎ
䯈 H ⱘ঺ϔぎ䯈 H´ˈ೼݊Ϟᑨ⫼䋱৊ᮃ݀ᓣDŽ⹂ߛഄ䆆ˈH´᳝ᬜഄࣙ৿њϔ㒘‫؛‬䆒ˈᅗ㛑
೼ H Ё໮Ͼ‫؛‬䆒ⱘ㒓ᗻ㒘ড়᠔԰ⱘ乘㿔Ё䖯㸠↨䕗DŽ

6.8 Gibbs ㇍⌋

㱑✊䋱৊ᮃ᳔Ӭߚ㉏఼㛑Ң㒭ᅮ䆁㒗᭄᥂Ё㦋ᕫ᳔དⱘᗻ㛑ˈᑨ⫼ℸㅫ⊩ⱘᓔ䫔ৃ㛑ᕜ
໻DŽॳ಴೼Ѣᅗ㽕䅵ㅫ H Ё↣Ͼ‫؛‬䆒ⱘৢ偠ὖ⥛ˈ✊ৢড়ᑊ↣Ͼ‫؛‬䆒ⱘ乘⌟ˈҹߚ㉏ᮄᅲ
՟DŽ

ϔϾ᳓ҷⱘǃ䴲᳔Ӭⱘᮍ⊩ᰃ Gibbs˄㾕 Opper & Haussler 1991˅ˈᅮНབϟ˖

1ˊᣝ✻ H Ϟⱘৢ偠ὖ⥛ߚᏗˈҢ H Ё䱣ᴎ䗝ᢽ‫؛‬䆒 hDŽ

2ˊՓ⫼ h ᴹ乘㿔ϟϔᅲ՟ x ⱘߚ㉏DŽ

ᔧ᳝ϔᕙߚ㉏ᮄᅲ՟ᯊˈGibbs ㅫ⊩ㅔऩഄᣝ✻ᔧࠡⱘৢ偠ὖ⥛ߚᏗˈՓ⫼ϔ䱣ᴎᢑপ
ⱘ‫؛‬䆒DŽҸҎৗ᚞ⱘᰃˈৃ䆕ᯢ೼ϔᅮᴵӊϟ Gibbs ㅫ⊩ⱘ䇃ߚ㉏⥛ⱘᳳᳯ᳔ؐ໮Ў䋱৊ᮃ
᳔Ӭߚ㉏఼ⱘϸ‫˄ס‬Haussher et al. 1994˅DŽ᳈㊒⹂ഄ䆆ˈᳳᳯؐᰃ೼䱣ᴎᢑপⱘⳂᷛὖᗉϞ
԰ߎˈᢑপ䖛⿟ᣝ✻ᄺд఼‫؛‬ᅮⱘ‫ܜ‬偠ὖ⥛DŽ೼ℸᴵӊϟˈGibbs ㅫ⊩ⱘ䫭䇃⥛ᳳᳯ᳔ؐᏂ
Ў䋱৊ᮃߚ㉏఼ⱘϸ‫ס‬DŽ

䆹㒧䆎ᇍࠡ䗄ⱘὖᗉᄺд䯂乬᳝ϔ᳝䍷ⱘਃ⼎DŽेབᵰᄺд఼‫؛‬ᅮ H Ϟ᳝ഛࣔⱘ‫ܜ‬偠
ὖ⥛ˈ㗠ϨབᵰⳂᷛὖᗉᅲ䰙Ϟгᣝ䆹ߚᏗᢑপˈ䙷Мᔧࠡবൟぎ䯈Ё䱣ᴎᢑপⱘ‫؛‬䆒ᇍϟ
ϔᅲ՟ߚ㉏ⱘᳳᳯ䇃Ꮒ᳔໮Ў䋱৊ᮃߚ㉏఼ⱘϸ‫ס‬DŽ䖭䞠জ᳝њϔϾ՟ᄤ䇈ᯢ䋱৊ᮃߚᵤৃ
ҹᇍϔ䴲䋱৊ᮃㅫ⊩ⱘᗻ㛑䖯㸠䆘ԄDŽ

6.9 ᵪ㍖䍓ਬᯥ࠼㊱ಞ

䋱৊ᮃᄺдᮍ⊩Ёᅲ⫼ᗻᕜ催ⱘϔ⾡Ўᴈ㋴䋱৊ᮃᄺд఼ˈᐌ㹿⿄Ўᴈ㋴䋱৊ᮃߚ㉏఼
˄naive Bayes classifier˅
DŽ೼ᶤѯ乚ඳ‫݊ݙ‬ᗻ㛑ৃϢ⼲㒣㔥㒰੠‫އ‬ㄪᷥᄺдⳌᔧDŽᴀ㡖ҟ㒡
ᴈ㋴䋱৊ᮃߚ㉏఼ˈϟϔ㡖ᇚ݊ᑨ⫼Ѣᅲ䰙ⱘ䯂乬ˈे㞾✊䇁㿔᭛ᴀ᭛ḷⱘߚ㉏䯂乬DŽ

ᴈ㋴䋱৊ᮃߚ㉏఼ᑨ⫼ⱘᄺдӏࡵЁˈ↣Ͼᅲ՟xৃ⬅ሲᗻؐⱘড়পᦣ䗄ˈ㗠Ⳃᷛߑ᭄
f(x)Ңᶤ᳝䰤䲚ড়VЁপؐDŽᄺд఼㹿ᦤկϔ㋏߫݇ѢⳂᷛߑ᭄ⱘ䆁㒗ḋ՟ˈҹঞᮄᅲ՟˄ᦣ
䗄Ўሲᗻؐⱘ‫ܗ‬㒘˅<a1,a2…an>ˈ✊ৢ㽕∖乘⌟ᮄᅲ՟ⱘⳂᷛؐ˄៪ߚ㉏˅DŽ

䋱৊ᮃᮍ⊩ⱘᮄᅲ՟ߚ㉏Ⳃᷛᰃ೼㒭ᅮᦣ䗄ᅲ՟ⱘሲᗻؐ<a1,a2…an>ϟˈᕫࠄ᳔ৃ㛑ⱘ
ⳂᷛؐVMAPDŽ

v MAP arg max P(v j | a1 , a 2 ...a n )


v j V

ৃՓ⫼䋱৊ᮃ݀ᓣᇚℸ㸼䖒ᓣ䞡‫ݭ‬Ў
P(a1 , a 2 ...a n | v j ) P(v j )
v MAP arg max
v j V P(a1 , a 2 ...a n )

arg max P(a1 , a 2 ...a n | v j ) P(v j ) ˄6.19˅


v j V

⦄೼㽕‫ⱘخ‬ᰃ෎Ѣ䆁㒗᭄᥂Ԅ䅵ᓣ 6.19 ЁϸϾ᭄᥂乍ⱘؐDŽԄ䅵↣ϾP(vj)ᕜᆍᯧˈা


㽕䅵ㅫ↣ϾⳂᷛؐvjߎ⦄೼䆁㒗᭄᥂Ёⱘ乥⥛ህৃҹDŽ✊㗠ˈ䰸䴲᳝ϔ䴲ᐌ໻ⱘ䆁㒗᭄᥂ⱘ
䲚ড়ˈ৺߭⫼䖭ḋᮍ⊩Ԅ䅵ϡৠⱘ P(a1,a2…an|vj)乍ϡ໾ৃ㸠DŽ䯂乬೼Ѣ䖭ѯ乍ⱘ᭄䞣ㄝѢ
ৃ㛑ᅲ՟ⱘ᭄䞣Ьҹৃ㛑Ⳃᷛؐⱘ᭄䞣DŽ಴ℸЎ㦋ᕫড়⧚ⱘԄ䅵ˈᅲ՟ぎ䯈Ё↣Ͼᅲ՟ᖙ乏
ߎ⦄໮⃵DŽ

ᴈ㋴䋱৊ᮃߚ㉏఼෎ѢϔϾㅔऩⱘ‫؛‬ᅮ˖೼㒭ᅮⳂᷛؐᯊሲᗻؐП䯈ⳌѦᴵӊ⣀ゟDŽᤶ
㿔Пˈ䆹‫؛‬ᅮ䇈ᯢ㒭ᅮᅲ՟ⱘⳂᷛؐᚙ‫މ‬ϟˈ㾖ᆳࠄ㘨ড়ⱘa1, a2…anⱘὖ⥛ℷདᰃᇍ↣Ͼऩ
⣀ሲᗻⱘὖ⥛Ь⿃˖

P (a1 , a 2 ...a n | v j ) – P (a
i i | vj)

ᇚ݊ҷܹ 6.19 ᓣЁˈৃᕫࠄᴈ㋴䋱৊ᮃߚ㉏఼᠔Փ⫼ⱘᮍ⊩˖

ᴈ㋴䋱৊ᮃߚ㉏఼˖

v NB arg max P(v j )–i P(ai | v j ) ˄6.20˅


v j V

݊ЁvNB㸼⼎ᴈ㋴䋱৊ᮃߚ㉏఼䕧ߎⱘⳂᷛؐDŽ⊼ᛣ೼ᴈ㋴䋱৊ᮃߚ㉏఼Ёˈ乏Ң䆁㒗
᭄᥂ЁԄ䅵ⱘϡৠP(ai|vj)乍ⱘ᭄䞣াᰃϡৠⱘሲᗻ᭄ؐ䞣ЬҹϡৠⳂ᭄ᷛؐ䞣üü䖭↨㽕
Ԅ䅵P(a1,a2…an|vj)乍᠔䳔ⱘ䞣ᇣᕫ໮DŽ

ὖᣀഄ䆆ˈᴈ㋴䋱৊ᮃᄺдᮍ⊩䳔㽕Ԅ䅵ϡৠⱘP(vj)੠P(ai|vj)乍ˈ෎ѢᅗӀ೼䆁㒗᭄᥂
Ϟⱘ乥⥛DŽ䖭ѯԄ䅵ᇍᑨњᕙᄺдⱘ‫؛‬䆒DŽ✊ৢ䆹‫؛‬䆒Փ⫼ᓣ 6.20 Ёⱘ㾘߭ᴹߚ㉏ᮄᅲ՟DŽ
া㽕᠔䳔ⱘᴵӊ⣀ゟᗻ㛑໳㹿⒵䎇ˈᴈ㋴䋱৊ᮃߚ㉏vNBㄝѢMAPߚ㉏DŽ

ᴈ㋴䋱৊ᮃᄺдᮍ⊩੠݊ҪᏆҟ㒡ⱘᄺдᮍ⊩П䯈᳝ϔ᳝䍷ⱘᏂ߿˖≵᳝ᯢ⹂ⱘ᧰㋶‫؛‬
䆒ぎ䯈ⱘ䖛⿟˄䖭䞠ˈৃ㛑‫؛‬䆒ⱘぎ䯈Ўৃ㹿䌟ќϡৠⱘP(vj)੠P(ai|vj)乍ⱘৃ㛑ؐDŽⳌডˈ
‫؛‬䆒ⱘᔶ៤ϡ䳔㽕᧰㋶ˈাᰃㅔऩഄ䅵ㅫ䆁㒗ḋ՟Ёϡৠ᭄᥂㒘ড়ⱘߎ⦄乥⥛˅DŽ

6.9.1 ⽰ׁ

⦄ᇚᴈ㋴䋱৊ᮃߚ㉏఼ᑨ⫼ࠄࠡ䴶‫އ‬ㄪᷥЁ䅼䆎䖛ⱘὖᗉᄺд䯂乬˖ᣝ✻ᶤҎᰃ৺㽕ᠧ
㔥⧗ᴹߦߚ໽⇨DŽ㄀ 3 ゴⱘ㸼 3-2 ᦤկњⳂᷛὖᗉ PlayTennis ⱘ 14 Ͼ䆁㒗ḋ՟ˈ݊Ё↣ϔ
໽⬅ሲᗻ Outlook, Temprature, Humidity ੠ Wind ᴹᦣ䗄DŽ䖭䞠៥ӀՓ⫼ℸ㸼Ёⱘ᭄᥂㒧ড়
ᴈ㋴䋱৊ᮃߚ㉏఼ᴹߚ㉏ϟ䴶ⱘᮄᅲ՟˖

<Outlook=sunny, Temperature=cool, Humidity=high, Wind=strong>

៥Ӏⱘӏࡵᰃᇍℸᮄᅲ՟乘⌟ⳂᷛὖᗉPlayTennis ⱘⳂᷛؐ˄yes ៪no˅


DŽᇚᓣ 6.20 ᑨ
⫼ࠄᔧࠡⱘӏࡵˈⳂᷛؐvNB ⬅ϟᓣ㒭ߎ˖

v NB arg max P(v j )–i P(ai | v j )


v j { yes , no}

arg max P(v j ) P(Outlook sunny | v j ) P(Temperature cool | v j )


v j { yes , no}
˄6.21˅
P ( Humidity high | v j ) P(Wind strong | v j )

⊼ᛣ೼᳔ৢϔϾ㸼䖒ᓣЁaiᏆ㒣⫼ᮄᅲ՟ⱘ⡍ᅮሲᗻؐᅲ՟࣪њDŽЎ䅵ㅫvNBˈ⦄೼䳔㽕
10 Ͼὖ⥛ˈᅗӀ䛑ৃҹ䆁㒗᭄᥂ЁԄ䅵ߎDŽ佪‫ܜ‬ϡৠⳂᷛؐⱘὖ⥛ৃҹ෎Ѣ䖭 14 Ͼ䆁㒗ḋ
՟ⱘ乥⥛ᕜᆍᯧഄԄ䅵ߎ˖

P(PlayTennis=yes)=9/14=0.64

P(PlayTennis=no)=5/14=0.36

ⳌԐഄˈৃҹԄ䅵ߎᴵӊὖ⥛ˈ՟བᇍѢ Wind=Strong ᳝˖

P(Wind=strong|PlayTennis=yes)=3/9=0.33

P(Wind=strong|PlayTennis=no)=3/5=0.60

Փ⫼䖭ѯὖ⥛Ԅ䅵ҹঞⳌԐⱘᇍ࠽ԭሲᗻⱘԄ䅵ˈৃᣝ✻ᓣ 6.21 䅵ㅫvNBབϟ˄Ўㅔᯢ


䍋㾕ᗑ⬹њሲᗻৡ˅DŽ

P(yes)P(sunny|yes)P(cool|yes)P(high|yes)P(strong|yes)=0.0053

P(no)P(sunny|no)P(cool|no)P(high|no)P(strong|no)=0.0206

䖭ḋˈ෎ѢҢ䆁㒗᭄᥂Ёᄺдࠄⱘὖ⥛Ԅ䅵ˈᴈ㋴䋱৊ᮃߚ㉏఼ᇚℸᅲ՟䌟ҹⳂᷛؐ
PlayTennis= no DŽ᳈䖯ϔℹˈ䗮䖛ᇚϞ䗄ⱘ䞣ᔦϔ࣪ˈৃ䅵ㅫ㒭ᅮ㾖ᆳؐϟⳂᷛؐЎ no ⱘ
ᴵӊὖ⥛DŽᇍѢℸ՟ˈὖ⥛Ў 0.0206/(0.0206+0.0053)=0.795DŽ

6.9.1.1 զ䇗Ᾰ⦽

㟇ℸˈ៥Ӏ䗮䖛೼ܼ䚼џӊ෎⸔Ϟ㾖ᆳᶤџӊߎ⦄ⱘ↨՟ᴹԄ䅵ὖ⥛DŽ՟བˈ೼Ϟ՟Ёˈ
Ԅ䅵P(Wind=Strong|PlayTennis=no)Փ⫼ⱘᰃ↨ؐnc/nˈ݊Ёn=5ˈЎ᠔᳝PlayTennis= no ⱘ䆁
㒗ḋ՟᭄Ⳃˈ㗠nc=3 ᰃ೼݊ЁWind=Strong ⱘ᭄ⳂDŽ

ᰒ✊໮᭄ᚙ‫މ‬ϟˈ㾖ᆳࠄⱘ↨՟ᰃᇍὖ⥛ⱘϔϾ㡃དԄ䅵ˈԚᔧncᕜᇣᯊԄ䅵䛑䕗ᏂDŽ
䲒ᑺ೼Ѣˈ䆒ᛇP(Wind=Strong|PlayTennis= no)ⱘؐЎ 0.08ˈ㗠ḋᴀЁা᳝ 5 Ͼḋ՟ⱘ
PlayTennis=noDŽ䙷МᇍѢnc᳔ৃ㛑ⱘؐা᳝ 0DŽ䖭ѻ⫳њϸϾ䲒乬ˈ佪‫ˈܜ‬nc/nѻ⫳њϔϾ
᳝‫ⱘأ‬䖛ԢԄ䅵˄underestimate˅ὖ⥛DŽ݊⃵ˈᔧℸὖ⥛Ԅ䅵Ў 0 ᯊˈབᵰᇚᴹⱘᶹ䆶ࣙ৿
Wind=Strongˈℸὖ⥛乍Ӯ೼䋱৊ᮃߚ㉏఼ऴ᳝㒳⊏ഄԡDŽॳ಴೼Ѣˈ⬅ᓣ 6.20 䅵ㅫⱘ䞣䳔
㽕ᇚ᠔᳝݊Ҫⱘὖ⥛乍Ьҹℸ 0 ؐDŽ

Ў䙓‫ܡ‬䖭ѯ䲒乬ˈ䖭䞠䞛⫼ϔ⾡Ԅ䅵ὖ⥛ⱘ䋱৊ᮃᮍ⊩ˈՓ⫼བϟᅮНⱘ m-Ԅ䅵˖
ὖ⥛ⱘ m-Ԅ䅵

nc  mp
˄6.22˅
nm

䖭䞠ˈnc੠nབࠡ䴶ᅮНˈpᰃᇚ㽕⹂ᅮⱘὖ⥛ⱘ‫ܜ‬偠Ԅ䅵ˈ㗠mᰃϔ⿄Ўㄝᬜḋᴀ໻ᇣ
ⱘᐌ䞣ˈᅗ⹂ᅮњᇍѢ㾖ᆳࠄⱘ᭄᥂བԩ㸵䞣pⱘ԰⫼DŽ೼㔎ᇥ݊Ҫֵᙃᯊ䗝ᢽpⱘϔ⾡‫݌‬ൟ
ⱘᮍ⊩ᰃ‫؛‬ᅮഛࣔⱘ‫ܜ‬偠ὖ⥛ˈгህᰃˈབᵰᶤሲᗻ᳝kϾৃ㛑ؐˈ䙷М䆒㕂p=1/kDŽ՟བˈ
ˈ⊼ᛣࠄሲᗻWind᳝ϸϾৃ㛑ؐˈ಴ℸഛࣔⱘ‫ܜ‬偠ὖ
ЎԄ䅵˄Wind=Strong|PlayTennis= no˅
⥛Ўp=0.5DŽ⊼ᛣབᵰmЎ 0ˈm-Ԅ䅵ㄝᬜѢㅔऩⱘ↨՟nc/nDŽབᵰn੠m䛑䴲 0ˈ䙷М㾖ᆳࠄ
ⱘ↨՟nc/n੠‫ܜ‬偠ὖ⥛pৃᣝ✻ᴗ䞡mড়ᑊDŽm㹿⿄Ўㄝᬜḋᴀ໻ᇣⱘॳ಴ᰃˈᓣ 6.22 ৃ㹿㾷
䞞ЎᇚnϾᅲ䰙ⱘ㾖ᆳᠽ໻ˈࡴϞmϾᣝpߚᏗⱘ㰮ᢳḋᴀDŽ

6.10 ⽰ׁφᆜҖ࠼㊱ᮽᵢ

Ўⓨ⼎䋱৊ᮃᄺдᮍ⊩೼ᅲ䏉Ϟⱘ䞡㽕ᗻˈ㗗㰥ϔϾᄺд䯂乬ˈ݊Ёⱘᅲ՟䛑Ў᭛ᴀ᭛
ḷDŽ՟བˈ㽕ᄺдⳂᷛὖᗉ˖Ā៥ᛳ݈䍷ⱘ⬉ᄤᮄ䯏〓ā៪Ā䅼䆎ᴎ఼ᄺдⱘϛ㓈㔥义ā
DŽ೼
䖭ϸ⾡ᚙ‫މ‬ϟˈབᵰ䅵ㅫᴎৃҹ㊒⹂ഄᄺдࠄⳂᷛὖᗉˈህৃҢ໻䞣೼㒓᭛ᴀ᭛ḷЁ㞾ࡼ䖛
Ⓒߎ᳔Ⳍ݇ⱘ᭛ḷᰒ⼎㒭䇏㗙DŽ

䖭䞠ᦣ䗄њϔϾ෎Ѣᴈ㋴䋱৊ᮃߚ㉏఼ⱘ᭛ᴀߚ㉏ⱘ䗮⫼ㅫ⊩DŽ᳝䍷ⱘᰃˈ䖭ḋⱘὖ⥛
ᮍ⊩ᰃⳂࠡ᠔ⶹ᭛ᴀ᭛ḷߚ㉏ㅫ⊩Ёⱘ᳔᳝ᬜⱘϔ㉏DŽ䖭ḋⱘ㋏㒳՟ᄤ⬅ Lewis(1991)ˈ
Lang(1995)੠ Joachims(1996)ᦤߎDŽ

ᇚ㽕ሩ⼎ⱘᴈ㋴䋱৊ᮃㅫ⊩䙉ᕾҹϟⱘ䯂乬㚠᱃DŽ㗗㰥ᅲ՟ぎ䯈 X ࣙ৿њ᠔᳝ⱘ᭛ᴀ
᭛ḷ˄ेӏᛣ䭓ᑺⱘ᠔᳝ৃ㛑ⱘऩ䆡੠ᷛ⚍ヺোІ˅DŽ㒭ᅮᶤ᳾ⶹⳂᷛߑ᭄ f(x) ⱘϔ㒘䆁㒗
ḋ՟ˈf(x)ⱘপؐᴹ㞾Ѣᶤ᳝䰤䲚ড় VDŽℸӏࡵᰃҢ䆁㒗ḋ՟Ёᄺдˈҹ乘⌟ৢ㓁᭛ᴀ᭛ḷ
ⱘⳂᷛؐDŽ԰Ў⼎՟ˈ䖭䞠㗗㰥ⱘⳂᷛߑ᭄ᰃˈᇚ᭛ḷߚ㉏ЎᇍᶤҎᰃ৺ᛳ݈䍷ˈՓ⫼Ⳃᷛ
ؐ like ੠ dislike ҷ㸼䖭ϸ㉏DŽ

೼ᑨ⫼ᴈ㋴䋱৊ᮃߚ㉏఼ᯊࣙ৿ⱘϸϾЏ㽕䆒䅵䯂乬ᰃˈ佪‫ܜ‬㽕‫އ‬ᅮᗢḋᇚӏᛣ᭛ḷ㸼
⼎Ўሲᗻؐⱘᔶᓣˈ㄀Ѡ㽕‫އ‬ᅮབԩԄ䅵ᴈ㋴䋱৊ᮃߚ㉏఼᠔䳔ⱘὖ⥛DŽ

䖭䞠㸼⼎ӏᛣ᭛ᴀ᭛ḷⱘ䗨ᕘߎ༛ഄㅔऩDŽ㒭ᅮϔ᭛ᴀ᭛ḷˈ˄䖭䞠‫ܜ‬㗗㰥㣅᭛᭛ḷ˅ˈ
ৃᇍ↣Ͼऩ䆡ⱘԡ㕂ᅮНϔϾሲᗻˈ䆹ሲᗻⱘؐЎ೼ℸԡ㕂Ϟᡒࠄⱘ㣅᭛ऩ䆡DŽ䆹᭛ᴀ᭛ḷ
བϟ՟᠔⼎˖

This is an example document for the naive Bayes classifier. This document contains only one
paragraph, or two sentences.

䖭ḋˈϞ՟Ёⱘ᭛ᴀ㹿㸼⼎Ў 19 Ͼሲᗻˈᇍᑨ 19 Ͼऩ䆡ԡ㕂DŽ


㄀ϔϾሲᗻⱘؐЎĀThisāˈ
㄀ѠϾЎĀisāˈձ⃵㉏᥼DŽ⊼ᛣ䕗䭓ⱘ᭛ḷг䳔㽕䕗໮ⱘሲᗻ᭄ⳂDŽ៥Ӏᇚⳟࠄˈ䖭ϡӮ
ᏺᴹӏԩ咏⚺DŽ

བᵰ᭛ᴀ᭛ḷ䖭ḋ㸼⼎ˈ⦄೼ህৃҹᑨ⫼ᴈ㋴䋱৊ᮃߚ㉏఼њDŽЎњᯢ⹂䍋㾕ˈ‫؛‬ᅮ៥
Ӏ᳝ 700 Ͼ䆁㒗᭛ḷˈᑊϨᏆ⬅ҎᎹᇚ݊ߚ㉏Ў dislikeˈ㗠঺໪ 300 Ͼ᭛ḷ㹿ߚ㉏Ў likeDŽ
⦄೼᳝њϔϾᮄ᭛ḷ㽕ߚ㉏DŽҡЎᯢ⹂䍋㾕ˈ䆹᭛ḷህᰃϞ䴶ⱘϸহ㣅᭛՟ᄤDŽ೼ℸᚙ‫މ‬ϟˈ
ৃᑨ⫼ᓣ 6.20 䅵ㅫᴈ㋴䋱৊ᮃߚ㉏఼བ˖

19
v NB arg max P (v j )– P(ai | v j )
v j {like , dislike} i 1

arg max P(v j ) P(a1 " this"| v j ) P(a 2 " is"| v j )...P(a19 " sentence"| v j )
v j {like , dislike}

ὖᣀഄ䆆ˈᴈ㋴䋱৊ᮃߚ㉏vNBᰃՓ䆹᭛ḷЁⱘऩ䆡೼ℸ໘㹿㾖ᆳࠄⱘὖ⥛᳔໻ⱘϔϾ
–
19
ߚ㉏ˈᅗ䙉ᕾ䗮ᐌⱘᴈ㋴䋱৊ᮃ⣀ゟᗻ‫؛‬ᅮDŽ⣀ゟᗻ‫؛‬ᅮ P ( a1 ,...a19 | v j ) 1
P (a i | v j )
䇈ᯢ೼ℸ䆒ᅮϟ೼ϔϾԡ㕂Ϟߎ⦄ᶤऩ䆡ⱘὖ⥛⣀ゟѢ঺໪ϔϾԡ㕂ⱘऩ䆡DŽ䖭ϔ‫؛‬ᅮ೼᳝
ѯᯊ‫׭‬ᑊϡড᯴ⳳᅲᚙ‫މ‬DŽ՟བˈ೼ᶤ໘㾖ᆳࠄऩ䆡learning ⱘὖ⥛Ӯ಴Ўᅗࠡϔԡ㕂ऩ䆡
ᰃmachine㗠๲໻DŽ㱑✊ℸ⣀ゟᗻ‫؛‬ᅮᕜϡ㊒⹂ˈԚ䖭䞠߿᮴䗝ᢽˈᖙ乏԰ℸ‫؛‬ᅮüü≵᳝
䖭Ͼ‫؛‬ᅮˈ㽕䅵ㅫⱘὖ⥛乍ᇚᵕЎᑲ໻DŽᑌ䖤ⱘᰃˈ೼ᅲ䏉Ёᴈ㋴䋱৊ᮃᄺд఼೼䆌໮᭛ᴀ
ߚ㉏䯂乬Ёᗻ㛑䴲ᐌདˈेՓℸ⣀ゟᗻ‫؛‬ᅮϡℷ⹂DŽ Domingos ੠Pazzani(1996)ᇍ䖭ϔᑌ䖤
ⱘ⦄䈵԰њϔϾ᳝䍷ⱘߚᵤDŽ

ЎՓ⫼Ϟᓣ䅵ㅫvNBˈ䳔㽕Ԅ䅵ὖ⥛乍P(vi)੠P(ai=wk|vi)DŽ䖭䞠ᓩܹwkҷ㸼㣅᭛䆡‫݌‬Ёⱘ
㄀kϾऩ䆡DŽࠡϔ乍ৃ෎Ѣ↣ϔ㉏೼䆁㒗᭄᥂Ёⱘ↨՟ᕜᆍᯧഄᕫࠄ˄ℸ՟ЁP(like)=0.3 Ϩ
P(dislike)= 0.7˅DŽབҹᕔ䙷ḋˈԄ䅵㉏߿ⱘᴵӊὖ⥛˄བP(a1)=“This”| P(dislike)˅㽕ೄ䲒ⱘ
໮ˈ಴Ўᖙ乏ᇍ↣Ͼ᭛ᴀԡ㕂ǃ㣅᭛ऩ䆡੠Ⳃᷛؐⱘ㒘ড়䅵ㅫℸὖ⥛乍DŽ䴲ᐌϡᑌˈ೼㣅᭛
䆡∛Ёࣙ৿㑺 5 ϛϾϡৠऩ䆡ˈ✊ৢᴀ՟Ё᳝ 2 Ͼৃ㛑ⱘⳂᷛؐ੠ 19 Ͼ᭛ᴀԡ㕂ˈ᠔ҹᖙ
乏Ң䆁㒗᭄᥂ЁԄ䅵 2×19×50000Ĭ200 ϛϾ䖭ḋⱘὖ⥛乍DŽ

ᑌ䖤ⱘᰃˈৃҹ‫ݡ‬ᓩܹϔড়⧚ⱘ‫؛‬ᅮҹ‫ޣ‬ᇥ䳔㽕Ԅ䅵ⱘὖ⥛᭄䞣DŽ⹂ߛഄ䆆ˈৃ‫؛‬ᅮ䘛
ࠄϔ⡍ᅮऩ䆡wkⱘὖ⥛⣀ゟѢऩ䆡᠔೼ԡ㕂DŽᔶᓣ࣪ⱘ㸼䗄ᰃˈ೼㒭ᅮⳂᷛߚ㉏ⱘᚙ‫މ‬ϟˈ
‫؛‬ᅮ৘ሲᗻᰃ⣀ゟৠߚᏗⱘˈेᇍ᠔᳝ⱘi, j, k, mˈP(ai=wk|vj)=P(am=wk|vj)DŽ಴ℸˈЎԄ䅵ᭈ
Ͼὖ⥛䲚ড়P(a1=wk|vj), P(a2=wk|vj)ˈৃ䗮䖛ϔϾԡ㕂᮴݇ⱘὖ⥛P(wk|vj)ˈ㗠ϡ㗗㰥ऩ䆡ⱘԡ
㕂DŽ݊ᬜᵰᰃˈ⦄೼া䳔㽕 2×50000 Ͼϡৠⱘὖ⥛乍P(wk|vj)DŽ㱑✊䖭ҡ✊ᰃϔϾ䕗໻ⱘ᭄
ؐˈԚैᰃৃㅵ⧚ⱘDŽ⊼ᛣࠄབᵰ䆁㒗᭄᥂᳝䰤ˈ԰ℸ‫؛‬ᅮⱘϔϾЏ㽕Ӭ⚍೼ѢˈᅗՓৃ⫼
ѢԄ䅵↣Ͼ᠔䳔ὖ⥛ⱘḋ՟᭄๲ࡴњˈ಴ℸ๲ࡴњԄ䅵ⱘৃ䴴⿟ᑺDŽ

Ўᅠ៤ᄺдㅫ⊩ⱘ䆒䅵ˈҡ䳔㽕䗝ᢽϔϾᮍ⊩Ԅ䅵ὖ⥛乍DŽ䖭䞠䞛㒇њㄝᓣ 6.22 Ёⱘm


Ԅ䅵ˈे᳝㒳ϔⱘ‫ܜ‬偠ὖ⥛ᑊϨmㄝѢ䆡∛㸼ⱘ໻ᇣDŽ಴ℸˈᇍP(wk|vj)ⱘԄ䅵Ў˖

nk  1
n  Vocabulary

݊ЁnЎ᠔᳝ⳂᷛؐЎvjⱘ䆁㒗ḋ՟Ёऩ䆡ԡ㕂ⱘᘏ᭄ˈnkᰃ೼nϾऩ䆡ԡ㕂Ёᡒࠄwkⱘ
⃵᭄ˈ㗠|Vocabulary|Ў䆁㒗᭄᥂Ёⱘϡৠऩ䆡˄ҹঞ݊Ҫ䆄ো˅ⱘᘏ᭄DŽ

ὖᣀഄ䇈ˈ᳔㒜ⱘㅫ⊩Փ⫼ⱘᴈ㋴䋱৊ᮃߚ㉏఼‫؛‬ᅮऩ䆡ߎ⦄ⱘὖ⥛Ϣᅗ೼᭛ᴀЁⱘԡ
㕂᮴݇DŽ᳔㒜ⱘㅫ⊩ᰒ⼎೼㸼 6-2 ЁDŽ⊼ᛣ䆹ㅫ⊩䴲ᐌㅔऩDŽ೼ᄺд䖛⿟Ёˈ䖛⿟
Learn-naive-Bayes-textߚᵤ᠔᳝䆁㒗᭛ḷˈҢЁᢑপߎ᠔᳝ߎ⦄ⱘऩ䆡ⱘ䆄ো˗✊ৢ೼ϡৠ
Ⳃᷛ㉏Ё䅵ㅫ݊乥⥛ҹ㦋ᕫᖙ㽕ⱘὖ⥛Ԅ䅵DŽҹৢˈ㢹㒭ᅮϔϾᕙߚ㉏ᮄᅲ՟ˈ䖛⿟
Classify-naive-Bayes-text Փ⫼ℸὖ⥛Ԅ䅵ᴹᣝ✻ᓣ 6.20 䅵ㅫVNBDŽ⊼ᛣ೼ᮄ᭛ḷЁߎ⦄Ԛϡ
೼䆁㒗䲚ⱘ᭛ḷЁⱘӏԩऩ䆡ᇚ㹿ㅔऩഄᗑ⬹DŽ䆹ㅫ⊩ⱘҷⷕҹঞ䆁㒗᭄᥂䲚ˈৃ೼ϛ㓈㔥
ⱘhttp://www.cs.cmu.edu/tom/book.htmlЁᡒࠄDŽ
Learn_naive_Bayes_text(Examples, V)
ExamplesЎϔ㒘᭛ᴀ᭛ḷҹঞᅗӀⱘⳂᷛؐDŽVЎ᠔᳝ৃ㛑Ⳃᷛؐⱘ䲚ড়DŽℸߑ᭄԰⫼ᰃᄺдὖ⥛乍P(wk|vj)ˈ
ᅗᦣ䗄њҢ㉏߿vjЁⱘϔϾ᭛ḷЁ䱣ᴎᢑপⱘϔϾऩ䆡Ў㣅᭛ऩ䆡wkⱘὖ⥛DŽ䆹ߑ᭄гᄺд㉏߿ⱘ‫ܜ‬偠ὖ⥛
P(vj)DŽ
1.ᬊ䲚 Examples Ё᠔᳝ⱘऩ䆡ǃᷛ⚍ヺোҹঞ݊Ҫ䆄ো
 Vocabularyĕ೼ Examples Ёӏᛣ᭛ᴀ᭛ḷЁߎ⦄ⱘ᠔᳝ऩ䆡ঞ䆄োⱘ䲚ড়
2.䅵ㅫ᠔䳔㽕ⱘὖ⥛乍P(vj)੠ P(wk|vj)
 ᇍVЁ↣ϾⳂᷛؐvj
 docsjĕExamplesЁⳂᷛؐЎvjⱘ᭛ḷᄤ䲚
 P(vj) ĕ docs j
Examples

 TextjĕᇚdocsjЁ᠔᳝៤ਬ䖲᥹䍋ᴹᓎゟⱘऩϾ᭛ḷ
 nĕ೼TextjЁϡৠऩ䆡ԡ㕂ⱘᘏ᭄
 ᇍVocabularyЁ↣Ͼऩ䆡wk
 nkĕऩ䆡wkߎ⦄೼TextjЁⱘ⃵᭄
 P(wk|vj) ĕ nk 1
n  Vocabulary

Classify_naive_Bayes_text(Doc)
ᇍ᭛ḷDoc䖨ಲ݊Ԅ䅵ⱘⳂᷛؐDŽaiҷ㸼೼DocЁⱘ㄀iϾԡ㕂Ϟߎ⦄ⱘऩ䆡DŽ
 positionsĕ೼ Doc Ёࣙ৿ⱘ㛑೼ Vocabulary Ёᡒࠄⱘ䆄োⱘ᠔᳝ऩ䆡ԡ㕂
 䖨ಲ v
NB arg max P (v j )
v j V
– P (a
i positions
i | vj)

㸼 6-2 ⫼Ѣᄺд੠ߚ㉏᭛ᴀⱘᴈ㋴䋱৊ᮃㅫ⊩

䰸䗮ᐌⱘᴈ㋴䋱৊ᮃ‫؛‬ᅮ໪ˈㅫ⊩䖬‫؛‬ᅮऩ䆡ߎ⦄ⱘὖ⥛⣀ゟѢ݊೼᭛ᴀЁⱘԡ㕂DŽ

6.10.1 ᇔ僂㔉᷒

㸼 6-2 ⱘᄺдㅫ⊩ᬜ⥛བԩ˛೼ Joachims˄1996˅ⱘϔϾᅲ偠Ёˈℸㅫ⊩˄᳝ᖂᇣⱘব


࣪˅㹿ᑨ⫼Ѣߚ㉏ᮄ䯏㒘ⱘ᭛ゴDŽ݊Ё↣ϔ᭛ゴⱘߚ㉏ᰃ䆹᭛ゴ᠔ሲⱘᮄ䯏㒘ৡ⿄DŽℸᅲ偠
㗗㰥њ 20 Ͼ⬉ᄤᮄ䯏㒘ˈ✊ৢҢ↣Ͼᮄ䯏㒘Ё᧰䲚 1000 ㆛᭛ゴˈᔶ៤ϔϾࣙ৿ 2 ϛϾ᭛ḷ
ⱘ᭄᥂䲚DŽ✊ৢᑨ⫼ᴈ㋴䋱৊ᮃㅫ⊩ˈ݊Ё 2/3 ԰Ў䆁㒗ḋ՟ˈ㗠ᗻ㛑ⱘ㸵䞣೼࠽ԭ 1/3 Ё
䖯㸠DŽ಴Ў᳝ 20 Ͼৃ㛑ⱘᮄ䯏㒘ˈ䙷М䱣ᴎ⣰⌟ⱘߚ㉏㊒⹂ᑺЎ 5%DŽ⬅⿟ᑣ㦋ᕫⱘ㊒⹂
ᑺЎ 89%DŽℸᅲ偠ЁՓ⫼ⱘㅫ⊩Ϣ㸼 6-2 Ёⱘㅫ⊩া᳝ϔ⚍ϡৠ˖া᳝᭛ḷЁߎ⦄ऩ䆡ⱘϔ
Ͼᄤ䲚㹿䗝Ўㅫ⊩Ёⱘ䆡∛㸼ˈ⹂ߛഄ䇈ˈ100 Ͼ᳔ᐌ㾕ⱘऩ䆡㹿⿏এ˄བĀtheā੠Āofā
䖭ḋⱘऩ䆡˅ ˈ㗠Ϩӏԩߎ⦄ᇥѢ 3 ⃵ⱘऩ䆡г㹿⿏এDŽᕫࠄⱘ䆡∛㸼ࣙ৿໻㑺 38,500 Ͼऩ
䆡DŽ

݊Ҫᑨ⫼㉏Ԑⱘ㒳䅵ᄺдㅫ⊩䖯㸠᭛ᴀߚ㉏ⱘᅲ偠г㦋ᕫњৠḋདⱘ㒧ᵰDŽ՟བˈLang
˄1995˅ᦣ䗄њᴈ㋴䋱৊ᮃㅫ⊩ⱘ঺ϔব⾡ˈᡞᅗᑨ⫼ࠄᄺдⳂᷛὖᗉĀ៥ᛳ݈䍷ⱘᮄ䯏㒘
᭛ゴāDŽҪᦣ䗄њ NewsWeeder ㋏㒳üüᰃϔϾ䅽⫼᠋䯙䇏ᮄ䯏㒘᭛ゴᑊЎ݊䆘ߚⱘ㋏㒳DŽ
✊ৢ NewsWeeder Փ⫼䖭ѯ䆘ߚⱘ᭛ゴ԰Ў䆁㒗ḋ՟ˈᴹ乘⌟ৢ㓁ⱘ᭛ゴાѯᰃ⫼᠋ᛳ݈䍷
ⱘˈ‫ݡ‬ᇚ݊䗕㒭⫼᠋䯙䇏DŽLang (1995)᡹ਞњҪⱘᅲ偠ˈ݊Ё⫼ NewsWeeder Ёᄺࠄⱘ⫼᠋
݈䍷䜡㕂᭛ӊˈ↣໽৥⫼᠋᥼㤤ߚ᳔ؐ催ⱘᮄ䯏᭛ゴDŽ䗮䖛৥⫼᠋ሩ⼎ࠡ 10%ⱘ㞾ࡼ䆘ߚ
᭛ゴˈᅗᓎゟⱘ᭛ゴᑣ߫Ё⫼᠋ᛳ݈䍷ⱘ↨⥛↨䗮ᐌᚙ‫މ‬ϟ催ߎ 3-4 ‫ס‬DŽ՟བˈ㢹ϔϾ⫼᠋
ᇍ䗮ᐌⱘ᭛ゴ᳝ 16%ᛳ݈䍷ˈ݊ᇍѢ NewsWeeder ᥼㤤ⱘ᭛ゴ᳝ 59%ᛳ݈䍷DŽ

݊Ҫ޴⾡䴲䋱৊ᮃⱘ㒳䅵᭛ᴀᄺдㅫ⊩гᕜᐌ㾕ˈ݊Ё䆌໮෎ѢֵᙃẔ㋶乚ඳ
˄Information Retrieval˅Ёⱘ᳔‫ܜ‬থᯢⱘⳌԐᗻᑺ䞣˄㾕 Rocchio 1971˗Salton 1991˅DŽ঺໪
ⱘ᭛ᴀᄺдㅫ⊩㾕 Hearst & Hirsh˄1996˅DŽ
comp.graphics misc.forsale soc.religion.christian sci.space
comp.os.ms-windows.misc rec.autos talk.politics.guns sci.crypt
comp.sys.ibm.pc.hardware rec.motocycles talk.politics.mideast sci.electronics
comp.sys.mac.hardware rec.sport.baseball talk.politics.misc sci.med
comp.windows.x rec.sport.hockey talk.religion.misc
alt.atheism

㸼 6-3 ೼᭛ᴀߚ㉏ᅲ偠ЁՓ⫼ⱘ 20 Ͼᮄ䯏㒘

೼ᇍ↣Ͼᮄ䯏㒘⫼ 667 ㆛᭛ゴ䆁㒗ৢˈᴈ㋴䋱৊ᮃߚ㉏఼೼乘⌟ৢ㓁᭛ゴሲѢાϔϾᮄ䯏㒘


ᯊ㦋ᕫњ 89%ⱘ㊒ᑺDŽ䱣ᴎ⣰⌟া㛑ᕫࠄ 5%ⱘ㊒⹂ᑺDŽ

6.11 䍓ਬᯥ㖤‫ؗ‬㖇

བࠡϸ㡖᠔䅼䆎ⱘˈᴈ㋴䋱৊ᮃߚ㉏఼‫؛‬ᅮњሲᗻa1Ăanⱘؐ೼㒭ᅮⳂᷛؐvϟᰃᴵӊ
⣀ゟⱘDŽ䖭ϔ‫؛‬ᅮᰒ㨫ഄ‫ޣ‬ᇣњⳂᷛߑ᭄ᄺдⱘ䅵ㅫ໡ᴖᑺDŽᔧℸᴵӊ៤ゟᯊˈᴈ㋴䋱৊ᮃ
ߚ㉏఼ৃᕫࠄ᳔Ӭ䋱৊ᮃߚ㉏DŽ✊㗠೼䆌໮ᚙᔶϟˈ䖭ϔᴵӊ⣀ゟ‫؛‬ᅮᯢᰒ䖛ѢϹḐњDŽ

䋱৊ᮃ㕂ֵ㔥ᦣ䗄ⱘᰃϔ㒘ব䞣᠔䙉Ңⱘὖ⥛ߚᏗˈᅗ䗮䖛ϔ㒘ᴵӊὖ⥛ᴹᣛᅮϔ㒘ᴵ
ӊ⣀ゟᗻ‫؛‬ᅮDŽᴈ㋴䋱৊ᮃߚ㉏఼‫؛‬ᅮ᠔᳝ব䞣೼㒭ᅮⳂᷛব䞣ؐᯊЎᴵӊ⣀ゟⱘˈϢℸϡ
ৠˈ䋱৊ᮃ㕂ֵ㔥Ёৃ㸼䗄ᑨ⫼ࠄব䞣ⱘϔϾᄤ䲚Ϟⱘᴵӊ⣀ゟᗻ‫؛‬ᅮDŽ಴ℸˈ䋱৊ᮃ㕂ֵ
㔥ᦤկњϔ⾡Ё䯈ⱘᮍ⊩ˈᅗ↨ᴈ㋴䋱৊ᮃߚ㉏఼Ёᴵӊ⣀ゟᗻⱘܼሔ‫؛‬ᅮⱘ䰤ࠊ᳈ᇥˈজ
↨೼᠔᳝ব䞣Ё䅵ㅫᴵӊձ䌪᳈ৃ㸠DŽ䋱৊ᮃ㕂ֵ㔥ᰃⳂࠡⷨおЁϔϾ䴲ᐌ⌏䎗ⱘ⛺⚍ˈ㗠
Ϩ᳝໮⾡ᮍ⊩㹿ᦤߎҹᄺдᅗ੠⫼ᅗ䖯㸠᥼⧚DŽᴀ㡖ҟ㒡䋱৊ᮃ㕂ֵ㔥ⱘ݇䬂ὖᗉ੠㸼⼎DŽ
᳈ 䆺 㒚 ⱘ 䅼 䆎 㾕 Pearl(1988) ˈ Rusell & Norvig(1995) ˈ Herkerman et al. ˄ 1995 ˅ ҹ ঞ
Jensen(1996)DŽ

ϔ㠀ᴹ䇈ˈ䋱৊ᮃ㕂ֵ㔥ᦣ䗄њ೼ϔ㒘ব䞣Ϟⱘὖ⥛ߚᏗDŽ㗗㰥ϔӏᛣⱘ䱣ᴎব䞣䲚ড়
Y1ĂYnˈ݊Ё↣ϾYiৃপⱘؐ䲚ড়ЎV(Yi)DŽᅮНব䞣䲚ড়Yⱘ㘨ড়ぎ䯈(joint space)ЎঝЬV(Y1)
hV(Y2)ĂV(Yn)DŽᤶ㿔Пˈ೼㘨ড়ぎ䯈Ёⱘ↣ϔ乍ᇍᑨব䞣‫ܗ‬㒘ⱘϔϾৃ㛑ⱘ䌟ؐ<Y1…Yn>DŽ
೼ℸ㘨ড়ぎ䯈Ϟⱘὖ⥛ߚᏗ⿄Ў㘨ড়ὖ⥛ߚᏗ(joint probability distribution)DŽ㘨ড়ὖ⥛ߚᏗᣛ
ᅮњ‫ܗ‬㒘<Y1…Yn>ⱘ↣Ͼৃ㛑ⱘব䞣㑺ᴳⱘὖ⥛DŽ䋱৊ᮃ㕂ֵ㔥߭ᇍϔ㒘ব䞣ᦣ䗄њ㘨ড়ὖ
⥛ߚᏗDŽ
6.11.1 ᶗԬ⤢㄁ᙝ

佪‫ˈܜ‬Ў䅼䆎䋱৊ᮃ㕂ֵ㔥ˈ䳔㽕㊒⹂ᅮНᴵӊ⣀ゟᗻDŽҸ XˈY ੠ Z Ў 3 Ͼ⾏ᬷؐ䱣


ᴎব䞣DŽᔧ X ᳡Ңⱘὖ⥛ߚᏗ⣀ゟѢ㒭ᅮ Z ؐᯊ Y ⱘؐˈ⿄ X ೼㒭ᅮ Z ᯊᴵӊ⣀ゟѢ Yˈ
े˖

(xi , y j , z k ) P ( X xi | Y yj,Z zk ) P( X xi | Z zk )

݊Ё xi  V ( X ) ˈ y j  V (Y ) ˈ z k  V ( Z ) DŽ䗮ᐌᇚϞᓣㅔ‫ݭ‬ЎP(X|Y,Z)=P(X|Z)DŽ䖭ϔ
݇Ѣᴵӊ⣀ゟᗻⱘᅮНৃ㹿ᠽሩࠄব䞣䲚ড়DŽᔧϟ߫ᴵӊ៤ゟᯊˈ⿄ব䞣䲚ড়X1…Xl㒭ᅮব
䞣䲚ড়Z1…Znᯊᴵӊ⣀ゟѢব䞣䲚ড়Y1…Ym˖

P( X 1 ... X l | Y1 ...Ym , Z 1 ...Z n ) P( X 1 ... X l | Z 1 ...Z n )

⊼ᛣℸᅮНϢᴈ㋴䋱৊ᮃߚ㉏఼ЁՓ⫼ⱘᴵӊ⣀ゟᗻП䯈ⱘ݇㋏DŽᴈ㋴䋱৊ᮃߚ㉏఼‫؛‬
ᅮ㒭ᅮⳂᷛؐVᯊˈᅲ՟ሲᗻA1ᴵӊ⣀ゟѢᅲ՟ሲᗻA2DŽ䖭Փᕫᴈ㋴䋱৊ᮃߚ㉏఼ৃҹᣝ✻
ϟᓣ䅵ㅫ 6.20 ᓣЁⱘP(A1,A2|V)˖

P(A1,A2|V)=P(A1|A2,V)P(A2|V) (6.23)

=P(A1|V)P(A2|V) (6.24)

ᓣ 6.23 াᰃ㸼 6-1 Ёὖ⥛ⱘЬ⊩㾘߭ⱘϔ㠀ᔶᓣDŽᓣ 6.24 ៤ゟᰃ಴ЎA1೼㒭ᅮVᯊᴵӊ


⣀ゟѢA2ˈ✊ৢ⬅ᴵӊ⣀ゟᗻⱘᅮНৃҹᕫࠄP(A1|A2,V)=P(A1|V)DŽ

原书页码: 186

೒ 6-3 ϔϾ䋱৊ᮃ㕂ֵ㔥DŽ

Ꮊ䖍ⱘ㔥㒰㸼⼎њϔ㒘ᴵӊ⣀ゟᗻ‫؛‬ᅮDŽ⹂ߛഄ䇈ˈ↣Ͼ㡖⚍೼㒭ᅮ݊⠊㒧⚍ᯊˈᴵӊ⣀ゟ
Ѣ݊䴲ৢҷ㒧⚍DŽ↣Ͼ㒧⚍݇㘨ϔϾᴵӊὖ⥛㸼ˈᅗᣛᅮњ䆹ব䞣೼㒭ᅮ݊⠊㒧⚍ᯊⱘᴵӊߚᏗDŽ
ে䖍߫ߎњ Campfire 㒧⚍ⱘᴵӊὖ⥛㸼ˈ݊Ё Campfire, Storm ੠ BusTourGroup ߚ߿㓽‫ݭ‬Ў CˈSˈ

6.11.2 㺞⽰

䋱৊ᮃ㕂ֵ㔥˄ㅔ‫ݭ‬Ў䋱৊ᮃ㔥˅㸼⼎ϔ㒘ব䞣ⱘ㘨ড়ὖ⥛ߚᏗDŽ՟བˈ೒ 6-3 Ёⱘ䋱


৊ᮃ㔥㸼⼎њ೼Ꮧᇨব䞣StormˈLightningˈThunderˈForestFireˈCampfire੠BusTourGroup
Ϟⱘ㘨ড়ὖ⥛ߚᏗDŽϔ㠀ഄ䇈ˈ䋱৊ᮃ㔥㸼⼎㘨ড়ὖ⥛ߚᏗⱘᮍ⊩ᰃᣛᅮϔ㒘ᴵӊ⣀ゟᗻ‫؛‬
ᅮ˄ᅗ㸼⼎Ўϔ᳝৥᮴⦃೒˅ˈҹঞϔ㒘ሔ䚼ᴵӊὖ⥛䲚ড়DŽ㘨ড়ぎ䯈Ё↣Ͼব䞣೼䋱৊ᮃ
㔥Ё㸼⼎Ўϔ㒧⚍DŽᇍ↣ϔব䞣䳔㽕ϸ⾡㉏ൟⱘֵᙃDŽ佪‫ˈܜ‬㔥㒰ᓻ㸼⼎ᮁ㿔Āℸব䞣೼㒭
ᅮ݊ゟेࠡ偅ᯊᴵӊ⣀ゟѢ݊䴲ৢ㒻āDŽ ᔧҢYࠄXᄬ೼ϔᴵ᳝৥ⱘ䏃ᕘˈ៥Ӏ⿄XᰃYⱘৢ
㒻DŽ㄀Ѡˈᇍ↣Ͼব䞣᳝ϔϾᴵӊὖ⥛㸼ˈᅗᦣ䗄њ䆹ব䞣೼㒭ᅮ݊ゟेࠡ偅ᯊⱘὖ⥛ߚᏗDŽ
ᇍ㔥㒰ব䞣ⱘ‫ܗ‬㒘<Y1…Yn>䌟ҹ᠔Ꮰᳯⱘؐ˄y1…yn˅ⱘ㘨ড়ὖ⥛ৃ⬅ϟ䴶ⱘ݀ᓣ䅵ㅫDŽ

n
P ( y1 ,... y n ) – P( y
i 1
i | Parents (Yi ))

݊ЁParents(Yi)㸼⼎㔥㒰ЁYiⱘゟेࠡ偅ⱘ䲚ড়DŽ⊼ᛣ P(yi|Parents(yi))ⱘؐㄝѢϢ㒧⚍
Yi݇㘨ⱘᴵӊὖ⥛㸼ЁⱘؐDŽ

Ў䇈ᯢ䖭ϔ⚍ˈ೒ 6-3 㸼⼎њ೼Ꮧᇨব䞣 Storm, Lighting, Thunder, ForestFire, Campfire


ҹঞ BusTourGroup Ϟⱘ㘨ড়ὖ⥛ߚᏗDŽ㗗㰥㒧⚍ CampfireDŽ㔥㒰㒧⚍੠ᄸ㸼⼎њᮁ㿔˖
Campfire ೼㒭ᅮ݊⠊㒧⚍ Storm ੠ BusTourGroup ᯊᴵӊ⣀ゟѢ݊䴲ৢ㒻 Lighting ੠
Thunder DŽ䖭ᛣੇⴔϔԚ៥Ӏⶹ䘧њব䞣 Storm ੠ BusTourGroup ⱘؐˈব䞣 Lighting ੠
Thunder ϡӮᦤկ᳝݇ Campfire ⱘ᳈໮ⱘֵᙃDŽ೒ে䖍ᰒ⼎њϢব䞣 Campfire 㘨㋏ⱘᴵӊ
ὖ⥛㸼DŽ↨བ㸼ⱘ᳔ᎺϞϔϾ᭄᥂㸼⼎њҹϟⱘᮁ㿔˖

P(Campfire=True|Storm=True, BusTourGroup=True)=0.4

⊼ᛣℸ㸼াᦤկњ㒭ᅮ݊⠊ব䞣 Storm ੠ BusTourGroup ϟ Campfire ⱘᴵӊὖ⥛DŽ᠔᳝


ব䞣ⱘሔ䚼ᴵӊὖ⥛㸼ҹঞ⬅㔥㒰᠔ᦣ䗄ⱘϔ㒘ᴵӊ⣀ゟ‫؛‬ᅮˈᦣ䗄њ䆹㔥㒰ⱘᭈϾ㘨ড়ὖ
⥛ߚᏗDŽ

䋱৊ᮃ㕂ֵ㔥ⱘϔϾ਌ᓩҎⱘ⡍ᗻ೼Ѣˈᅗᦤկњϔ⾡ᮍ֓ⱘ䗨ᕘҹ㸼⼎಴ᵰⶹ䆚ˈ↨
˄䮾⬉˅ᇐ㟈 Thunder˄ᠧ䳋˅DŽҹᴵӊ⣀ゟᗻⱘᴃ䇁ˈ
བ Lighting ৃᇚ݊㸼䗄Ў೼㒭ᅮ Lighting
ⱘؐᚙ‫މ‬ϟˈThunder ᴵӊ⣀ゟѢ㔥㒰Ё݊Ҫব䞣DŽ⊼ᛣℸᴵӊ⣀ゟᗻ‫؛‬ᅮᰃ⬅೒ 6-3 ⱘ䋱
৊ᮃ㔥ⱘᓻᣛᅮⱘDŽ

6.11.3 ᧞⨼

ৃҹ⫼䋱৊ᮃ㔥೼㒭ᅮ݊Ҫব䞣ⱘ㾖ᆳؐᯊ᥼⧚ߎᶤѯⳂᷛব䞣˄བ ForestFire˅ⱘؐDŽ
ᔧ✊ˈ⬅Ѣ᠔໘⧚ⱘᰃ䱣ᴎব䞣ˈ᠔ҹϔ㠀ϡӮ䌟ќⳂᷛব䞣ϔϾ⹂ߛⱘؐDŽⳳℷ䳔㽕᥼⧚
ⱘᰃⳂᷛব䞣ⱘὖ⥛ߚᏗˈᅗᣛᅮњ೼㒭Ϣ݊Ҫব䞣ⱘ㾖ᆳؐᴵӊϟˈⳂᷛব䞣প↣ϔৃ㛑
ؐⱘὖ⥛DŽ೼㔥㒰Ё᠔᳝݊Ҫব䞣䛑⹂ߛⶹ䘧њҹৢˈ䖭ϔ᥼⧚ℹ偸ᰃᕜㅔऩⱘDŽ೼᳈䗮ᐌ
ⱘᚙ‫މ‬ϟ,៥ӀᏠᳯ೼ⶹ䘧ϔ䚼ߚব䞣ⱘؐ˄↨བ Thunder ੠ BusTourGroup Ўҙ᳝ৃ⫼ⱘ㾖
ᆳؐ˅ᯊ㦋ᕫᶤব䞣ⱘὖ⥛ߚᏗ˄བ ForestFire˅DŽϔ㠀ഄˈ䋱৊ᮃ㔥㒰ৃ⫼Ѣ೼ⶹ䘧ᶤѯব
䞣ⱘؐ៪ߚᏗᯊ䅵ㅫ㔥㒰Ё঺ϔ䚼ߚব䞣ⱘὖ⥛ߚᏗDŽ

ϔ㠀ᚙ‫މ‬ϟᇍӏᛣ䋱৊ᮃ㔥㒰ⱘὖ⥛ⱘ⹂ߛ᥼⧚Ꮖ㒣ⶹ䘧ᰃϔϾ NP 䲒乬˄Cooper
1990˅DŽᏆᦤߎњ໮⾡ᮍ⊩೼䋱৊ᮃ㔥㒰Ё䖯㸠ϡ⹂ᅮᗻ᥼⧚ˈࣙᣀ⹂ߛⱘ᥼⧚ҹঞ⡎⡆㊒
ᑺᤶপᬜ⥛ⱘ䖥Ԑ᥼⧚ᮍ⊩DŽ՟བˈMonte Carlo ᮍ⊩ᦤկњϔ⾡䖥Ԑⱘᮍ⊩ˈ䗮䖛ᇍ᳾㾖
ᆳࠄব䞣䖯㸠䱣ᴎ䞛ḋ˄ Pradham Dagum 1996˅
DŽ⧚䆎ϞˈेՓᰃ䋱৊ᮃ㔥㒰Ёⱘ䖥Ԑ᥼⧚
гৃᰃ NP 䲒乬˄Dagnm ੠ Luby1993˅DŽᑌ䖤ⱘᰃˈᅲ䏉Ё䆌໮ᚙ‫މ‬ϟ䖥Ԑⱘᮍ⊩㹿䆕ᯢ
ᰃ᳝ᬜⱘˈᇍѢ䋱৊ᮃ㔥㒰᥼⧚ᮍ⊩ⱘ䅼䆎⬅ Russell & Norvig˄1995˅੠ Jensen˄1996˅
԰ߎDŽ
6.11.4 ᆜҖ䍓ਬᯥ㖤‫ؗ‬㖇

ᰃ৺ৃҹ䆒䅵ߎ᳝ᬜⱘㅫ⊩ҹҢ䆁㒗᭄᥂Ёᄺࠄ䋱৊ᮃ㕂ֵ㔥˛䖭ᰃⳂࠡⷨおЁⱘϔ
Ͼ⛺⚍ⱘ䯂乬DŽᇍѢ䖭ϔ䯂乬᳝໮⾡ৃҹ㗗㰥ⱘḚᶊDŽ佪‫ܜ‬㔥㒰㒧ᵘৃҹ乘‫ܜ‬㒭ߎˈ៪ৃ⬅
䆁㒗᭄᥂Ё᥼ᕫDŽ㄀Ѡˈ᠔᳝ⱘ㔥㒰ব䞣ৃҹⳈ᥹Ң↣Ͼ䆁㒗ḋ՟Ё㾖ᆳࠄˈ៪ᶤѯব䞣ϡ
㛑㾖ᆳࠄDŽ

೼㔥㒰㒧ᵘⱘ乘‫ܜ‬ᏆⶹˈᑊϨব䞣ৃҹҢ䆁㒗ḋ՟Ёᅠܼ㦋ᕫᯊˈ䗮䖛ᄺдᕫࠄᴵӊὖ
⥛㸼ህ↨䕗ㅔऩњDŽা䳔㽕䈵೼ᴈ㋴䋱৊ᮃߚ㉏఼Ё䙷ḋԄ䅵㸼Ёⱘᴵӊὖ⥛乍DŽ

㢹㔥㒰㒧ᵘᏆⶹˈԚা᳝ϔ䚼ߚব䞣ؐ㛑೼᭄᥂Ё㾖ᆳࠄˈᄺд䯂乬ህೄ䲒ᕫ໮њDŽ䖭
ϔ䯂乬೼ᶤ⾡⿟ᑺϞ㉏ԐѢ೼ҎᎹ⼲㒣㔥㒰Ёᄺд䱤㮣ऩ‫ⱘܗ‬ᴗؐˈ݊Ё䕧ܹ੠䕧ߎ㒧⚍ؐ
⬅䆁㒗ḋ՟㒭ߎˈԚ䱤㮣ऩ‫ؐⱘܗ‬᳾ᣛᅮDŽᅲ䰙ϞˈRusstll et al.˄1995˅ᦤߎњϔϾㅔऩⱘ
ẃᑺϞछ䖛⿟ҹᄺдᴵӊὖ⥛㸼Ёⱘ乍DŽ䖭ϔẃᑺϞछ䖛⿟᧰㋶ϔϾ‫؛‬䆒ぎ䯈ˈᅗᇍᑨѢᴵ
ӊὖ⥛㸼Ё᠔᳝ৃ㛑ⱘ乍DŽ೼ẃᑺϞछЁ᳔໻࣪ⱘⳂᷛߑ᭄ᰃ㒭ᅮ‫؛‬䆒 h ϟ㾖ᆳࠄ䆁㒗᭄᥂
D ⱘὖ⥛ P(D|h)DŽᣝ✻ᅮНˈᅗᇍᑨѢᇍ㸼乍᧰㋶ᵕ໻Ԑ✊‫؛‬䆒DŽ

6.11.5 䍓ਬᯥ㖇Ⲻụᓜрॽ䇣㓹

⬅Russell et al. (1995)㒭ߎⱘẃᑺϞछ㾘߭Փ⫼ⳌᑨѢᅮНᴵӊὖ⥛㸼ⱘখ᭄ⱘlnP(D|h)


ⱘẃᑺᴹՓP(D|h)᳔໻࣪DŽҸwijkҷ㸼ϔϾᴵӊὖ⥛㸼ⱘϔϾ㸼乍DŽ⹂ߛഄ䆆ˈҸwijkЎ೼㒭
ᅮ⠊㒧⚍Uiপؐuikᯊˈ㔥㒰ব䞣YiؐЎyijⱘὖ⥛DŽ՟བˈ㢹wijkЎ೒ 6-3 Ёᴵӊὖ⥛㸼Ё᳔ে
Ϟᮍⱘ㸼乍ˈ䙷МYiЎব䞣CampfireˈUiᰃ݊⠊㒧⚍ⱘ‫ܗ‬㒘<Storm, BusTourGroup>ˈyij=Trueˈ
w ln P ( D | h)
ᑊϨuik=<False, False>DŽᇍѢ↣Ͼwijk ˈlnP(D|h)ⱘẃᑺ⬅ᇐ᭄ 㒭ߎDŽབϟ䴶ৃ
wwijk
㾕ˈ↣Ͼᇐ᭄ৃབϟ䅵ㅫ˖

w ln P( D | h) P(Yi y ij ,U i u ik | d )
wwijk
¦
d D wijk
˄6.25˅

՟བˈЎ䅵ㅫᇍᑨѢ೒ 6-3 Ё㸼ᎺϞᮍⱘ㸼乍ⱘ lnP(D|h)ⱘᇐ᭄ˈ䳔㽕ᇍ D Ё↣Ͼ䆁㒗


ḋ՟ d 䅵ㅫ P(Campfire=True, Storm=False, BusTourGroup=False | d)DŽᔧ䖭ѯব䞣ᇍ䆁㒗ḋ՟
d ᮴⊩㾖ᆳࠄᯊˈ䖭ѯ᠔䳔ⱘὖ⥛ৃҹ d Ё㾖ᆳࠄⱘব䞣Ё⫼ᷛ‫ⱘޚ‬䋱৊ᮃ㔥㒰᥼⧚ᕫࠄDŽ
ᅲ䰙Ϟ䖭ѯ᠔䳔ⱘ䞣ৃ೼໮᭄䋱৊ᮃ㔥㒰᥼⧚ⱘ䖛⿟Ё䅵ㅫᕫࠄˈ಴ℸ᮴䆎ԩᯊ䋱৊ᮃ㔥㒰
㹿⫼Ѣ᥼⧚ˈᑊϨৢᴹ㦋ᕫњᮄⱘ䆕᥂ˈᄺд䖛⿟޴Тϡ䳔㽕䰘ࡴⱘ㢅䫔ˈDŽ

ϟ䴶ḍ᥂Russell et al.˄1995˅᥼ᇐᓣ 6.25DŽᴀ㡖ⱘৢ䴶೼㄀ϔ⃵䯙䇏ᯊৃҹ㹿䏇䖛ˈ


㗠ϡӮϻ༅䖲㓁ᗻˈЎՓ䆄োㅔऩ࣪ˈϟ䴶ⱘ᥼ᇐᇚ⫼Ph(D)ᴹㅔ‫ݭ‬P(D|h)DŽ಴ℸˈ៥Ӏⱘ䯂
wPh ( D)
乬ᰃ㦋ᕫᇐ᭄䲚ড় ˄ᇍ᠔᳝ⱘi, j, k˅ⱘẃᑺˈ‫؛‬ᅮ೼᭄᥂䲚DЁⱘ৘ḋ՟d䛑ᰃ⣀
wwijk
ゟᢑপⱘDŽৃᇚℸᇐ᭄‫ݭ‬Ў

w ln Ph ( D) w
ln – Ph (d )
wwijk wwijk dD
w ln Ph (d )
¦
d D wwijk

1 wPh (d )
¦ P (d )
d D wwijk
h

᳔ৢϔℹՓ⫼њㄝᓣ w ln f ( x) 1 wf ( x) DŽ⦄೼ৃҹᓩܹব䞣Yi ੠Ui=Parents(Yi)ⱘؐˈ


wx f ( x) wx
ᮍ⊩ᰃ䗮䖛೼݊ৃ㛑ⱘؐyij´੠uik´Ϟ䅵ㅫࡴ੠DŽ

w ln Ph ( D) 1 w
wwijk
¦ P (d ) ww ¦ P (d | y
d D
h ij ' , u ik ' ) Ph ( y ij ' , u ik ' )
h ijk j ', k '

1 w
¦ P (d ) ww ¦ P (d | y
d D
h ij ' , u ik ' ) Ph ( y ij ' | u ik ' ) Ph (u ik ' )
h ijk j ', k '

᳔ৢϔℹᴹ㞾Ѣὖ⥛ⱘЬ⊩݀ᓣˈ㾕㸼 6-1DŽ⦄೼㗗㰥Ϟ䴶᳔ৢϔᓣ᳔ে䖍ⱘࡴ੠乍DŽ
㒭ᅮњwijk įPh(yij|uik)ˈ೼ℸࡴ੠Ёᚳϔ w ϡㄝѢ 0 ⱘ乍ᰃ݊Ёj´=j੠i´=iⱘ乍ˈ಴ℸ˖
wwijk

w ln Ph ( D) 1 w
wwijk
¦ P (d ) ww
d D
Ph (d | yij , uik ) Ph ( yij | uik ) Ph (uik )
h ijk

1 w
¦ P (d ) ww
dD
Ph (d | yij , uik ) wijk Ph (uik )
h ijk

1
¦ P (d ) P (d | y , u
d D
h ij ik ) Ph (uik )
h

ᑨ⫼䋱৊ᮃ݀ᓣᴹ䞡‫ݭ‬Ph(d|yij,uik)ৃᕫ

w ln Ph ( D) 1 Ph ( yij , uik | d ) Ph (d ) Ph (uik )


wwijk
¦ P (d )
dD Ph ( yij , uik )
h

Ph ( yij , uik | d ) Ph (uik )


¦
d D Ph ( yij , uik )

Ph ( yij , uik | d )
¦
dD Ph ( yij | uik )

Ph ( yij , uik | d )
¦
d D wijk
˄6.26˅

䖭ḋ៥ӀᏆᇐߎњᓣ 6.25 ЁⱘẃᑺDŽ೼ᦣ䗄ẃᑺϞछ䆁㒗ࠡ䖬㽕㗗㰥ϔϾ䯂乬DŽ⹂ߛ


ഄ䇈ˈ៥Ӏ㽕∖ᔧᴗؐwijk᳈ᮄᯊˈᅗӀᖙ乏ֱᣕ೼ऎ䯈[0ˈ1]П䯈ˈ䖭ḋᠡᰃ᳝ᬜⱘὖ⥛DŽ
៥Ӏ䖬㽕∖›jwijkᇍ᠔᳝ⱘi,kֱᣕЎ 1DŽ䖭ѯ䰤ࠊৃ⬅ϔϾϸℹ偸ⱘᴗؐ᳈ᮄᴹ⒵䎇DŽ佪‫ܜ‬
⫼ẃᑺϞछᴹ᳈ᮄ↣Ͼwijk˖

Ph ( y ij , u ik | d )
wijk m wijk  K ¦
d D wijk

݊Ё¨ᰃϔᇣⱘᐌ䞣ˈ⿄Ўᄺд⥛DŽ݊⃵ˈ‫ݡ‬ᇚᴗؐwijkᔦϔ࣪ˈҹֱ䆕Ϟ䴶ⱘ䰤ࠊᕫ
ࠄ⒵䎇DŽབRussell᠔ᦣ䗄ⱘ䙷ḋˈ䖭ϔ䖛⿟ᇚᬊᬯࠄ䋱৊ᮃ㔥㒰Ёⱘᴵӊὖ⥛ⱘϔϾሔ䚼ⱘ
ᵕ໻Ԑ✊‫؛‬䆒DŽ

བ೼݊Ҫ෎Ѣẃᑺⱘᮍ⊩Ё䙷ḋˈ䆹ㅫ⊩াֱ䆕ᇏᡒࠄሔ䚼᳔Ӭ㾷DŽ᳓ҷẃᑺϞछⱘϔ
Ͼㅫ⊩ᰃ EM ㅫ⊩ˈᅗ೼ 6.12 㡖Ё䅼䆎ˈᅗгাᡒሔ䚼ᵕ໻ৃ㛑ᗻⱘ㾷DŽ

6.11.6 ᆜҖ䍓ਬᯥ㖇Ⲻ㔉ᶺ

ᔧ㔥㒰㒧ᵘ乘‫ܜ‬᳾ⶹᯊˈᄺд䋱৊ᮃ㔥㒰гᕜೄ䲒DŽ Cooper & Herskovits˄1992˅ ᦤ


ߎњϔϾ䋱৊ᮃ䆘ߚᑺ䞣˄Bayesian scoring metric˅ҹҢϡৠ㔥㒰Ё䖯㸠䗝ᢽDŽҪӀ䖬ᦤߎ
ϔϾ⿄Ў K2 ⱘਃথᓣ᧰㋶ㅫ⊩⫼Ѣ೼᭄᥂ᅠܼৃ㾖ᆳࠄᯊᄺд㔥㒰㒧ᵘDŽབ໮᭄ᄺд㔥㒰
㒧ᵘⱘㅫ⊩ˈK2 ᠻ㸠ⱘᰃϔϾ䋾ှ᧰㋶ˈҹ೼㔥㒰ⱘ໡ᴖᗻ੠ᅗ೼䆁㒗᭄᥂Ϟⱘ㊒ᑺП䯈
԰ߎᡬЁDŽ೼ϔϾᅲ偠ЁˈK2 㹿㒭Ϣ 3000 Ͼ䆁㒗ḋ՟ˈ䖭ѯḋ՟ᰃҢࣙ৿њ 37 Ͼ㡖⚍੠
46 ᴵᓻⱘ᠟Ꮉ߯ᓎⱘ䋱৊ᮃ㔥㒰Ё䱣ᴎᢑপⱘDŽ䖭ϔ㔥㒰ᦣ䗄њ೼ϔए䰶ⱘ᠟ᴃᅸЁ┰೼
ⱘ㒚㦠䯂乬DŽ䰸њ᭄᥂ҹ໪ˈ⿟ᑣ䖬㹿㒭Ϣ 37 Ͼব䞣ⱘ߱ྟᥦᑣˈᅗϢᅲ䰙㔥㒰Ёব䞣П
䯈ⱘ‫أ‬ᑣ݇㋏ϔ㟈DŽ䆹⿟ᑣ៤ࡳഄ߯ᓎߎњϢℷ⹂㔥㒰㒧ᵘ޴Тϔḋⱘ䋱৊ᮃ㔥ˈ䰸њϔϾ
ϡℷ⹂ഄ㹿ߴ䰸ⱘ੠ϔϡℷ⹂ഄ㹿ࡴܹⱘᓻDŽ

෎Ѣ㑺ᴳⱘᄺд䋱৊ᮃ㔥㒰㒧ᵘⱘ䗨ᕘгᏆ㹿ᓔথߎᴹ˄՟བˈSpirtes et al. 1993˅


DŽ䖭
ѯ䗨ᕘҢ᭄᥂Ё᥼䆎ߎϡⳌ݇੠Ⳍ݇ⱘ݇㋏ˈ✊ৢ⫼䖭ѯ݇㋏ᴹᵘ䗴䋱৊ᮃ㔥DŽ݇Ѣᔧࠡᄺ
д䋱৊ᮃ㔥ⱘ䗨ᕘⱘ䇗ⷨ⬅ Heckerman˄1995˅੠ Buntine˄1994˅㒭ߎDŽ

6.12 EM ㇍⌋

೼䆌໮ᅲ䰙ⱘᄺд䯂乬ḚᶊЁˈⳌ݇ᅲ՟⡍ᕕЁা᳝ϔ䚼ߚৃ㾖ᆳࠄDŽ՟བˈ೼䆁㒗៪
Փ⫼೒ 6-3 Ёⱘ䋱৊ᮃ㕂ֵ㔥ᯊˈৃ㛑㔥㒰ব䞣 Storm, Lighting, Thunder, ForestFire, Campfire
੠ BusTourGroup Ёা᳝݊ϔϾᄤ䲚㛑೼᭄᥂Ё㾖ᆳࠄDŽᏆ᳝䆌໮ᮍ⊩㹿ᦤߎ⫼ᴹ໘⧚ᄬ೼
᳾㾖ᆳࠄব䞣ᯊⱘ䯂乬DŽབ೼㄀ 3 ゴⳟࠄⱘˈ㢹ᶤѯব䞣᳝ᯊ㛑㾖ᆳࠄˈ᳝ᯊϡ㛑ˈ䙷Мৃ
ҹ⫼㾖ᆳࠄⱘᅲ՟এ乘⌟᳾㾖ᆳࠄⱘDŽ೼ᴀ㡖Ёᦣ䗄 EM ㅫ⊩˄ Dempster et al. 1977˅ˈ䖭
ᰃᄬ೼䱤৿ব䞣ᯊᑓ⊯Փ⫼ⱘϔ⾡ᄺдᮍ⊩DŽEM ㅫ⊩ৃ⫼Ѣব䞣ⱘؐҢᴹ≵᳝㹿Ⳉ᥹㾖ᆳ
ࠄⱘᚙᔶˈা㽕䖭ѯব䞣᠔䙉ᕾⱘὖ⥛ߚᏗⱘϔ㠀ᔶᓣᏆⶹDŽEM ㅫ⊩Ꮖ㹿⫼Ѣ䆁㒗䋱৊ᮃ
㕂ֵ㔥˄㾕 Heckerman 1995˅ҹঞ 8.4 㡖䅼䆎ⱘᕘ৥෎ߑ᭄˄radial basis function˅㔥㒰DŽ
EM ㅫ⊩䖬ᰃ䆌໮䴲ⲥⴷ㘮㉏ㅫ⊩ⱘ෎⸔˄བ Cheeseman et al. 1988˅ˈ㗠Ϩᅗᰃ⫼Ѣᄺд䚼
ߚৃ㾖ᆳ偀ᇨৃ໿῵ൟ˄Partially Observable Markov Model˅ⱘᑓ⊯Փ⫼ⱘ Baum-Welch ࠡ
৥ৢ৥ㅫ⊩ⱘ෎⸔˄Rabiner 1989˅DŽ
6.12.1 զ䇗 k Ѡ 儎ᯥ࠼ᐹⲺൽ‫ٲ‬

ҟ㒡EMㅫ⊩᳔ᮍ֓ⱘᮍ⊩ᰃ䗮䖛ϔϾ՟ᄤDŽ㗗㰥᭄᥂Dᰃϔᅲ՟䲚ড়ˈᅗ⬅kϾϡৠℷ
ᗕߚᏗⱘ⏋ড়᠔ᕫߚᏗ᠔⫳៤DŽ䆹䯂乬Ḛᶊ೼೒ 6-4 Ё⼎ߎˈ݊Ёk=2 㗠Ϩᅲ՟Ў⊓ⴔx䕈ᰒ
⼎ⱘ⚍DŽ↣Ͼᅲ՟Փ⫼ϔϾϸℹ偸䖛⿟ᔶ៤DŽ佪‫ܜ‬њ䱣ᴎ䗝ᢽkϾℷᗕߚᏗ݊ЁПϔDŽ݊⃵
䱣ᴎব䞣xiᣝ✻ℸ䗝ᢽⱘߚᏗ⫳៤DŽ䖭ϔ䖛⿟ϡᮁ䞡໡ˈ⫳៤ϔ㒘᭄᥂⚍བ೒᠔⼎DŽЎՓ䅼
䆎ㅔऩ࣪ˈ៥Ӏ㗗㰥ϔϾㅔऩᚙᔶˈेऩϾℷᗕߚᏗⱘ䗝ᢽ෎Ѣ㒳ϔⱘὖ⥛䖯㸠䗝ᢽˈᑊϨ
kϾℷᗕߚᏗ᳝ⳌৠⱘᮍᏂ³2ˈϨ³2ᏆⶹDŽᄺдӏࡵᰃ䕧ߎϔϾ‫؛‬䆒h=<­1…­k>ˈᅗᦣ䗄
њkϾߚᏗЁ↣ϔϾߚᏗⱘഛؐDŽ៥ӀᏠᳯᇍ䖭ѯഛؐᡒࠄϔϾᵕ໻Ԑ✊‫؛‬䆒ˈेϔϾՓ
P(D|h)᳔໻࣪ⱘ‫؛‬䆒hDŽ

原书页码: 192

೒ 6-4 ⬅ϸϾ‫݋‬᳝ⳌㄝᮍᏂ³2ⱘℷᗕߚᏗⱘ⏋ড়⫳៤ⱘᅲ՟䲚DŽ

ᅲ՟Ў⊓ⴔ x 䕈ᰒ⼎ⱘ⚍䲚DŽབᵰℷᗕߚᏗⱘഛؐ᳾ⶹˈEM ㅫ⊩ৃ⫼Ѣ᧰㋶݊ᵕ໻Ԑ✊Ԅ䅵DŽ

⊼ᛣࠄˈᔧ㒭ᅮҢϔϾℷᗕߚᏗЁᢑপⱘ᭄᥂ᅲ՟x1, x2, …, xmᯊˈᕜᆍᯧ䅵ㅫ䆹ߚᏗⱘ


ഛؐⱘᵕ໻Ԑ✊‫؛‬䆒DŽ䖭ϔᇏᡒऩϾߚᏗഛؐⱘ䯂乬াᰃ೼ 6.4 㡖ⱘᓣ 6.6 Ё䅼䆎ⱘ䯂乬ⱘ
ϔϾ⡍՟ˈ೼݊Ё៥Ӏ䆕ᯢњᵕ໻Ԑ✊‫؛‬䆒ᰃՓmϾ䆁㒗ᅲ՟Ϟⱘ䇃Ꮒᑇᮍ੠᳔ᇣ࣪ⱘ‫؛‬
䆒DŽՓ⫼ᔧࠡⱘ䆄ো䞡ᮄ㸼䗄ϔϟᓣ 6.6ˈৃҹᕫࠄ˖

m
P ML arg min ¦ ( xi  P ) 2 ˄6.27˅
P i 1

೼ℸᚙ‫މ‬ϟˈ䇃Ꮒᑇᮍ੠ᰃ⬅ḋᴀഛ᳔ؐᇣ࣪ⱘ˖

1 m
P ML ¦ xi
mi1
˄6.28˅

✊㗠ˈ೼䖭䞠៥Ӏⱘ䯂乬⍝ঞࠄkϾϡৠℷᗕߚᏗⱘ⏋ড়ˈ㗠Ϩ៥Ӏϡ㛑ⶹ䘧ાϾᅲ՟
ᰃાϾߚᏗѻ⫳ⱘDŽ಴ℸ䖭ᰃϔϾ⍝ঞ䱤㮣ব䞣ⱘ‫݌‬ൟ՟ᄤDŽ೼೒ 6-4 ⱘ՟ᄤЁˈৃᡞ↣Ͼ
ᅲ՟ⱘᅠᭈᦣ䗄ⳟ԰ᰃϝ‫ܗ‬㒘<xi, zi1, zi2>ˈ݊Ёxiᰃ㄀iϾᅲ՟ⱘ㾖⌟ؐˈzi1੠zi2㸼⼎ϸϾℷ
ᗕߚᏗЁાϾ㹿⫼Ѣѻ⫳ؐxiDŽ⹂ߛഄ䆆ˈzij೼xi⬅㄀jϾℷᗕߚᏗѻ⫳ᯊؐЎ 1ˈ৺߭Ў 0DŽ
䖭䞠xiᰃᅲ՟ⱘᦣ䗄ЁᏆ㾖ᆳࠄⱘব䞣ˈzi1੠zi2ᰃ䱤㮣ব䞣DŽབᵰzi1੠zi2ⱘؐৃⶹˈህৃҹ
⫼ᓣ 6.27 ᴹ㾷‫އ‬ഛؐ­1੠­2DŽ಴ЎᅗӀ᳾ⶹˈ಴ℸ៥Ӏা㛑⫼EMㅫ⊩DŽ

EMㅫ⊩ᑨ⫼Ѣ៥Ӏⱘkഛؐ䯂乬ˈⳂⱘᰃ᧰㋶ϔϾᵕ໻Ԑ✊‫؛‬䆒ˈᮍ⊩ᰃḍ᥂ᔧࠡ‫؛‬䆒
<­1…­k>ϡᮁഄ‫ݡ‬Ԅ䅵䱤㮣ব䞣zijⱘᳳᳯؐDŽ✊ৢ⫼䖭ѯ䱤㮣ব䞣ⱘᳳᳯؐ䞡ᮄ䅵ㅫᵕ໻
Ԑ✊‫؛‬䆒DŽ䖭䞠佪‫ᦣܜ‬䗄䖭ϔᅲ՟࣪ⱘEMㅫ⊩ˈҹৢᇚ㒭ߎEMㅫ⊩ⱘϔ㠀ᔶᓣDŽ

ЎњԄ䅵೒ 6-4 ЁⱘϸϾഛؐˈEMㅫ⊩佪‫ܜ‬ᇚ‫؛‬䆒߱ྟ࣪Ўh=<­1, ­2>ˈ݊Ё­1੠


­2Ўӏᛣⱘ߱ྟؐDŽ✊ৢ䞡໡ҹϟⱘϸϾℹ偸ҹ䞡Ԅ䅵hˈⳈࠄ䆹䖛⿟ᬊᬯࠄϔϾ〇ᅮⱘh
ؐDŽ

ℹ偸 1˖䅵ㅫ↣Ͼ䱤㮣ব䞣zijⱘᳳᳯؐE[zij]ˈ‫؛‬ᅮᔧࠡ‫؛‬䆒h=<­1, ­2>៤ゟDŽ

ℹ偸 2˖䅵ㅫϔϾᮄⱘᵕ໻Ԑ✊‫؛‬䆒h´=<­1´, ­2´>ˈ‫؛‬ᅮ⬅↣Ͼ䱤㮣ব䞣zij᠔পⱘؐ
Ў㄀ 1 ℹЁᕫࠄⱘᳳᳯؐE[zij]ˈ✊ৢᇚ‫؛‬䆒h=<­1, ­2>᳓ᤶЎᮄⱘ‫؛‬䆒h´=<­1´, ­2´>ˈ
✊ৢᕾ⦃DŽ

⦄೼㗗ᆳ㄀ϔℹᰃབԩᅲ⦄ⱘDŽℹ偸 1 㽕䅵ㅫ↣Ͼzij ⱘᳳᳯؐDŽℸE[zij]ℷᰃᅲ՟xi⬅㄀


jϾℷᗕߚᏗ⫳៤ⱘὖ⥛˖

p( x xi | P Pj)
E[ zij ]
¦
2
n 1
p( x xi | P Pn )

1
 ( xi  P j ) 2
2V 2
e
1
 ( xi  P n ) 2
¦
2
2V 2
n 1
e

಴ℸ㄀ϔℹৃ⬅ᇚᔧࠡؐ<­1, ­2>੠ᏆⶹⱘxiҷܹࠄϞᓣЁᅲ⦄DŽ

೼㄀ѠℹˈՓ⫼㄀ 1 ℹЁᕫࠄⱘE[zij] ᴹᇐߎϔᮄⱘᵕ໻Ԑ✊‫؛‬䆒h´=<­1´, ­2´>DŽབ


ৢ䴶ᇚ䅼䆎ࠄⱘˈ䖭ᯊⱘᵕ໻Ԑ✊‫؛‬䆒Ў˖

¦
m
E[ zij ]xi
Pj m i 1

¦
m
i 1
E[ zij ]

⊼ᛣℸ㸼䖒ᓣ㉏ԐѢᓣ 6.28 Ёⱘḋᴀഛؐˈᅗ⫼ѢҢऩϾℷᗕߚᏗЁԄ䅵­DŽᮄⱘ㸼


䖒ᓣাᰃᇍ­jⱘࡴᴗḋᴀഛؐˈ↣Ͼᅲ՟ⱘᴗ䞡Ў݊⬅㄀jϾℷᗕߚᏗѻ⫳ⱘᳳᳯؐDŽ

Ϟ䴶Ԅ䅵kϾℷᗕߚᏗഛؐⱘㅫ⊩ᦣ䗄њEMᮍ⊩ⱘ㽕⚍˖ेᔧࠡⱘ‫؛‬䆒⫼ѢԄ䅵᳾ⶹব
䞣ˈ㗠䖭ѯব䞣ⱘᳳᳯؐ‫ݡ‬㹿⫼Ѣᬍ䖯‫؛‬䆒DŽৃҹ䆕ᯢˈ೼ℸㅫ⊩㄀ϔ⃵ᕾ⦃ЁˈEMㅫ⊩
㛑ՓԐ✊ᗻP(D|h)๲ࡴˈ䰸䴲ᅗᏆ䖒ࠄሔ䚼ⱘ᳔໻DŽ಴ℸ䆹ㅫ⊩ᬊᬯࠄᇍѢ<­1, ­2>ⱘϔ
Ͼሔ䚼ᵕ໻ৃ㛑ᗻ‫؛‬䆒DŽ

6.12.2 EM ㇍⌋Ⲻж㡢㺞䘦

Ϟ䴶ⱘEMㅫ⊩䩜ᇍⱘᰃԄ䅵⏋ড়ℷᗕߚᏗഛؐⱘ䯂乬DŽ᳈ϔ㠀ഄˈEMㅫ⊩ৃ⫼Ѣ䆌໮
䯂乬Ḛᶊˈ݊Ё䳔㽕Ԅ䅵ϔ㒘ᦣ䗄෎‫ޚ‬ὖ⥛ߚᏗⱘখ᭄©ˈা㒭ᅮњ⬅ℸߚᏗѻ⫳ⱘܼ䚼᭄
᥂Ё㛑㾖ᆳࠄⱘϔ䚼ߚDŽ೼Ϟ䴶ⱘѠഛؐ䯂乬Ёˈᛳ݈䍷ⱘখ᭄Ў©=<­1, ­2>ˈ㗠ܼ䚼
᭄᥂Ўϝ‫ܗ‬㒘<xi, zi1, zi2>ˈ㗠া᳝xiৃ㾖ᆳࠄˈϔ㠀ഄҸX=<x1, …, xm>ҷ㸼೼ৠḋⱘᅲ՟Ё
᳾㾖ᆳࠄⱘ᭄᥂ˈᑊҸY=XĤZҷ㸼ܼԧ᭄᥂DŽ⊼ᛣࠄ᳾㾖ᆳࠄⱘZৃ㹿ⳟ԰ϔ䱣ᴎব䞣ˈᅗ
ⱘὖ⥛ߚᏗձ䌪Ѣ᳾ⶹখ᭄©੠Ꮖⶹ᭄᥂XDŽ㉏ԐഄˈYᰃϔ䱣ᴎব䞣ˈ಴Ўᅗᰃ⬅䱣ᴎব
䞣ZᴹᅮНⱘDŽ೼ᴀ㡖ⱘৢ㓁䚼ߚˈᇚᦣ䗄EMㅫ⊩ⱘϔ㠀ᔶᓣDŽՓ⫼hᴹҷ㸼খ᭄©ⱘ‫؛‬䆒
ؐˈ㗠h´ҷ㸼೼EMㅫ⊩ⱘ↣⃵䗁ҷЁׂᬍⱘ‫؛‬䆒DŽ
EM ㅫ⊩䗮䖛᧰ᇏՓ E[lnP(Y|h´)]᳔໻ⱘ h´ᴹᇏᡒᵕ໻Ԑ✊‫؛‬䆒 h´DŽℸᳳᳯؐᰃ೼ Y ᠔
䙉ᕾⱘὖ⥛ߚᏗϞ䅵ㅫˈℸߚᏗ⬅᳾ⶹখ᭄©⹂ᅮDŽ㗗㰥ℸ㸼䖒ᓣおコᛣੇњҔМDŽ佪‫ܜ‬
P(Y|h´)ᰃ㒭ᅮ‫؛‬䆒 h´ϟܼ䚼᭄᥂ Y ⱘԐ✊ᗻDŽ݊ড়⧚ᗻ೼Ѣ៥Ӏ㽕ᇏᡒϔϾ h´Փ䆹䞣ⱘᶤ
ߑ᳔᭄ؐ໻࣪DŽ݊⃵Փ䆹䞣ⱘᇍ᭄ lnP(Y|h´)᳔໻࣪гՓ P(Y|h´)᳔໻࣪ˈབᏆ㒣ҟ㒡䖛ⱘ䙷ḋDŽ
㄀ϝˈᓩܹᳳᳯؐ E[lnP(Y|h´)]ᰃ಴Ўܼ䚼᭄᥂ Y ᴀ䑿гᰃϔ䱣ᴎব䞣DŽᏆⶹܼ䚼᭄᥂ Y ᰃ
㾖ᆳࠄⱘ X ੠᳾㾖ᆳࠄⱘ Z ⱘড়ᑊˈ៥Ӏᖙ乏೼᳾㾖ᆳࠄⱘ Z ⱘৃ㛑ؐϞপᑇഛˈᑊҹⳌ
ᑨⱘὖ⥛ЎᴗؐDŽᤶ㿔Пˈ㽕೼䱣ᴎব䞣 Y 䙉ᕾⱘὖ⥛ߚᏗϞপᳳᳯؐ E[lnP(Y|h´)]DŽ䆹ߚ
Ꮧ⬅ᅠܼᏆⶹⱘ X ؐࡴϞ Z ᳡ҢⱘߚᏗᴹ⹂ᅮDŽ

Y 䙉Ңⱘὖ⥛ߚᏗᰃҔМ˛ϔ㠀ᴹ䇈ϡ㛑ⶹ䘧ℸߚᏗˈ಴Ўᅗᰃ⬅ᕙԄ䅵ⱘ©খ᭄⹂ᅮ
ⱘDŽ✊㗠ˈEM ㅫ⊩Փ⫼݊ᔧࠡⱘ‫؛‬䆒 h ҷ᳓ᅲ䰙খ᭄©ˈҹԄ䅵 Y ⱘߚᏗDŽ⦄ᅮНϔߑ᭄
Q(h´|h)ˈᅗᇚ E[lnP(Y|h´)]԰Ў h´ⱘϔϾߑ᭄㒭ߎˈ೼©=h ੠ܼ䚼᭄᥂ Y ⱘ㾖ᆳࠄⱘ䚼ߚ X
ⱘ‫؛‬ᅮПϟDŽ

Q ( h'| h) E[ln p (Y | h' ) | h, X ]

ᇚ Q ߑ᭄‫ݭ‬៤ Q(h´|h)ᰃЎњ㸼⼎݊ᅮНᰃ೼ᔧࠡ‫؛‬䆒 h ㄝѢ©ⱘ‫؛‬ᅮϟDŽ೼ EM ㅫ⊩


ⱘϔ㠀ᔶᓣ䞠ˈᅗ䞡໡ҹϟϸϾℹ偸Ⳉ㟇ᬊᬯDŽ

ℹ偸 1˖Ԅ䅵˄E˅ℹ偸˖Փ⫼ᔧࠡ‫؛‬䆒 h ੠㾖ᆳࠄⱘ᭄᥂ X ᴹԄ䅵 Y Ϟⱘὖ⥛ߚᏗҹ


䅵ㅫ Q(h´|h)DŽ

Q (h' | h) m E[ln P (Y | h' ) | h, X ]

ℹ偸 2˖᳔໻࣪˄M˅ℹ偸˖ᇚ‫؛‬䆒 h ᳓ᤶЎՓ Q ߑ᳔᭄໻࣪ⱘ‫؛‬䆒 h´˖

h m arg max Q(h'| h)


h'

ᔧߑ᭄ Q 䖲㓁ᯊˈEM ㅫ⊩ᬊᬯࠄԐ✊ߑ᭄ P(Y|h´)ⱘϔϾϡࡼ⚍DŽ㢹ℸԐ✊ߑ᭄᳝ऩ


Ͼⱘ᳔໻ؐᯊˈEM ㅫ⊩ৃҹᬊᬯࠄ䖭Ͼᇍ h´ⱘܼሔⱘᵕ໻Ԑ✊Ԅ䅵DŽ৺߭ˈᅗাֱ䆕ᬊᬯ
ࠄϔϾሔ䚼᳔໻ؐDŽ಴ℸˈEM Ϣ݊Ҫ᳔Ӭ࣪ᮍ⊩᳝ৠḋⱘሔ䰤ᗻˈབ㄀ 4 ゴ䅼䆎ⱘẃᑺϟ
䰡ˈ㒓ᗻ᧰㋶੠বᔶẃᑺㄝDŽ

6.12.3 k-ൽ‫ٲ‬㇍⌋Ⲻ᧞ሲ

Ў䇈ᯢϔ㠀ⱘEMㅫ⊩ˈ៥Ӏ⫼ᅗᴹ᥼ᇐ 6.12.1 㡖ЁԄ䅵kϾℷᗕߚᏗ⏋ড়ഛؐⱘㅫ⊩DŽ


བϞ᠔䅼䆎ˈk-ഛؐㅫ⊩ᰃЎњԄ䅵kϾℷᗕߚᏗⱘഛؐ©=<­1, …, ­k>DŽᏆ᳝ⱘ᭄᥂Ў㾖
ᆳࠄⱘX={<xi>}ˈ䖭䞠ⱘ䱤㮣ব䞣Z={<zi1, …, zik>}㸼⼎kϾℷᗕߚᏗЁાϔϾ⫼Ѣ⫳៤xiDŽ

㽕ᑨ⫼EMㅫ⊩ˈᖙ乏᥼ᇐߎৃ⫼Ѣk-ഛؐ䯂乬ⱘ㸼䖒ᓣQ(h´|h)DŽ佪‫᥼ܜ‬ᇐߎlnp(Y|h´)
ⱘ㸼䖒ᓣDŽ⊼ᛣᇍ↣Ͼᅲ՟yi=<xi, zi1, …, zik>ⱘὖ⥛p(yi|h´)ৃ㹿‫ݭ‬԰˖

1
¦ j 1 z ij ( xi  P ' j ) 2
k
1 
2V 2
p( yi | h' ) p( xi , zi1 ,..., zik | h' ) e
2SV 2

㽕偠䆕ℸᓣˈᖙ乏⊼ᛣা᳝ϔϾzijؐЎ 1ˈ݊ҪⱘЎ 0DŽ಴ℸˈ䆹ᓣ㒭ߎњ⬅᠔䗝ⱘℷ


ᗕߚᏗ⫳៤ⱘxiⱘὖ⥛ߚᏗDŽᏆⶹњऩϾᅲ՟ⱘߚᏗp(yi|h´)ˈᇍ᠔᳝mϾᅲ՟ⱘὖ⥛ⱘᇍ᭄
lnP(Y|h´)Ў˖

m
ln P(Y | h' ) ln – p ( yi | h' )
i 1

¦ ln p( y | h' )
i 1
i

§m
1 1 k ·
¦ ¨
¨
i 1©
ln  ¦
2SV 2 2V j 1
2
z ij ( xi  P ' j ) 2
¸
¸
¹

᳔ৢˈᖙ乏೼Y᠔䙉Ңⱘὖ⥛ߚᏗˈгህᰃYⱘ᳾㾖ᆳࠄ䚼ߚzij䙉Ңⱘὖ⥛ߚᏗϞˈ䅵ㅫ
ℸlnP(Y|h´)ⱘഛؐDŽ⊼ᛣϞ䴶lnP(Y|h´)ⱘ㸼䖒ᓣЎ䖭ѯzijⱘ㒓ᗻߑ᭄DŽϔ㠀ⱘˈᇍZⱘӏᛣ㒓
ᗻߑ᭄f(z)ᴹ䇈ˈϟ䴶ⱘㄝᓣ៤ゟ˖

E[f(z)]=f(E[z])

ḍ᥂ℸㄝᓣˈৃᕫ˖

ªm § 1 1 k ·º
E[ln P (Y | h' )] E «¦ ¨¨ ln  2 ¦ zij ( xi  P ' j ) 2 ¸¸»
«¬ i 1 © 2SV 2 2V j 1 ¹¼»

§m
1 1 k ·
¦ ¨
¨
i 1©
ln  ¦
2SV 2 2V j 1
2
E[ zij ]( xi  P ' j ) 2 ¸¸
¹

ὖᣀഄ䇈ˈk-ഛؐ䯂乬Ёߑ᭄ Q(h´|h)Ў

m § 1 1 k ·
Q ( h'| h) ¦ ¨¨ ln 2SV 2

2V 2 ¦ E[ z ij ]( xi  P ' j ) 2 ¸¸
i 1 © j 1 ¹

݊Ёh´=<­1´, …, ­k´>ˈ㗠E[zij]෎Ѣᔧࠡ‫؛‬䆒h੠㾖ᆳࠄⱘ᭄᥂X䅵ㅫᕫߎDŽབࠡ᠔䅼
䆎˖

1
 ( xi  P j ) 2
2V 2
e
E[ zij ] 1
(6.29)
 ( xi  P n ) 2
¦
k
2V 2

n 1
e

಴ℸˈEMㅫ⊩ⱘ㄀ 1 ℹ˄Ԅ䅵ℹ˅෎ѢԄ䅵ⱘE[zij]乍ᅮНњQߑ᭄DŽ㄀ 2 ℹ˄᳔໻࣪


ℹ˅᥹ⴔᇏᡒՓℸQߑ᳔᭄໻ⱘؐ­1´, …, ­k´DŽ೼ᔧࠡ՟ᄤЁ˖

m § ·
1 1 k
arg max Q(h'| h) arg max ¦ ¨¨ ln  ¦ E[ z ]( x  P ' ) 2
¸
¸
2SV 2 2V j 1
2 ij i j
h' h' i 1© ¹
m k
arg min ¦¦ E[ zij ]( xi  P ' j ) 2 ˄6.30˅
h' i 1 j 1

಴ℸˈ䖭䞠ⱘᵕ໻Ԑ✊‫؛‬䆒Փᑇᮍ䇃Ꮒⱘࡴᴗ੠᳔ᇣ࣪њˈ݊Ё↣Ͼᅲ՟xiᇍ䇃Ꮒⱘ䋵
⤂­j´ᴗ䞡ЎE[zij]DŽ⬅ㄝᓣ 6.30 㒭ߎⱘ䞣ᰃ䗮䖛ᇚ↣Ͼ­j´䆒Ўࡴᴗḋᴀഛؐᴹ᳔ᇣ࣪DŽ

¦
m
E[ zij ]xi
Pj m i 1
˄6.31˅
¦
m
i 1
E[ zij ]

ᓣ 6.29 ੠ᓣ 6.31 ᅮНњ 6.12.1 㡖ЁᅮНⱘ k-ഛؐㅫ⊩ЁⱘϸϾℹ偸DŽ

6.13 ቅ㔉ૂ㺛‫ݻ‬䈱⢟

ᴀゴⱘ㽕⚍ࣙᣀ˖

 ὖ⥛ᄺдᮍ⊩߽⫼˄ᑊϨ㽕∖˅݇Ѣϡৠ‫؛‬䆒ⱘ‫ܜ‬偠ὖ⥛ҹঞ೼㒭ᅮ‫؛‬䆒ᯊ㾖ᆳࠄ
ϡৠ᭄᥂ⱘὖ⥛ⱘⶹ䆚DŽ䋱৊ᮃᮍ⊩߭ᦤկњὖ⥛ᄺдᮍ⊩ⱘ෎⸔DŽ䋱৊ᮃᮍ⊩䖬
ৃ෎Ѣ䖭ѯ‫ܜ‬偠੠᭄᥂㾖ᆳ‫؛‬ᅮˈ䌟ќ↣Ͼ‫׭‬䗝‫؛‬䆒ϔϾৢ偠ὖ⥛DŽ

 䋱৊ᮃᮍ⊩ৃ⫼Ѣ⹂ᅮ೼㒭ᅮ᭄᥂ᯊ᳔ৃ㛑ⱘ‫؛‬䆒üüᵕ໻ৢ偠ὖ⥛˄MAP˅‫؛‬
䆒DŽᅗ↨݊Ҫⱘ‫؛‬䆒᳈ৃ㛑៤Ў᳔Ӭ‫؛‬䆒DŽ

 䋱৊ᮃ᳔Ӭߚ㉏఼ᇚ᠔᳝‫؛‬䆒ⱘ乘⌟㒧ড়䍋ᴹˈᑊҹ݊ৢ偠ὖ⥛Ўᴗ䞡ˈҹ䅵ㅫᇍ
ᮄᅲ՟ⱘ᳔ৃ㛑ߚ㉏DŽ

 ᴈ㋴䋱৊ᮃߚ㉏఼ᰃ೼䆌໮ᅲ䰙ᑨ⫼䯂乬Ёᕜ᳝⫼ⱘϔ⾡䋱৊ᮃᄺдᮍ⊩DŽᅗ㹿⿄
Ўᴈ㋴ⱘ˄naive˅ᰃ಴Ў݊԰ⱘㅔ࣪‫؛‬ᅮ˖ሲᗻؐ೼㒭ᅮᅲ՟ⱘߚ㉏ᯊᴵӊ⣀ゟDŽ
ᔧ䆹‫؛‬ᅮ៤ゟᯊˈᴈ㋴䋱৊ᮃߚ㉏఼ৃ䕧ߎ MAP ߚ㉏DŽेՓℸ‫؛‬ᅮϡ៤ゟˈ೼ᄺ
дߚ㉏᭛ᴀⱘᚙ‫މ‬ϟˈᴈ㋴䋱৊ᮃߚ㉏䗮ᐌгᰃᕜ᳝ᬜⱘDŽ䋱৊ᮃ㕂ֵ㔥ᇍѢሲᗻ
ⱘᄤ䲚Ϟⱘϔ㒘ᴵӊ⣀ゟᗻ‫؛‬ᅮᦤկњ᳈ᔎⱘ㸼䖒㛑࡯DŽ

 䋱৊ᮃ᥼⧚Ḛᶊৃᇍ݊ҪϡⳈ᥹ᑨ⫼䋱৊ᮃ݀ᓣⱘᄺдᮍ⊩ⱘߚᵤᦤկ⧚䆎෎⸔DŽ
՟བˈ೼⡍ᅮᴵӊϟᄺдϔϾᇍᑨѢᵕ໻Ԑ✊‫؛‬䆒ⱘᅲؐⳂᷛߑ᭄ᯊˈᅗৃՓ䇃Ꮒ
ᑇᮍ᳔ᇣ࣪DŽ

 ᳔ᇣᦣ䗄䭓ᑺ‫߭ޚ‬ᓎ䆂䗝প䖭ḋⱘ‫؛‬䆒ˈᅗՓ‫؛‬䆒ⱘᦣ䗄䭓ᑺ੠㒭ᅮ‫؛‬䆒ϟ᭄᥂ⱘ
ᦣ䗄䭓ᑺⱘ੠᳔ᇣ࣪DŽ䋱৊ᮃ݀ᓣ੠ֵᙃ䆎Ёⱘ෎ᴀ㒧䆎ৃᦤկℸ‫ⱘ߭ޚ‬ḍ᥂DŽ

 ೼䆌໮ᅲ䰙ⱘᄺд䯂乬ЁˈᶤѯⳌ݇ⱘᅲ՟ব䞣ᰃϡৃ㾖ᆳࠄⱘDŽEM ㅫ⊩ᦤկњ
ϔϾᕜ䗮⫼ⱘᮍ⊩ˈᔧᄬ೼䱤㮣ব䞣ᯊ䖯㸠ᄺдDŽ䆹ㅫ⊩ᓔྟѢϔϾӏᛣⱘ߱ྟ‫؛‬
䆒DŽ✊ৢ䗁ҷഄ䅵ㅫ䱤㮣ব䞣ⱘᳳᳯؐ˄‫؛‬ᅮᔧࠡ‫؛‬䆒ᰃℷ⹂ⱘ˅ˈ‫ݡ‬䞡ᮄ䅵ㅫᵕ
໻Ԑ✊‫؛‬䆒˄‫؛‬ᅮ䱤㮣ব䞣ㄝѢ㄀ 1 ℹЁᕫࠄⱘᳳᳯؐ˅DŽ䖭ϔ䖛⿟ᬊᬯࠄϔϾሔ
䚼ⱘᵕ໻Ԑ✊‫؛‬䆒ˈҹঞ䱤㮣ব䞣ⱘԄ䅵ؐDŽ

೼ὖ⥛੠㒳䅵ᮍ䴶᳝䆌໮ᕜདⱘҟ㒡ᗻ᭛ゴˈབ Casella & Berger(1990)DŽ޴ᴀᖿ䗳খ㗗


㉏к㈡˄བ Maisel 1971; Speigel 1991)гᇍᴎ఼ᄺдⳌ݇ⱘὖ⥛੠㒳䅵⧚䆎ᦤկњӬ⾔ⱘ䯤
䗄DŽ

ᇍ䋱৊ᮃߚ㉏఼੠᳔ᇣᑇᮍ䇃Ꮒߚ㉏఼ⱘ෎ᴀҟ㒡⬅ Duda & Hart(1973)㒭ߎˈDomigos


& Pazzani˄1996˅ߚᵤњ೼ᗢḋⱘᴵӊϟᴈ㋴䋱৊ᮃᮍ⊩ৃ䕧ߎ᳔Ӭⱘߚ㉏ˈेՓ݊⣀ゟ
ᗻ‫؛‬ᅮϡ៤ゟᯊ˄݇䬂೼Ѣ೼ᗢḋⱘᴵӊϟेՓⳌ݇㘨ⱘৢ偠ὖ⥛Ԅ䅵ϡℷ⹂гৃ䕧ߎ᳔Ӭ
ߚ㉏˅DŽ

Cestnik(1990)䅼䆎њՓ⫼ m-Ԅ䅵ᴹԄ䅵ὖ⥛DŽ

ᇚϡৠ䋱৊ᮃᮍ⊩Ϣ‫އ‬ㄪᷥㄝ݊Ҫㅫ⊩䖯㸠↨䕗ⱘᅲ偠㒧ᵰৃ೼ Michie et al.˄1994˅


ЁᡒࠄDŽChauvin & Rumelhart(1995)ᦤկњ෎Ѣড৥Ӵ᪁ㅫ⊩ⱘ⼲㒣㔥㒰ⱘ䋱৊ᮃߚᵤDŽ

ᇍ᳔ᇣᦣ䗄䭓ᑺ‫ⱘ߭ޚ‬䅼䆎ৃখ㗗 Rissanen(1983, 1989)DŽQuinlan & Rivest˄1989˅ᦣ


䗄њ݊Փ⫼ҹ䙓‫އܡ‬ㄪᷥⱘ䖛ᑺᢳড়DŽ
д乬

6.1 ‫⃵ݡ‬㗗㰥 6.2.1 㡖Ёᑨ⫼䋱৊ᮃ㾘߭ⱘ՟ᄤDŽ‫؛‬ᅮए⫳‫އ‬ᅮᇍ䆹⮙Ҏ‫خ‬㄀Ѡ⃵࣪偠⌟


䆩ˈ㗠Ϩ࣪偠㒧ᵰгЎℷDŽḍ᥂䖭ϸ⃵⌟䆩ˈcancer ੠™cancer ⱘৢ偠ὖ⥛ᰃ໮ᇥ˛‫؛‬ᅮϸ
Ͼ⌟䆩ᰃⳌѦ⣀ゟⱘDŽ

6.2 ೼ 6.2.1 㡖ⱘ՟ᄤЁˈЎ䅵ㅫⰠ⮛ⱘৢ偠ὖ⥛ˈ䗮䖛ᇚ P(+|cancer)gP(cancer)੠


P(+|™cancer)gP(™cancer)ᔦϔ࣪ՓᅗӀⱘ੠Ў 1DŽՓ⫼䋱৊ᮃ݀ᓣ੠ܼὖ⥛݀ᓣ˄㾕㸼 6-1˅
䆕ᯢ䆹ᮍ⊩ᰃℷ⹂ⱘ˄े䖭ḋⱘᔦϔ࣪ৃҹᕫࠄ P(cancer|+)ⱘℷ⹂ؐ˅DŽ

6.3 㗗㰥ϟ䴶ⱘὖ⥛ᄺдㅫ⊩ FindGˈᅗ䕧ߎϔϾᵕ໻ϔ㠀࣪ⱘϔ㟈‫؛‬䆒˄՟བˈবൟ


ぎ䯈ⱘᶤϾᵕ໻ϔ㠀៤ਬ˅DŽ

(a)㒭ߎ P(h)੠ P(D|h)ⱘߚᏗˈҹՓ FindG ֱ䆕䕧ߎ MAP ‫؛‬䆒DŽ

(b)㒭ߎ P(h)੠ P(D|h)ⱘߚᏗˈҹՓ FindG ϡ㛑ֱ䆕䕧ߎ MAP ‫؛‬䆒DŽ

(c)㒭ߎ P(h)੠ P(D|h)ⱘߚᏗˈҹՓ FindG ֱ䆕䕧ߎ ML ‫؛‬䆒Ԛϡᰃ MAP ‫؛‬䆒DŽ

6.4 ೼ 6.3 㡖ЁⱘὖᗉᄺдߚᵤЁˈ‫؛‬ᅮњᅲ՟ᑣ߫<x1…xm>ᰃ೎ᅮⱘDŽ಴ℸˈ೼᥼ᇐ


P(D|h)㸼䖒ᓣᯊা䳔㗗㰥㗗ᆳࠄⳂᷛؐᑣ߫<d1…dm>ⱘὖ⥛DŽ㗗㰥᳈ϔ㠀ⱘᚙ‫ेˈމ‬ᅲ՟乎
ᑣϡ೎ᅮˈԚᰃᅗӀᰃҢᅲ՟ぎ䯈XϞᅮНⱘᶤὖ⥛ߚᏗϞ⣀ゟᢑপⱘDŽ᭄᥂D⦄೼ᖙ乏㹿
ᦣ䗄Ўϔ㒘ᑣ‫<{ي‬xi, di>}ˈ㗠P(D|h)ᖙ乏㛑ড᯴䘛ࠄ⡍ᅮᅲ՟xiⱘὖ⥛ˈҹঞⳂᷛؐdiⱘὖ⥛DŽ
䆕ᯢ೼ℸϔ㠀ḚᶊЁᓣ 6.5 ҡ✊៤ゟDŽᦤ⼎˖খ㗗 6.5 㡖ЁⱘߚᵤDŽ

6.5 㗗㰥ᇚ᳔ᇣᦣ䗄䭓ᑺ‫߭ޚ‬ᑨ⫼ࠄϔϾ‫؛‬䆒ぎ䯈Hˈᅗࣙ৿㟇໮nϾᏗᇨሲᗻⱘড়প
˄བ˖SunnyġWarm˅DŽ‫؛‬ᅮ↣Ͼ‫؛‬䆒ⱘ㓪ⷕЎㅔऩഄᇚ‫؛‬䆒Ёߎ⦄ⱘሲᗻ߫Вߎᴹˈ݊Ё
Ўњ㓪ⷕӏᛣϔϾnᏗᇨሲᗻ᠔䳔ԡ᭄Ўlog2nDŽ䆒ᛇ㒭ᅮ‫؛‬䆒ϟḋ՟㓪ⷕᮍᓣЎ˖㢹ḋ՟Ϣ
‫؛‬䆒ϔ㟈㓪ⷕ䳔 0 ԡˈ৺߭⫼log2mԡ˄㸼⼎mϾḋ՟Ёાѯ㹿䇃ߚ㉏њüüℷ⹂ⱘߚ㉏ৃ
⬅䆹‫؛‬䆒乘⌟ⱘؐⱘ৺ᅮᕫࠄ˅DŽ

(a)‫ߎݭ‬㽕㹿᳔ᇣ࣪ⱘ䞣ⱘ㸼䖒ᓣˈᣝ✻᳔ᇣᦣ䗄䭓ᑺ‫߭ޚ‬DŽ

(b)ᰃ৺ৃ㛑ᓎゟϔ㒘䆁㒗᭄᥂ˈՓᄬ೼ϔϾϔ㟈‫؛‬䆒ˈԚ MDL 䗝ᢽњϔϾ䕗ϡϔ㟈ⱘ


‫؛‬䆒DŽབᵰᰃ䖭ḋˈ㒭ߎ䖭ḋⱘ䆁㒗䲚˗৺߭㾷䞞ЎҔМDŽ

(c)㒭ߎ P(h)੠ P(D|h)ⱘὖ⥛ߚᏗҹՓϞ䴶ⱘ MDL ㅫ⊩䕧ߎ MAP ‫؛‬䆒DŽ

6.6 㗗㰥㡖 6.9.1 Ё PlayTennis 䯂乬ⱘᴈ㋴䋱৊ᮃߚ㉏఼ˈ⫼䋱৊ᮃ㕂ֵ㔥⬏ߎ݊ЁՓ⫼


ⱘᴵӊ⣀ゟᗻ‫؛‬ᅮDŽ㒭ߎϢ㒧⚍ Wind Ⳍ݇㘨ⱘᴵӊὖ⥛㸼DŽ
ㅢ7ㄖ 䇗㇍ᆜҖ⨼䇰

ᵜㄐ⨶䇪ൠ࡫⭫Ҷ㤕ᒢ㊫රⲴᵪಘᆖҐ䰞仈ѝⲴഠ䳮ˈ઼㤕ᒢ㊫රⲴᵪಘᆖҐ㇇⌅Ⲵ㜭
࣋DŽ䈕⨶䇪㠤࣋ҾഎㆄྲлⲴ䰞仈˖Ā൘ӰѸṧⲴᶑԦлᡀ࣏ⲴᆖҐᱟਟ㜭Ⲵ˛āԕ৺Ā൘
ӰѸᶑԦла⢩ᇊⲴᆖҐ㇇⌅ਟ‫؍‬䇱ᡀ࣏䘀㹼˛āѪҶ࠶᷀ᆖҐ㇇⌅ˈ䘉䟼㘳㲁Ҷє⿽ṶᷦDŽ
൘ਟ㜭䘁լ↓⺞˄PAC˅ṶᷦлˈᡁԜ⺞ᇊҶ㤕ᒢ‫ٷ‬䇮㊫࡛ˈࡔᯝᆳԜ㜭੖Ӿཊ亩ᔿᮠ䟿Ⲵ
䇝㓳ṧֻѝᆖҐᗇࡠ˗ᡁԜ䘈ᇊѹҶањሩ‫ٷ‬䇮オ䰤Ⲵ㠚❦ᓖ䟿ˈ⭡ᆳਟԕ⭼ᇊᖂ㓣ᆖҐᡰ
䴰Ⲵ䇝㓳ṧֻᮠⴞDŽ൘ࠪ䭉⭼䲀˄Mistake bound˅ṶᷦлˈᡁԜ㘳ḕҶањᆖҐಘ൘⺞ᇊ↓
⺞‫ٷ‬䇮ࡽਟ㜭ӗ⭏Ⲵ䇝㓳䭉䈟ᮠ䟿DŽ

7.1 ԁ㔃

൘⹄ウᵪಘᆖҐ䗷〻ѝˈᖸ㠚❦ൠᜣ⸕䚃ᆖҐಘ˄ᵪಘⲴᡆ䶎ᵪಘⲴ˅ᓄ䚥ᗚӰѸṧⲴ
㿴ࡉDŽᱟ੖ਟ㜭⤜・ҾᆖҐ㇇⌅⺞ᇊᆖҐ䰞仈ѝപᴹⲴ䳮ᓖ˛㜭੖⸕䚃Ѫ‫؍‬䇱ᡀ࣏ⲴᆖҐᴹ
ཊቁ䇝㓳ᱟᗵ㾱Ⲵᡆ‫ݵ‬䏣Ⲵ˛ྲ᷌ᆖҐಘ㻛‫ݱ‬䇨ੁᯭᮉ㘵ᨀࠪḕ䈒ˈ㘼нᱟ㿲ሏ䇝㓳䳶Ⲵ䲿
ᵪṧᵜˈՊሩᡰ䴰ṧֻᮠⴞᴹᘾṧⲴᖡ૽˛㜭੖࡫⭫ࠪᆖҐಘ൘ᆖࡠⴞḷ࠭ᮠࡽՊᴹཊቁ⅑
ࠪ䭉˛㜭੖࡫⭫ࠪа㊫ᆖҐ䰞仈ѝപᴹⲴ䇑㇇༽ᵲᓖ˛

㲭❦ሩᡰᴹ䘉Ӌ䰞仈Ⲵа㡜എㆄ䘈ᵚ⸕ˈնᱟнᆼᮤⲴᆖҐ䇑㇇⨶䇪ᐢ㓿ᔰ࿻ࠪ⧠DŽᵜ
ㄐ䱀䘠Ҷ䈕⨶䇪ѝⲴаӋ‫ޣ‬䭞㔃䇪ˈᒦᨀ‫׋‬Ҷ൘⢩ᇊ䰞仈лаӋ䰞仈ⲴㆄṸDŽ䘉䟼ᡁԜ⵰䟽
䇘䇪ਚ㔉ᇊⴞḷ࠭ᮠⲴ䇝㓳ṧ઼ֻ‫ى‬䘹‫ٷ‬䇮オ䰤ⲴᶑԦлˈሩ䈕ᵚ⸕Ⲵⴞḷ࠭ᮠⲴᖂ㓣ᆖҐ
䰞仈DŽ൘䘉ṧⲴṶᷦлˈѫ㾱㾱䀓ߣⲴ䰞仈ྲ˖䴰㾱ཊቁ䇝㓳ṧֻ᡽䏣ԕᡀ࣏ൠᆖҐࡠⴞḷ
࠭ᮠˈԕ৺ᆖҐಘ൘䗮ࡠⴞḷࡽՊᴹཊቁ⅑ࠪ䭉DŽྲਾ䶒ሶⴻࡠˈᴹਟ㜭ሩ䘉Ӌ䰞仈ᨀࠪᇊ
䟿Ⲵкл⭼ˈ䘉สҾᆖҐ䰞仈Ⲵྲл኎ᙗDŽ
x ᆖҐಘᡰ㘳㲁Ⲵ‫ٷ‬䇮オ䰤Ⲵབྷሿ઼༽ᵲᓖ
x ⴞḷᾲᘥ享䘁լࡠᘾṧⲴ㋮ᓖ
x ᆖҐಘ䗃ࠪᡀ࣏Ⲵ‫ٷ‬䇮Ⲵਟ㜭ᙗ
x 䇝㓳ṧֻᨀ‫׋‬㔉ᆖҐಘⲴᯩᔿ

ᵜㄐⲴབྷ䜘࠶ሶнՊ⵰䟽Ҿঅ⤜ⲴᆖҐ㇇⌅ˈ㘼ᱟ൘䖳ᇭᒯⲴᆖҐ㇇⌅㊫࡛ѝ࡫⭫ᡰ㘳
㲁Ⲵ‫ٷ‬䇮オ䰤ˈԕ৺䇝㓳ṧֻⲴᨀ‫׋‬ᯩᔿㅹDŽᡁԜⲴⴞḷᱟѪҶഎㆄԕлⲴ䰞仈˖
x ṧᵜ༽ᵲᓖ˄Sample complexity˅DŽᆖҐಘ㾱᭦ᮋࡠᡀ࣏‫ٷ‬䇮˄ԕ䖳儈Ⲵᾲ⦷˅ˈ
䴰㾱ཊቁ䇝㓳ṧֻ˛
x 䇑㇇༽ᵲᓖ(Computational complexity)DŽᆖҐಘ㾱᭦ᮋࡠᡀ࣏‫ٷ‬䇮˄ԕ䖳儈Ⲵᾲ
⦷˅䴰㾱ཊབྷⲴ䇑㇇䟿˛
x ࠪ䭉⭼䲀˄Mistake bound˅DŽ൘ᡀ࣏᭦ᮋࡠањ‫ٷ‬䇮ࡽˈᆖҐಘሩ䇝㓳ṧֻⲴ
䈟࠶㊫ᴹཊቁ⅑˛

⌘᜿ѪҶ䀓ߣ䘉Ӌ䰞仈䴰㾱䇨ཊ⢩↺ⲴᶑԦ䇮ᇊDŽֻྲˈᴹ䇨ཊᯩ⌅ᶕᤷᇊሩҾᆖҐಘ
ӰѸᱟĀᡀ࣏ⲴāDŽа⿽ਟ㜭Ⲵࡔᯝᯩ⌅ᱟ˖ᆖҐಘᱟ੖䗃ࠪㅹҾⴞḷᾲᘥⲴ‫ٷ‬䇮DŽਖа⿽
ᯩ⌅ᱟਚ㾱≲䗃ࠪⲴ‫ٷ‬䇮оⴞḷᾲᘥ൘ཊᮠᰦ䰤޵᜿㿱а㠤ˈᡆᱟᆖҐಘ䙊ᑨՊ䗃ࠪ䘉ṧⲴ
‫ٷ‬䇮DŽ⴨լൠˈ䘈ᗵ享ᤷᇊᆖҐಘᱟྲօ㧧ᗇ䇝㓳ṧֻⲴDŽਟԕᤷᇊ䇝㓳ṧֻ⭡ањᯭᮉ㘵
㔉ࠪˈᡆ⭡ᆖҐಘ㠚ᐡᇎ傼ᶕ㧧ᗇˈᡆ᤹➗Ḁ䗷〻䲿ᵪൠ⭏ᡀ㘼нਇᆖҐಘⲴ᧗ࡦDŽਟԕ亴
ᯉˈሩк䘠䰞仈Ⲵഎㆄ‫׍‬䎆ҾᡁԜᡰ㘳㲁Ⲵ⢩ᇊṶᷦᡆᆖҐ⁑රDŽ

ᵜㄐⲴਾ㔝ྲлᆹᧂDŽ7.2 㢲ӻ㓽ਟ㜭䘁լ↓⺞˄PAC˅ᆖҐṶᷦDŽ7.3 㢲൘↔ PAC Ṷ


ᷦл࠶᷀Ҷࠐ⿽ᆖҐ㇇⌅Ⲵṧᵜ༽ᵲᓖ઼䇑㇇༽ᵲᓖDŽ7.4 㢲ӻ㓽Ҷ‫ٷ‬䇮オ䰤༽ᵲᓖⲴањ
䟽㾱ᓖ䟿ḷ߶ˈ〠Ѫ VC-㔤ˈᒦфሶ PAC ࠶᷀ᢙኅࡠ‫ٷ‬䇮オ䰤ᰐ䲀ⲴᛵߥDŽ7.5 㢲ӻ㓽Ҷࠪ
䭉⭼䲀⁑රˈᒦᨀ‫׋‬Ҷࡽ䶒ㄐ㢲ѝࠐњᆖҐ㇇⌅ࠪ䭉ᮠ䟿Ⲵ⭼䲀DŽᴰਾˈӻ㓽Ҷ࣐ᵳཊᮠ㇇
⌅ˈᆳᱟањ㔃ਸཊњᆖҐ㇇⌅ᶕӗ⭏ਸᒦⲴ亴⍻Ⲵᇎ⭘㇇⌅ˈ䘈ӻ㓽Ҷ䈕㇇⌅Ⲵ⨶䇪ࠪ䭉
⭼䲀DŽ

7.2 ਥ㜳ᆜҖ䘇ղ↙⺤‫ٽ‬䇴

ᵜ㢲ᡁԜ㘳㲁ᆖҐ䰞仈Ⲵа⿽⢩↺Ṷᷦˈ〠Ѫਟ㜭䘁լ↓⺞ (probably approximately


correct, PAC)ᆖҐ⁑රDŽ俆‫ݸ‬ᡁԜᤷᇊ PAC ᆖҐ⁑ර䘲⭘Ⲵ䰞仈ˈ❦ਾ࠶᷀൘↔ PAC ⁑ර
лᆖҐн਼㊫࡛Ⲵⴞḷ࠭ᮠ䴰㾱ཊቁ䇝㓳ṧ઼ֻཊབྷⲴ䇑㇇䟿DŽѪㆰ᰾䎧㿱ˈ䘉䟼Ⲵ䇘䇪ሶ
䲀ࡦ൘ᆖҐᐳቄ٬ᾲᘥˈф䇝㓳ᮠᦞᱟᰐಚ༠ⲴDŽ❦㘼ˈ䇨ཊ㔃䇪ਟᢙኅࡠᴤа㡜Ⲵᛵᖒˈ
ྲᆖҐᇎ٬ⴞḷ࠭ᮠ˄∄ྲ Natarajan 1991 ˅ˈᡆӾḀ⿽㊫රⲴᴹಚ༠ᮠᦞѝ䘋㹼ᆖҐ˄ֻ
ྲˈ㿱 Laird 1988; Kearns & Vazirani 1994˅DŽ

7.2.1 䰤从Ṽᷬ

ྲࡽ䶒Ⲵㄐ㢲ˈԔ X ԓ㺘ᡰᴹᇎֻⲴ䳶ਸˈⴞḷ࠭ᮠ൘ަкᇊѹDŽֻྲˈX ਟ㺘⽪ᡰᴹ


ӪⲴ䳶ਸˈ⇿њӪ᧿䘠Ѫ኎ᙗ age˄young ᡆ old˅઼ height (short ᡆ long)DŽԔ C ԓ㺘ᆖҐ
ಘ㾱ᆖҐⲴⴞḷᾲᘥ䳶ਸDŽC ѝ⇿њⴞḷᾲᘥ c ሩᓄҾ X ⲴḀњᆀ䳶ˈᡆањㅹ᭸Ⲵᐳቄ࠭
ᮠ c˖Xė{0,1}DŽֻྲˈC ѝањⴞḷ࠭ᮠ c Ѫᾲᘥ˖Āᱟ━䴚㘵ⲴӪāDŽ㤕 x ᱟ c Ⲵ↓ֻˈ
ࡉ c(x)=1˗㤕 x Ѫ৽ֻˈࡉ c(x)=0DŽ

‫ٷ‬ᇊᇎֻ᤹➗Ḁᾲ⦷࠶ᐳ D Ӿ X ѝ䲿ᵪӗ⭏DŽֻྲ D ਟѪӾḀփ㛢⭘૱୶ᓇ䎠ࠪᶕⲴ


Ӫ䘉ṧањᇎֻ࠶ᐳDŽа㡜ൠˈD ਟѪԫօ࠶ᐳˈ㘼фᆳሩᆖҐಘᱟᵚ⸕ⲴDŽሩҾ D ᡰ㾱≲
ⲴᱟᆳⲴっᇊᙗˈণ䈕࠶ᐳнՊ䲿ᰦ䰤ਈॆDŽ䇝㓳ṧֻⲴ⭏ᡀ᤹➗ D ࠶ᐳ䲿ᵪᣭਆᇎֻ xˈ
❦ਾ x ৺ަⴞḷ٬ c(x)㻛ᨀ‫׋‬㔉ᆖҐಘDŽ

ᆖҐಘ L ൘ᆖҐⴞḷᾲᘥᰦ㘳㲁ਟ㜭‫ٷ‬䇮Ⲵ䳶ਸ HDŽֻྲˈH ਟѪᡰᴹ㜭⭡኎ᙗ age ઼


height Ⲵਸਆ㺘⽪Ⲵ‫ٷ‬䇮䳶ਸDŽ൘㿲ሏࡠҶа㌫ࡇ‫ޣ‬Ҿⴞḷᾲᘥ c ⲴⲴ䇝㓳ṧֻਾˈL ᗵ享
Ӿ H ѝ䗃ࠪḀ‫ٷ‬䇮 hˈᆳᱟሩ c Ⲵՠ䇑DŽѪ‫ޜ‬ᒣ䎧㿱ˈᡁԜ䙊䗷 h ൘Ӿ X ѝᣭਆⲴᯠᇎֻк
Ⲵᙗ㜭ᶕ䇴ՠ L ᱟ੖ᡀ࣏DŽᣭਆ䗷〻᤹➗࠶ᐳ Dˈণоӗ⭏䇝㓳ᮠᦞ⴨਼Ⲵᾲ⦷࠶ᐳDŽ

൘↔ṶᷦлˈᡁԜᝏ‫ޤ‬䏓Ⲵᱟ࡫⭫н਼ᆖҐಘ L Ⲵᙗ㜭ˈ䘉ӋᆖҐಘ֯⭘н਼‫ٷ‬䇮オ
䰤 HˈᒦᆖҐн਼㊫࡛Ⲵ C ѝⲴⴞḷᾲᘥDŽ⭡ҾᡁԜ㾱≲ L 䏣ཏа㡜ˈԕӾ C ѝᆖࡠԫօ
ⴞḷᾲᘥˈᡰԕн䇪䇝㓳ṧֻⲴ࠶ᐳྲօˈᡁԜ㓿ᑨՊሩ C ѝᡰᴹਟ㜭Ⲵⴞḷᾲᘥ઼ᡰᴹ
ਟ㜭Ⲵᇎֻ࠶ᐳ D 䘋㹼ᴰᐞᛵߥⲴ࠶᷀DŽ
7.2.2 ‫ٽ‬䇴Ⲻ䭏䈥⦽

ѪҶ᧿䘠ᆖҐಘ䗃ࠪⲴ‫ٷ‬䇮 h ሩⵏᇎⴞḷᾲᘥⲴ䙬䘁〻ᓖˈ俆‫ݸ‬㾱ᇊѹ‫ٷ‬䇮 h ሩᓄҾⴞ


ḷᾲᘥ c ઼ᇎֻ࠶ᐳ D Ⲵⵏᇎ䭉䈟⦷˄true error˅DŽ䶎ᖒᔿⲴ᧿䘠ᱟ˖h Ⲵⵏᇎ䭉䈟⦷Ѫᓄ⭘
h ࡠሶᶕ᤹࠶ᐳ D ᣭਆⲴᇎֻᰦⲴᵏᵋⲴ䭉䈟⦷DŽ ᇎ䱵кㅜ 5 ㄐᐢ㓿ᇊѹҶ h Ⲵⵏᇎ䭉䈟⦷DŽ
Ѫᯩ‫ׯ‬䎧㿱ˈ䘉䟼䟽䘠ал䈕ᇊѹˈ֯⭘ c 㺘⽪ᐳቄⴞḷ࠭ᮠDŽ

定义: ‫ٷ‬䇮 h ‫ޣ‬Ҿⴞḷᾲᘥ c ઼࠶ᐳ D Ⲵⵏ


ⵏᇎ䭉䈟⦷(true error)Ѫ h 䈟࠶㊫᤹➗ D 䲿
ᵪᣭਆⲴᇎֻⲴᾲ⦷DŽ

errorD (h) { Pr [c( x) z h( x)]


xD

䘉䟼ㅖਧ Pr ԓ㺘൘ᇎֻ࠶ᐳ D к䇑㇇ᾲ⦷DŽ


xD

മ 7-1 മ⽪Ҷ䈕䭉䈟⦷ⲴᇊѹDŽᾲᘥ c ઼ h 㻛㺘⽪Ѫ X ѝḷѪ↓ֻⲴᇎֻ䳶ਸDŽh ሩᓄ


Ҿ c Ⲵ䭉䈟⦷Ѫˈ䲿ᵪ䘹ਆⲴᇎֻ㩭‫ ޕ‬h ઼ c на㠤४䰤˄ণᆳԜⲴ䳶ਸᐞ˅Ⲵᾲ⦷DŽ⌘᜿ˈ
䭉䈟⦷ᇊѹ൘ᮤњᇎֻ࠶ᐳѻкˈ㘼нਚᱟ䇝㓳ṧֻѻкˈഐѪᆳᱟ൘ᇎ䱵ᓄ⭘↔‫ٷ‬䇮 h
ࡠਾ㔝ᇎֻкᰦՊ䙷ࡠⲴⵏᇎ䭉䈟⦷DŽ

插图——原书页码:205

Instance space: ᇎֻオ䰤

Where c and h disagree: c ઼ h на㠤Ⲵ४䰤

മ 7-1 ‫ޣ‬Ҿⴞḷᾲᘥ c ‫ٷ‬䇮 h Ⲵ䭉䈟⦷

‫ޣ‬Ҿ c Ⲵ h Ⲵ䭉䈟⦷Ѫањ䲿ᵪᣭਆⲴᇎֻ㩭‫ ޕ‬h ઼ c ሩᆳⲴ࠶㊫на㠤Ⲵ४䰤Ⲵᾲ⦷DŽ+઼


-⛩㺘⽪↓৽䇝㓳ֻDŽ⌘᜿ h ‫ޣ‬Ҿ c ᴹањ䶎䴦Ⲵ䭉䈟⦷ˈቭ㇑䗴ӺѪ→ h ઼ c ൘ᡰᴹ 5 њ䇝㓳ṧ
ֻк䜭а㠤DŽ

⌘᜿ˈ↔䭉䈟⦷ᕪ⛸ൠ‫׍‬䎆Ҿᵚ⸕Ⲵᾲ⦷࠶ᐳ DDŽֻྲˈྲ᷌ D ᱟањ൷रⲴᾲ⦷࠶ᐳˈ


ᆳሩ X ѝ⇿њᇎֻ䜭䍻Ҹ⴨਼Ⲵᾲ⦷ˈ䛓Ѹമ 7-1 ѝ‫ٷ‬䇮Ⲵ䭉䈟⦷ሶѪ h ઼ c на㠤Ⲵオ䰤
൘‫ޘ‬䜘ᇎֻオ䰤ѝⲴ∄ֻDŽ❦㘼ˈྲ᷌ D ᚠྭᢺ h ઼ c на㠤४䰤ѝⲴᇎֻ䍻ҸҶᖸ儈Ⲵᾲ
⦷ˈ⴨਼Ⲵ h ઼ c ሶ䙐ᡀᴤ儈Ⲵ䭉䈟⦷DŽᶱㄟᛵߥл㤕 D ሩ┑䏣 h(x)=c(x)Ⲵᡰᴹᇎֻ䍻Ҹ䴦
ᾲ⦷ˈമ 7-1 ѝ h Ⲵ䭉䈟⦷ሶѪ 1ˈ㘼н䇪 h ઼ c ൘ཊቁᇎֻк࠶㊫а㠤DŽ

ᴰਾˈ⌘᜿hሩᓄҾcⲴ䭉䈟⦷н㜭ⴤ᧕⭡ᆖҐಘ㿲ሏࡠDŽLਚ㜭㿲ሏࡠ൘䇝㓳ṧֻкh
Ⲵᙗ㜭ˈᆳҏਚ㜭൘↔ส⹰к䘹ᤙަ‫ٷ‬䇮䗃ࠪDŽᡁԜሶ֯⭘ᵟ䈝䇝㓳䭉䈟⦷(training error)
ᶕᤷԓ䇝㓳ṧֻѝ㻛h䈟࠶㊫Ⲵṧֻᡰঐ∄ֻˈԕ४࠶к䶒ᇊѹⲴⵏᇎ䭉䈟⦷DŽ䘉䟼‫ޣ‬Ҿᆖ
Ґ༽ᵲᓖⲴ࠶᷀ཊᮠത㔅⵰䘉ṧⲴ䰞仈˖Ā hⲴ㿲ሏࡠⲴ䇝㓳䭉䈟⦷ሩⵏᇎ䭉䈟⦷errorD(h)
ӗ⭏н↓⺞ՠ䇑Ⲵਟ㜭ᙗᴹཊབྷ˛ā
⌘᜿↔䰞仈оㅜ 5 ㄐ㘳㲁Ⲵ䰞仈ѻ䰤Ⲵᇶ࠷㚄㌫DŽഎᗶ൘ㅜ 5 ㄐѝᇊѹҶ h ‫ޣ‬Ҿṧֻ䳶
ਸ S Ⲵṧᵜ䭉䈟⦷ (sample error)ˈѪṧֻ䳶ਸ S ѝ㻛 h 䈟࠶㊫Ⲵṧֻᡰঐ∄ֻDŽк䶒ᇊѹ
Ⲵ䇝㓳䭉䈟⦷ቡᱟᖃ S Ѫ䇝㓳ṧֻ䳶ਸᰦⲴṧᵜ䭉䈟⦷DŽ൘ㅜ 5 ㄐѝˈᡁԜ൘ᮠᦞṧᵜ S
⤜・Ҿ h ᣭਆⲴࡽᨀлˈ⺞ᇊṧᵜ䭉䈟⦷ሩՠ䇑ⵏᇎ䭉䈟⦷ӗ⭏䈟ሬⲴᾲ⦷DŽ❦㘼ᖃ S ᱟ䇝
㓳ᮠᦞ䳶ਸᰦˈᆖࡠⲴ‫ٷ‬䇮䶎ᑨ‫׍‬䎆Ҿ SDŽഐ↔ˈᵜㄐሶ㔉ࠪ䘉а䟽㾱Ⲵ⢩↺ᛵᖒлⲴ࠶᷀DŽ

7.2.3 PAC ਥᆜҖᙝ

ᡁԜⲴⴞḷᱟ࡫⭫ࠪ䘉ṧⲴⴞḷᾲᘥˈᆳԜ㜭ཏӾਸ⨶ᮠ䟿Ⲵ䲿ᵪᣭਆ䇝㓳ṧֻѝ䙊䗷
ਸ⨶Ⲵ䇑㇇䟿ਟ䶐ൠᆖҐࡠDŽ

ሩҾਟᆖҐᙗᘾṧ䘋㹼㺘䘠˛а⿽ਟ㜭Ⲵ䘹ᤙᱟ᧿䘠ѪҶᆖҐࡠањ֯errorD(h)=0 Ⲵ
‫ٷ‬䇮hˈᡰ䴰Ⲵ䇝㓳ṧֻᮠDŽнᒨⲴᱟˈ䘉ṧⲴ䘹ᤙᱟнਟ㹼Ⲵˈ৏ഐᴹєњ˖俆‫ˈݸ‬䲔䶎
ሩXѝ⇿њਟ㜭Ⲵᇎֻ䜭ᨀ‫׋‬䇝㓳ṧֻ˄ањнᇎ䱵Ⲵ‫ٷ‬ᇊ˅ˈ੖ࡉՊᴹཊњ‫ٷ‬䇮о䇝㓳ṧ
ֻа㠤ˈ㘼фᆖҐಘᰐ⌅‫؍‬䇱䘹ᤙࡠⴞḷᾲᘥDŽަ⅑ˈ⭡Ҿ䇝㓳ṧֻᱟ䲿ᵪᣭਆⲴˈᙫᴹа
њ䶎 0 Ⲵᾲ⦷֯ᗇᆖҐಘ䶒ѤⲴ䇝㓳ṧֻᴹ䈟ሬᙗDŽ˄ֻྲˈ㲭❦ᡁԜ㓿ᑨਟ㿱ࡠн਼䓛儈
Ⲵ━䴚㘵ˈն൘Ḁаཙѝᙫᆈ൘䘉ṧⲴᵪՊˈᡰᴹ䇝㓳ṧֻ䜭ࡊྭᱟ 2 ㊣儈DŽ˅

Ѫ䀓ߣ䘉єњഠ䳮ˈᡁԜ⭘є⿽ᯩ⌅ᕡॆҶሩᆖҐಘⲴ㾱≲DŽ俆‫ˈݸ‬ᡁԜн㾱≲ᆖҐಘ
䗃ࠪ䴦䭉䈟⦷‫ٷ‬䇮ˈ㘼ਚ㾱≲ަ䭉䈟⦷㻛䲀ᇊ൘Ḁᑨᮠ¦Ⲵ㤳ത޵ˈ¦ਟѪԫ᜿ሿDŽㅜҼˈ
н޽㾱≲ᆖҐಘሩᡰᴹⲴ䲿ᵪᣭਆṧֻᒿࡇ䜭㜭ᡀ࣏ˈਚ㾱≲ަཡ䍕Ⲵᾲ⦷㻛䲀ᇊ൘Ḁњᑨ
ᮠ¥Ⲵ㤳ത޵ˈ¥ҏਟਆԫ᜿ሿDŽㆰ㘼䀰ѻˈᡁԜਚ㾱≲ᆖҐಘਟ㜭ᆖҐࡠањ䘁լ↓⺞Ⲵ
‫ٷ‬䇮ˈഐ↔ᗇࡠҶ䈕ᵟ䈝Āਟ㜭䘁լ↓⺞ᆖҐāˈᡆ PAC ᆖҐDŽ

㘳㲁Ḁаⴞḷᾲᘥ㊫࡛C઼֯⭘‫ٷ‬䇮オ䰤HⲴᆖҐಘLDŽ䶎ᖒᔿൠˈሩCѝԫ᜿ⴞḷᾲᘥ
cˈ㤕൘㿲ሏࡠਸ⨶ᮠⴞⲴ䇝㓳ṧֻᒦᢗ㹼Ҷਸ⨶Ⲵ䇑㇇䟿ਾˈLԕᾲ⦷(1- ¥ )䗃ࠪањ
errorD(h)<¦Ⲵ‫ٷ‬䇮hˈࡉᡁԜ〠ᾲᘥ㊫࡛Cᱟ֯⭘HⲴLਟPACᆖҐⲴDŽᴤ㋮⺞Ⲵᇊѹྲл˖

定义: 㘳㲁аᾲᘥ㊫࡛Cᇊѹ൘䮯ᓖѪnⲴᇎֻ䳶ਸXкˈᆖҐಘL֯⭘‫ٷ‬䇮オ䰤HDŽ
ᖃሩᡰᴹcęCˈXкⲴ࠶ᐳDˈ¦┑䏣 0<¦<1/2ˈԕ৺¥┑䏣 0<¥<1/2ˈᆖҐಘL
ሶԕ㠣ቁ 1-¥Ⲵᾲ⦷䗃ࠪа‫ٷ‬䇮hęHˈ֯errorD(h)ݦˈ䘉ᰦ〠Cᱟ֯⭘HⲴLਟPAC
ᆖҐⲴDŽᡰ֯⭘Ⲵᰦ䰤Ѫ 1/¦ˈ1/¥ˈnԕ৺size(c)Ⲵཊ亩ᔿ࠭ᮠDŽ

䘉䟼Ⲵᇊѹ㾱≲ L ┑䏣єњᶑԦDŽ俆‫ˈݸ‬L ᗵ享ԕԫ᜿儈ᾲ⦷(1-¥)䗃ࠪањ䭉䈟⦷ԫ


᜿վ˄¦˅Ⲵ‫ٷ‬䇮DŽㅜҼˈᆖҐ䗷〻ᗵ享ᱟ儈᭸Ⲵˈަᰦ䰤ᴰཊԕཊ亩ᔿᯩᔿ໎䮯ˈཊ亩ᔿ
ѝ 1/¦઼ 1/¥ᇊѹҶሩ䗃ࠪ‫ٷ‬䇮㾱≲Ⲵᕪᓖˈn ઼ size(c)ࡉᇊѹҶᇎֻオ䰤 X ઼ᾲᘥ㊫ C ѝ
പᴹⲴ༽ᵲᓖDŽ䘉䟼ˈn Ѫ X ѝᇎֻⲴ䮯ᓖDŽֻྲˈྲ᷌ᇎֻѪ k њᐳቄ٬Ⲵਸਆˈ䛓Ѹ
n=kDŽsize(c)Ѫ‫ٷ‬ᇊሩ C 䟷⭘Ḁ⿽㺘⽪ᯩ⌅ᰦˈަѝⲴᾲᘥ c Ⲵ㕆⸱䮯ᓖDŽֻྲˈ㤕 C ѝⲴ
ᾲᘥѪ㠣ཊ k њᐳቄ⢩ᖱⲴਸਆˈ⇿њᾲᘥ䙊䗷ࡇࠪਸਆᔿѝⲴ⢩ᖱⲴ㍒ᕅᶕ᧿䘠ˈ䛓Ѹ
size(c)Ѫᇎ䱵⭘ᶕ᧿䘠 c Ⲵᐳቄ⢩ᖱᮠ䟿DŽ

䘉䟼ሩ PAC ᆖҐⲴᇊѹᔰ࿻ⴻᶕਚ‫ޣ‬ᗳᆖҐᡰ䴰Ⲵ䇑㇇䍴Ⓚˈ㘼൘ᇎ䐥ѝˈ䙊ᑨᴤ‫ޣ‬


ᗳᡰ䴰Ⲵ䇝㓳ṧֻᮠDŽ❦㘼䘉є㘵ᱟ㍗ᇶ⴨‫ྲ˖Ⲵޣ‬᷌ L ሩ⇿њ䇝㓳ṧֻ䴰㾱Ḁᴰሿ༴⨶
ᰦ䰤ˈ䛓ѸѪҶ֯ c ᱟ L ਟ PAC ᆖҐⲴˈL ᗵ享Ӿཊ亩ᔿᮠ䟿Ⲵ䇝㓳ṧֻѝ䘋㹼ᆖҐDŽᇎ
䱵кˈѪᱮ⽪Ḁⴞḷᾲᘥ㊫࡛ C ᱟਟ PAC ᆖҐⲴˈањިරⲴ䙄ᖴᱟ䇱᰾ C ѝ⇿њⴞḷᾲ
ᘥਟԕӾཊ亩ᔿᮠ䟿Ⲵ䇝㓳ṧֻѝᆖҐࡠˈ㘼ਾ䇱᰾⇿ṧֻ༴⨶ᰦ䰤ҏ䲀Ҿཊ亩ᔿ㓗DŽ
൘㔗㔝䇘䇪ԕࡽˈᗵ享ᤷࠪ䳀ਜ਼൘ PAC ਟᆖҐᙗᇊѹѝⲴањѕṬⲴ䲀ࡦDŽ䈕ᇊѹ䳀
ਜ਼‫ٷ‬ᇊҶᆖҐಘⲴ‫ٷ‬䇮オ䰤 H वਜ਼ањ‫ٷ‬䇮ˈᆳо C ѝ⇿њⴞḷᾲᘥਟᴹԫ᜿ሿⲴ䈟ᐞDŽ
䘉а⛩ᶕⓀҾк䶒ᇊѹѝ㾱≲ᆖҐಘ䈟ᐞ⭼䲀¦ԫ᜿᧕䘁Ҿ 0 ᰦҏ㜭ᡀ࣏䘀㹼DŽᖃ❦ˈྲ᷌
亴‫ݸ‬н⸕䚃 C ሶᖸ䳮‫؍‬䇱䘉а⛩˄ሩҾањӾമ‫ۿ‬ѝ䇶࡛ࠪӪ㝨Ⲵ〻ᒿᶕ䈤ˈC ᱟӰѸ˛˅ˈ
䲔䶎 H ਆѪ X Ⲵᑲ䳶DŽྲㅜ 2 ㄐᤷࠪⲴˈ䘉ṧањᰐ‫ Ⲵٿ‬H ሶнՊӾਸ⨶ᮠ䟿Ⲵ䇝㓳ṧֻ
ѝ⌋ॆDŽн䗷ˈสҾ PAC ᆖҐ⁑රⲴ㔃䇪ˈሩҾ亶Պн਼ᆖҐ䰞仈Ⲵ⴨ሩ༽ᵲᓖԕ৺⌋ॆ
㋮ᓖ䲿⵰䇝㓳ṧֻ㘼ᨀ儈Ⲵ∄⦷ॱ࠶ᴹ⳺DŽᴤ䘋а↕ˈ7.3.1 㢲ѝሶ䀓䲔䘉аѕṬ‫ٷ‬ᇊˈԕ
㘳㲁ᆖҐಘн亴‫ٷݸ‬ᇊⴞḷᾲᘥᖒᔿⲴᛵߥDŽ

7.3 ᴿ䲆‫ٽ‬䇴グ䰪Ⲻṭᵢགྷᵸᓜ

ྲкᡰ䘠ˈPAC ਟᆖҐᙗᖸབྷ〻ᓖк⭡ᡰ䴰Ⲵ䇝㓳ṧֻᮠ⺞ᇊDŽ䲿⵰䰞仈㿴⁑Ⲵ໎䮯
ᡰᑖᶕⲴᡰ䴰䇝㓳ṧֻⲴ໎䮯〠Ѫ䈕ᆖҐ䰞仈Ⲵṧᵜ༽ᵲᓖ(sample complexity)ˈᆳᱟ䙊ᑨ
ᴰᝏ‫ޤ‬䏓Ⲵ⢩ᙗDŽ৏ഐ൘Ҿˈ൘ཊᮠᇎ䱵䰞仈ѝˈᴰ䲀ࡦᆖҐಘᡀ࣏Ⲵഐ㍐ᱟᴹ䲀Ⲵਟ⭘䇝
㓳ᮠᦞDŽ

䘉䟼ሶṧᵜ༽ᵲᓖⲴ䇘䇪䲀ᇊҾа㊫䶎ᑨᒯ⌋ⲴᆖҐಘˈ〠Ѫа㠤ᆖҐಘ(consistent
learner)DŽањᆖҐಘᱟа㠤Ⲵ(consistent)ˈᖃᆳਚ㾱൘ਟ㜭ᰦ䜭䗃ࠪ㜭ᆼ㖾ᤏਸ䇝㓳ᮠᦞⲴ
‫ٷ‬䇮DŽ⭡ҾᡁԜ䙊ᑨ䜭ᴤௌ⅒㜭о䇝㓳ᮠᦞᤏਸ〻ᓖᴤ儈Ⲵ‫ٷ‬䇮ˈഐ↔㾱≲ᆖҐ㇇⌅Ⲵа㠤
ᙗᱟਸ⨶ⲴDŽ⌘᜿ࡽ൘ㄐ㢲䇘䇪ⲴᖸཊᆖҐಘˈवᤜㅜ 2 ㄐѝⲴᡰᴹᆖҐ㇇⌅ˈ䜭ᱟа㠤ᆖ
ҐಘDŽ

ᱟ੖㜭⤜・Ҿа⢩ᇊⲴ㇇⌅ˈ᧘ሬࠪԫ᜿а㠤ᆖҐಘᡰ䴰䇝㓳ṧֻᮠⲴ⭼䲀˛എㆄᱟ㛟
ᇊⲴDŽѪ䘋㹼䈕᧘ሬˈ䴰㾱എ亮алㅜ 2 ㄐᇊѹⲴਈරオ䰤DŽ൘䛓䟼ਈරオ䰤VSH, D㻛ᇊѹ
Ѫ㜭↓⺞࠶㊫䇝㓳ṧֻDⲴᡰᴹ‫ٷ‬䇮hęHⲴ䳶ਸ˖

VS H , D {h  H | (¢ x, c( x)²  D)(h( x) c( x)}

ਈරオ䰤Ⲵ䟽㾱᜿ѹ൘Ҿˈ⇿ња㠤ᆖҐಘ䜭䗃ࠪа኎Ҿਈරオ䰤Ⲵ‫ٷ‬䇮ˈ㘼н䇪ᴹᘾ
ṧⲴᇎֻオ䰤Xǃ‫ٷ‬䇮オ䰤Hᡆ䇝㓳ᮠᦞDDŽ৏ഐᖸㆰঅˈ⭡ਈරオ䰤ⲴᇊѹˈVSH, Dवਜ਼H
ѝᡰᴹⲴа㠤‫ٷ‬䇮DŽഐ↔ˈѪ⭼ᇊԫ᜿а㠤ᆖҐಘᡰ䴰Ⲵṧֻᮠ䟿ˈਚ䴰㾱⭼ᇊѪ‫؍‬䇱ਈර
オ䰤ѝ⋑ᴹнਟ᧕ਇ‫ٷ‬䇮ᡰ䴰Ⲵṧֻᮠ䟿DŽл䶒Ⲵᇊѹ㋮⺞ൠ᧿䘠Ҷ䘉аᶑԦ˄㿱Haussler
1988˅˖

定义: 㘳㲁а‫ٷ‬䇮オ䰤Hˈⴞḷᾲᘥcˈᇎֻ࠶ᐳDԕ৺cⲴа㓴䇝㓳ṧֻDDŽᖃVSHˈ
Dѝ⇿њ‫ٷ‬䇮h‫ޣ‬Ҿc઼D䭉䈟⦷ሿҾ¦ᰦˈਈරオ䰤㻛〠Ѫ‫ޣ‬Ҿc઼Dᱟ¦-䈖ቭⲴ˄¦
-exhausted˅DŽ

䈕ᇊѹ൘മ 7-2 ѝ⽪ࠪDŽ¦-䈖ቭⲴਈරオ䰤㺘⽪о䇝㓳ṧֻа㠤Ⲵᡰᴹ‫ٷ‬䇮˄ণ䛓Ӌ


ᴹ 0 䇝㓳䭉䈟⦷Ⲵ‫ٷ‬䇮˅Ⲵⵏᇎ䭉䈟⦷ᚠྭ䜭ሿҾ¦DŽᖃ❦ˈӾᆖҐಘⲴ䀂ᓖⴻˈᡰ㜭⸕䚃
Ⲵਚᱟ䘉Ӌ‫ٷ‬䇮㜭਼ㅹൠᤏਸ䇝㓳ᮠᦞˈᆳԜ䜭ᴹ䴦䇝㓳䭉䈟⦷DŽਚᴹ⸕䚃⺞࠷Ⲵⴞḷᾲᘥ
Ⲵ㿲ሏ㘵᡽㜭⺞ᇊਈරオ䰤ᱟ੖Ѫ¦-䈖ቭⲴDŽԔӪ᛺䇦Ⲵᱟˈণ֯н⸕䚃⺞࠷Ⲵⴞḷᾲᘥ
ᡆ䇝㓳ṧֻᣭਆⲴ࠶ᐳˈа⿽ᾲ⦷ᯩ⌅ਟ൘㔉ᇊᮠⴞⲴ䇝㓳ṧֻѻਾ⭼ᇊਈරオ䰤Ѫ¦䈖ቭ
Ⲵᾲ⦷DŽHaussler(1988)ԕл䶒Ⲵᇊ⨶ᖒᔿᨀ‫׋‬Ҷ䘉ṧⲴ⭼ᇊᯩ⌅DŽ

插图——原书页码:208

Hypothesis space: ‫ٷ‬䇮オ䰤

മ 7-2 ֯ਈරオ䰤䈖ቭॆ

ਈරオ䰤VSHˈDѪ‫ٷ‬䇮hęHⲴᆀ䳶ˈަѝⲴ‫ٷ‬䇮䜭ᴹ䴦䇝㓳䭉䈟⦷˄൘മѝ㺘⽪Ѫr=0˅DŽᖃ
❦ⵏᇎ䭉䈟⦷errorD(h)˄മѝ㺘⽪Ѫerror˅ਟ㜭䶎 0ˈণ֯䈕‫ٷ‬䇮൘ᡰᴹ䇝㓳ᮠᦞѝ䭉䈟Ѫ 0DŽᖃ
ਈරオ䰤ѝᡰᴹ‫ٷ‬䇮h䜭┑䏣errorD(h)<¦ᰦˈਈරオ䰤᡽ᱟ¦-䈖ቭⲴDŽ

ᇊ⨶ 7.1 ਈරオ䰤Ⲵ¦-䈖ቭॆ (¦-exhausting the version space)DŽ㤕‫ٷ‬䇮オ䰤Hᴹ䲀ˈфDѪⴞ


ḷᾲᘥcⲴа㌫ࡇmı1 њ⤜・䲿ᵪᣭਆⲴṧֻˈ䛓ѸሩҾԫ᜿ 0ݦİ1ˈਈරオ䰤VSHˈDнᱟ¦-䈖ቭ
˄‫ޣ‬Ҿc˅Ⲵᾲ⦷ሿҾᡆㅹҾ˖

H e Hm

䇱᰾˖Ԕh1ˈh2ĂĂhkѪHѝ‫ޣ‬ҾcⲴⵏᇎ䭉䈟⦷བྷҾ¦Ⲵᡰᴹ‫ٷ‬䇮DŽᖃфӵᖃkњ‫ٷ‬䇮ѝ㠣ቁᴹ
ањᚠྭоᡰᴹmњ⤜・䲿ᵪᣭਆṧֻа㠤ᰦˈн㜭֯ਈරオ䰤¦-䈖ቭॆDŽԫа‫ٷ‬䇮ⵏᇎ䭉䈟⦷བྷҾ
¦ˈфоањ䲿ᵪᣭਆṧֻа㠤Ⲵਟ㜭ᙗᴰཊѪ(1-¦)DŽഐ↔ˈ䈕‫ٷ‬䇮оmњ⤜・ᣭਆṧֻа㠤Ⲵᾲ⦷
ᴰཊѪ(1-¦)mDŽ⭡Ҿᐢ⸕ᴹkњ‫ٷ‬䇮䭉䈟⦷བྷҾ¦ˈ䛓Ѹ㠣ቁᴹањоᡰᴹmњ䇝㓳ṧֻ䜭на㠤Ⲵᾲ
⦷ᴰཊѪ

k (1  H ) m

ᒦфഐѪkİ|H|ˈкᔿᴰཊѪ|H|(1-¦)mDŽᴰਾˈ֯⭘а䙊⭘нㅹᔿˈᖃ 0ݦİ1 ࡉ(1-¦)İe-¦DŽ


ഐ↔˖

k (1  H ) m d H 1  H d H e Hm
m

ᇊ⨶ᗇ䇱DŽ

ࡊ᡽สҾ䇝㓳ṧֻⲴᮠⴞ mǃ‫ݱ‬䇨Ⲵ䭉䈟⦷¦઼ H ⲴབྷሿˈᗇࡠҶਈරオ䰤нᱟ¦-䈖


ቭⲴᾲ⦷Ⲵк⭼DŽᦒ䀰ѻˈᆳሩҾԫ᜿֯⭘‫ٷ‬䇮オ䰤 H ⲴᆖҐಘ⭼ᇊҶ m њ䇝㓳ṧֻᵚ㜭
ሶᡰᴹĀൿāⲴ‫ٷ‬䇮˄ণ䭉䈟⦷བྷҾ¦Ⲵ‫ٷ‬䇮˅ࢄ䲔ࠪ৫Ⲵᾲ⦷DŽ

ਟԕ⭘䘉а㔃䇪ᶕ⺞ᇊѪҶ߿ቁ↔Āᵚࢄ䲔āᾲ⦷ࡠаᐼᵋⲴ〻ᓖ¥ᡰ䴰Ⲵ䇝㓳ṧֻᮠDŽ
⭡˖
H e Hm d G ˄7.1˅

Ӿѝ䀓ࠪ m ਟᗇ˖

1
mt (ln H  ln(1 / G )) ˄7.2˅
H

ᾲᤜൠ䈤ˈᔿ 7.2 ѝⲴнㅹᔿᨀ‫׋‬Ҷ䇝㓳ṧֻᮠⴞⲴа㡜䗩⭼ˈ䈕ᮠⴞⲴṧֻ䏣ԕ൘ᡰ


ᵏᵋⲴ٬¥઼¦〻ᓖлˈ֯ԫօа㠤ᆖҐಘᡀ࣏ൠᆖҐࡠ H ѝⲴԫ᜿ⴞḷᾲᘥDŽ䇝㓳ṧֻ
Ⲵᮠⴞ m 䏣ԕ‫؍‬䇱ԫ᜿а㠤‫ٷ‬䇮ᱟਟ㜭˄ਟ㜭ᙗѪ 1-¥˅䘁լ˄䭉䈟⦷Ѫ¦˅↓⺞ⲴDŽ⌘
᜿ m 䲿⵰ 1/¦㓯ᙗ໎䮯ˈᒦ䲿 1/¥ሩᮠ໎䮯DŽᆳ䘈䲿⵰‫ٷ‬䇮オ䰤 H Ⲵ㿴⁑ሩᮠ໎䮯DŽ

⌘᜿к䶒Ⲵ⭼䲀ᴹਟ㜭ᱟ䗷儈Ⲵՠ䇑DŽֻྲˈ㲭❦ᵚ㜭䈖ቭॆਈරオ䰤Ⲵᾲ⦷ᗵ享൘४
䰤[0, 1]޵ˈ❦㘼↔ᇊ⨶㔉ࠪⲴ䗩⭼䲿⵰|H|ሩᮠ໎䮯DŽሩҾ䏣ཏབྷⲴ‫ٷ‬䇮オ䰤ˈ䈕䗩⭼ᖸᇩ
᱃䎵䗷 1DŽഐ↔ˈᔿ 7.2 ѝⲴнㅹᔿ㔉ࠪⲴ䗩⭼ਟ㜭䗷儈ՠ䇑Ҷᡰ䴰䇝㓳ṧֻⲴᮠ䟿DŽ↔䗩
⭼Ⲵ㜶ᕡᙗѫ㾱ᶕⓀҾ|H|亩ˈᆳӗ⭏Ҿ䇱᰾䗷〻ѝ൘ᡰᴹਟ㜭‫ٷ‬䇮к䇑㇇䛓Ӌнਟ᧕ਇⲴ
‫ٷ‬䇮Ⲵᾲ⦷઼DŽᇎ䱵кˈ൘䇨ཊᛵߥлਟԕᴹаᴤ㍗ࠁⲴ䗩⭼ˈԕ৺㜭ཏ㾶ⴆབྷⲴ‫ٷ‬䇮オ䰤
Ⲵ䗩⭼DŽ䘉ᱟㅜ 7.4 㢲Ⲵѫ仈DŽ

7.3.1 уਥ⸛ᆜҖૂуж㠪‫ٽ‬䇴

ᔿ 7.2 Ⲵ䟽㾱ᙗ൘Ҿˈᆳ੺䇹ᡁԜᴹཊቁ䇝㓳ṧֻ᡽䏣ԕ‫؍‬䇱˄ԕᾲ⦷ 1-¥˅H ѝ⇿њ


ᴹ䴦䇝㓳䭉䈟⦷Ⲵ‫ٷ‬䇮ˈަⵏᇎ䭉䈟⦷ᴰཊѪ¦DŽнᒨⲴᱟˈྲ᷌ H нवਜ਼ⴞḷᾲᘥ cˈ䛓
Ѹᒦнᙫ㜭᢮ࡠањ䴦䭉䈟⦷‫ٷ‬䇮DŽ䘉ᰦˈᴰཊ㜭㾱≲ᆖҐಘ䗃ࠪⲴ‫ٷ‬䇮൘䇝㓳ṧֻкᴹᴰ
ሿⲴ䭉䈟⦷DŽྲ᷌ᆖҐಘн‫ٷ‬ᇊⴞḷᾲᘥਟ൘ H ѝ㺘⽪ˈ㘼ਚㆰঅൠራ᢮ާᴹᴰሿ䇝䭉䈟
⦷Ⲵ‫ٷ‬䇮ˈ䘉ṧⲴᆖҐಘ〠Ѫнਟ⸕ᆖҐಘˈഐѪᆳн亴‫ݸ‬䇔ᇊ CŽHDŽ

㲭❦ᔿ 7.2 สҾⲴ‫ٷ‬ᇊᱟᆖҐಘ䗃ࠪа䴦䭉䈟⦷‫ٷ‬䇮ˈሩҾᴤа⇥ⲴᛵᖒлᆖҐಘ㘳㲁


ࡠҶᴹ䶎䴦䇝㓳䭉䈟⦷Ⲵ‫ٷ‬䇮ᰦˈӽ㜭᢮ࡠањㆰঅⲴ䗩⭼DŽ㋮⺞ൠ㺘䘠ྲлDŽԔDԓ㺘ᆖ
Ґಘਟ㿲ሏࡠⲴ⢩ᇊ䇝㓳ṧֻ䳶ਸˈ㘼о↔н਼ⲴDԓ㺘൘ᮤњᇎֻ䳶ਸкⲴᾲ⦷࠶ᐳDŽԔ
errorD(h)ԓ㺘‫ٷ‬䇮hⲴ䇝㓳䭉䈟⦷DŽ⺞࠷ൠ䈤ˈerrorD(h)ᇊѹѪDѝ㻛h䈟࠶㊫Ⲵ䇝㓳ṧֻᡰ
ঐ∄ֻˈ⌘᜿errorD˄h˅ᱟ൘⢩ᇊ䇝㓳ᮠᦞṧᵜDкⲴˈᆳоⵏᇎ䭉䈟⦷errorD(h)н਼ˈਾ
㘵ᱟᇊѹ൘ᮤњᾲ⦷࠶ᐳDкⲴDŽ⧠൘Ԕhbest ԓ㺘Hѝᴹᴰሿ䇝㓳䭉䈟⦷Ⲵ‫ٷ‬䇮DŽཊቁ䇝㓳
ṧֻ᡽䏣ԕ˄ԕ䖳儈Ⲵᾲ⦷˅‫؍‬䇱ަⵏᇎ䭉䈟⦷errorD(hbest)нՊཊҾ¦+errorD(hbest)˛⌘᜿ࡽ
а㢲䇘䇪Ⲵ䰞仈ਚᱟ⧠൘䘉⿽ᛵߥⲴ⢩ֻˈަѝerrorD(hbest)ᚠྭѪ 0DŽ

䈕䰞仈Ⲵഎㆄ˄㿱㓳Ґ 7.3˅֯⭘㊫լҾᇊ⨶ 7.1 Ⲵ䇱᰾ᯩ⌅DŽ䘉䟼ᴹᗵ㾱ᕅ‫ޕ‬а㡜Ⲵ


Hoeffding 䗩⭼˄ᴹᰦ৸〠Ѫ䱴࣐ Chernoff 䗩⭼˅
DŽHoeffding 䗩⭼࡫⭫ⲴᱟḀһԦⲴⵏᇎᾲ
⦷৺ަ m њ⤜・䈅傼ѝ㿲ሏࡠⲴ仁⦷ѻ䰤ⲴᐞᔲDŽᴤ㋮⺞ൠ䇢ˈ䘉Ӌ䗩⭼ᓄ⭘Ҿ m њн਼
Ⲵ Bernoulli 䈅傼˄ֻྲˈm ⅑ᣋ᧧а⺜ᐱˈ䈕⺜ᐱԕḀᾲ⦷ᱮ⽪Ѫ↓䶒˅DŽ䘉⿽ᛵߥ䶎ᑨ㊫
լҾㅜ 5 ㄐ㘳㲁Ⲵ‫ٷ‬䇮䭉䈟⦷ՠ䇑䰞仈˖ণ⺜ᐱᱮ⽪Ѫ↓䶒Ⲵᾲ⦷ሩᓄࡠа䲿ᵪᣭਆᇎֻ㻛
‫ٷ‬䇮䈟࠶㊫Ⲵᾲ⦷DŽm ⅑⤜・Ⲵ⺜ᐱᣋ᧧ሩᓄ m њ⤜・ᣭਆⲴᇎֻDŽm ⅑ᇎ傼ࠪ⧠↓䶒Ⲵ
仁⦷ሩᓄҾ m њᇎֻѝ䈟࠶㊫Ⲵ仁⦷DŽ

Hoeffding䗩⭼㺘᰾ˈᖃ䇝㓳䭉䈟⦷errorD(H)൘वਜ਼mњ䲿ᵪᣭਆṧֻⲴ䳶ਸDк⍻䟿ᰦˈ
䛓Ѹ˖

Pr[errorD (h) ! errorD (h)  H ] d e 2 mH


2

ᆳ㔉ࠪҶањᾲ⦷䗩⭼ˈ䈤᰾ԫ᜿䘹ᤙⲴ‫ٷ‬䇮䇝㓳䭉䈟⦷н㜭ԓ㺘ⵏᇎᛵߥDŽѪ‫؍‬䇱 L
ራ᢮ࡠⲴᴰ֣Ⲵ‫ٷ‬䇮Ⲵ䭉䈟⦷ᴹԕкⲴ䗩⭼ˈᡁԜᗵ享㘳㲁䘉|H|њ‫ٷ‬䇮ѝԫањᴹ䖳བྷ䭉
䈟⦷Ⲵᾲ⦷˖

Pr[(h  H )errorD (h) ! errorD (h)  H ] d H e 2 mH


2

ྲ᷌ሶ↔ᾲ⦷〠Ѫ¥ˈᒦф䰞˖ཊቁњ䇝㓳ṧֻ m ᡽䏣ԕ֯¥㔤ᤱ൘аᤷᇊⲴ٬޵˛
ਟᗇлᔿ˖

1
mt (ln H  ln(1 / G )) ˄7.3˅
2H 2

䘉ᱟᔿ 7.2 Ⲵа㡜ॆᛵᖒˈ䘲⭘Ҿᖃᴰ֣‫ٷ‬䇮ਟ㜭ᴹ䶎䴦䇝㓳䭉䈟⦷ᰦˈᆖҐಘӽ㜭䘹


ᤙࡠᴰ֣‫ٷ‬䇮 hęH ⲴᛵᖒDŽ⌘᜿ m ‫׍‬䎆Ҿ H ઼ 1/¥Ⲵሩᮠˈྲ൘ᔿ 7.2 ѝаṧDŽ❦㘼൘䘉
њਇ䲀䖳ቁⲴᛵᖒлˈm 䲿 1/¦Ⲵᒣᯩ໎䮯ˈ㘼нᱟ 1/¦Ⲵ㓯ᙗ໎䮯DŽ

7.3.2 ᐹቊᮽᆍⲺਾ਌ᱥ PAC ਥᆜҖⲺ

⧠൘ᡁԜᴹҶањ䇝㓳ṧֻᮠⴞⲴ䗩⭼ˈԕ㺘⽪䈕ᮠⴞѪཊቁᰦ᡽䏣ԕਟ㜭䘁լᆖҐࡠ
ⴞḷᾲᘥDŽ❦ਾቡਟ⭘ᆳᶕ⺞ᇊḀӋ⢩ᇊᾲᘥ㊫Ⲵṧᵜ༽ᵲᓖ઼ PAC ਟᆖҐᙗDŽ

㘳㲁ⴞḷᾲᘥ㊫ Cˈᆳ⭡ᐳቄ᮷ᆇⲴਸਆ㺘⽪DŽᐳቄ᮷ᆇ˄literal˅ᱟԫ᜿Ⲵᐳቄਈ䟿(ྲ
Old)ˈᡆᆳⲴ੖ᇊ(ྲ™Old)DŽഐ↔ˈᐳቄ᮷ᆇⲴਸਆᖒᔿਟ㜭ѪĀOldġ™TallāDŽC ᱟ੖Ѫਟ
PAC ᆖҐⲴ˛ਟԕ䇱᰾ˈഎㆄᱟ㛟ᇊⲴDŽ䇱᰾䗷〻俆‫ݸ‬ᱮ⽪ԫ᜿а㠤ᆖҐಘਚ䴰㾱ཊ亩ᔿ
ᮠⴞⲴ䇝㓳ṧֻԕᆖҐࡠ C ѝԫ᜿ cˈ❦ਾᗇࡠа⢩ᇊ㇇⌅㜭ሩ⇿䇝㓳ṧֻ֯⭘ཊ亩ᔿᰦ䰤DŽ

㘳㲁ԫ᜿ᆖҐಘ Lˈᆳ֯⭘Ⲵ‫ٷ‬䇮オ䰤 H ㅹҾ CDŽᡁԜਟԕ⭘ᔿ 7.2 䇑㇇ࠪ䏣ԕ‫؍‬䇱˄ԕ


ᾲ⦷ 1-¥˅䗃ࠪаᴰབྷ䭉䈟⦷Ѫ¦Ⲵ‫ٷ‬䇮ˈᡰ䴰Ⲵ䲿ᵪ䇝㓳ṧֻᮠⴞᱟ mDŽѪ䗮ࡠ↔ⴞḷˈ
ਚ䴰㾱⺞ᇊ‫ٷ‬䇮オ䰤Ⲵ㿴⁑|H|DŽ

㤕‫ٷ‬䇮オ䰤HᇊѹѪnњᐳቄ᮷ᆇⲴਸਆˈࡉ‫ٷ‬䇮オ䰤|H|ⲴབྷሿѪ 3nDŽ৏ഐ൘Ҿˈԫа
㔉ᇊⲴ‫ٷ‬䇮ѝ⇿њਈ䟿ਟᴹй⿽ਟ㜭˖वਜ਼䈕ਈ䟿֌Ѫ᮷ᆇ˗वਜ਼䈕ਈ䟿Ⲵ੖ᇊ֌Ѫ᮷ᆇ˗
ᡆнवਜ਼䈕ਈ䟿DŽ⭡Ҿᴹnњ䘉ṧⲴਈ䟿ˈᡰԕ‫ޡ‬ᴹ 3nњн਼Ⲵ‫ٷ‬䇮DŽ

ሶ|H|=3nԓ‫ࡠޕ‬ᔿ 7.2 ѝˈᗇࡠԕл‫ޣ‬Ҿnᐳቄ᮷ᆇਸਆᆖҐ䰞仈Ⲵṧᵜ༽ᵲᓖ˖

1
mt (n ln 3  ln(1 / G )) ˄7.4˅
H

㤕ања㠤ᆖҐಘ㾱ᆖҐⲴⴞḷᾲᘥਟ⭡㠣ཊ 10 њᐳቄ᮷ᆇᶕ᧿䘠ˈ䛓Ѹਟᴹ 95%Ⲵ


ᾲ ⦷ ᆳ ሶ ᆖ Ґ ࡠ а њ 䭉 䈟 ⦷ ሿ Ҿ 0.1 Ⲵ ‫ ٷ‬䇮 ˈ 㘼 ф ᡰ 䴰 Ⲵ 䇝 㓳 ṧ ֻ ᮠ 䟿
1
m= (10ln3+ln(1/0.05))=140DŽ
0.1

⌘᜿ m ᤹᮷ᆇᮠ䟿 n ઼ 1/¦㓯ᙗ໎䮯ˈᒦ᤹ 1/¥ሩᮠ໎䮯DŽᙫⲴ䘀㇇䟿ᱟཊቁ˛䘉ᖃ


❦‫׍‬䎆Ҿ⢩ᇊⲴᆖҐ㇇⌅DŽ❦㘼ˈਚ㾱ᆖҐ㇇⌅Ⲵ⇿䇝㓳ṧֻ䇑㇇䟿н䎵䗷ཊ亩ᔿ㓗ˈᒦф
н䎵䗷䇝㓳ṧֻᮠⴞⲴཊ亩ᔿ㓗ˈ䛓ѸᮤփⲴ䘀㇇ҏѪཊ亩ᔿ㓗DŽ

൘ᐳቄ᮷ᆇⲴᆖҐѝˈањ㜭ཏㅖਸ䈕㾱≲Ⲵ㇇⌅ᐢ㓿൘ㅜ 2 ㄐӻ㓽ҶDŽ䘉ቡᱟ Find-S


㇇⌅ˈᆳ໎䟿ൠ䇑㇇о䇝㓳ṧֻа㠤Ⲵᴰ⢩↺‫ٷ‬䇮DŽሩ⇿њᯠⲴ↓ֻˈ䈕㇇⌅䇑㇇Ҷᖃࡽ‫ٷ‬
䇮઼ᯠṧֻ䰤‫ޡ‬ӛⲴ᮷ᆇⲴӔ䳶ˈ֯⭘Ⲵᰦ䰤ҏ᤹ n 㓯ᙗ໎䮯DŽഐ↔ˈFind-S ㇇⌅ਟ㜭䘁լ
↓⺞˄PAC˅ᆖҐа㊫ᑖ੖ᇊⲴ n њᐳቄ᮷ᆇਸਆⲴᾲᘥDŽ

ᇊ⨶ 7.2˖ᐳቄਸਆᔿⲴ PAC ਟᆖҐᙗDŽᐳቄ᮷ᆇਸਆⲴ㊫ C ᱟ⭘ Find-S ㇇⌅˄֯⭘ H=C˅PAC-


ਟᆖҐⲴDŽ

䇱᰾˖ᔿ 7.4 ᱮ⽪Ҷ䈕ᾲᘥ㊫Ⲵṧᵜ༽ᵲᓖᱟ nǃ1/¥઼ 1/¦Ⲵཊ亩ᔿ㓗ˈ㘼ф⤜・Ҿ size(c)DŽ


Ѫ໎䟿ᔿൠ༴⨶⇿њ䇝㓳ṧֻˈFind-S ㇇⌅㾱≲Ⲵ䘀㇇䟿ṩᦞ n 㓯ᙗ໎䮯ˈᒦ⤜・Ҿ 1/¥ˈ1/¦઼
size(c)DŽഐ↔ˈ䘉аᾲᘥ㊫ᱟ Find-S ㇇⌅ PAC ਟᆖҐⲴDŽ

7.3.3 ެԌᾸᘫ㊱Ⲻ PAC-ਥᆜҖᙝ

ྲࡽᡰ⽪ˈ൘ᆖҐ㔉ᇊ㊫ C ѝⲴⴞḷᾲᘥᰦˈᔿ 7.2 Ѫ⭼ᇊަṧᵜ༽ᵲᓖᨀ‫׋‬Ҷа㡜Ⲵ


ส⹰DŽкֻሶަᓄ⭘ࡠᐳቄ᮷ᆇⲴਸਆ䘉ṧⲴ㊫࡛ѝDŽᆳ䘈ਟ⭘Ҿ䇱᰾䇨ཊަԆᾲᘥ‫ޡ‬ᴹཊ
亩ᔿ㓗Ⲵṧᵜ༽ᵲᓖ˄ֻྲˈ㿱Ґ仈 7.2˅DŽ

7.3.3.1 ᰖ‫څ‬ᆜҖಞ

ᒦ䶎ᡰᴹᾲᘥ㊫䜭ᴹྲᔿ 7.2 䛓ṧⲴཊ亩ᔿ㓗ṧᵜ༽ᵲᓖ䗩⭼DŽֻྲˈ㘳㲁аᰐ‫ٿ‬


˄unbiased˅ᾲᘥ㊫Cˈᆳवਜ਼оX⴨‫Ⲵޣ‬ᡰᴹਟᮉᦸᾲᘥDŽ䈕䳶ਸCሩᓄҾXⲴᑲ䳶ˈণXⲴ
ᴹᆀ䳶Ⲵ䳶ਸˈ‫ޡ‬वਜ਼|C|=2|X|њᾲᘥDŽ㤕;ѝⲴᇎֻᇊѹѪQњᐳቄ٬⢩ᖱˈሶᴹ_;_  њн
Q

਼ᾲᘥDŽᖃ❦ѪᆖҐ䘉ṧⲴᰐ‫ٿ‬ᾲᘥ㊫ˈᆖҐಘᵜ䓛ҏᗵ享֯⭘аᰐ‫ٷⲴٿ‬䇮オ䰤+ &DŽሶ
Q

_+_  ԓ‫ࡠޕ‬ᔿ  ѝˈᗇࡠѪᆖҐሩᓄҾ;Ⲵᰐ‫ٿ‬ᾲᘥ㊫Ⲵṧᵜ༽ᵲᓖDŽ

1
mt (2 n ln 2  ln(1 / G )) ˄˅
H

䘉ṧˈ䈕ᰐ‫ⴞⲴٿ‬ḷᾲᘥ㊫൘ 3$& ⁑රлᴹᤷᮠ㓗Ⲵṧᵜ༽ᵲᓖDŽ㲭❦ᔿ  ઼ 


ѝᒦ䶎㍗ࠁⲴк⭼ˈᇎ䱵кਟ䇱᰾䈕ᰐ‫ٿ‬ᾲᘥ㊫Ⲵṧᵜ༽ᵲᓖ⺞Ѫ Q Ⲵᤷᮠ㓗DŽ

7.3.3.2 K 亯 DNF ૂ K-CNF Ᾰᘫ

ᆈ൘䘉⿽ਟ㜭ˈণḀᾲᘥ㊫ᴹཊ亩ᔿ㓗Ⲵṧᵜ༽ᵲᓖˈնн㜭ཏ൘ཊ亩ᔿᰦ䰤޵㻛ᆖҐ
ࡠDŽањᴹ䏓Ⲵֻᆀᱟᾲᘥ㊫&ѪN亩᷀ਆ㤳ᔿ˄N亩'1)˅ⲴᖒᔿDŽN亩'1)㺘䗮ᔿᖒᔿѪ7Ģ
7ĢĂĂĢ7Nˈަѝ⇿а7L亩ѪQњᐳቄ኎ᙗ઼ᆳԜⲴ੖ᇊⲴਸਆDŽ‫ٷ‬ᇊ+ &ˈᖸᇩ᱃䇱᰾_+_
QN Q QN
ᴰཊѪ  ˄ഐѪᴹNњ亩ˈ⇿亩ਟᴹ  њਟ㜭٬˅DŽ⌘᜿  䗷儈ՠ䇑Ҷ_+_ˈഐѪᆳ䟽༽䇑
㇇Ҷ7L 7Mԕ৺7L∄7Mᴤа㡜ⲴᛵᖒDŽ↔к⭼ӽ❦ਟ⭘Ҿ㧧ᗇṧᵜ༽ᵲᓖⲴк⭼ˈሶަԓ‫ࡠޕ‬
ᔿ  ѝ˖

1
mt (nk ln 3  ln(1 / G )) ˄˅
H

ᆳ㺘⽪ N亩 '1) Ⲵṧᵜ༽ᵲᓖѪ 1/¥ǃ1/¦ǃQ ઼ N Ⲵཊ亩ᔿ㓗DŽ㲭❦ṧᵜ༽ᵲᓖᱟཊ


亩ᔿ㓗Ⲵˈ䇑㇇༽ᵲᓖতнᱟཊ亩ᔿ㓗ⲴˈഐѪ䈕㇇⌅ㅹ᭸ҾަԆᐢ⸕Ⲵн㜭൘ཊ亩ᔿᰦ䰤
޵䀓ߣⲴ䰞仈˄䲔䶎 53 13˅DŽഐ↔ˈ㲭❦ N 亩 '1) ᴹཊ亩ᔿ㓗Ⲵṧᵜ༽ᵲᓖˈᆳሩҾ֯⭘
+ & ⲴᆖҐಘ⋑ᴹཊ亩ᔿ㓗Ⲵ䇑㇇༽ᵲᓖDŽ

‫ޣ‬ҾN亩'1)ⲴԔӪਲ਼᛺Ⲵһᇎ൘Ҿˈ㲭❦ᆳнᱟ3$&ਟᆖҐⲴˈতᆈ൘ањᴤབྷⲴᾲᘥ
㊫ᱟ3$&ਟᆖҐⲴDŽ䘉њᴤབྷⲴᾲᘥ㊫ᴹ⇿ṧֻⲴཊ亩ᔿ㓗ᰦ䰤༽ᵲᓖˈ਼ᰦᴹཊ亩ᔿ㓗Ⲵ
ṧᵜ༽ᵲᓖDŽ䘉аᴤབྷⲴ㊫ѪN&1)㺘䗮ᔿ˖ԫ᜿䮯ᓖⲴਸਆᔿ7ġ7ġĂĂġ7Mˈަѝ⇿њ
7LѪᴰཊNњᐳቄਈ䟿Ⲵ᷀ਆDŽᖸᇩ᱃䇱᰾N&1)वਜ਼ҶN'1)ˈഐѪԫ᜿N亩'1)ਟԕᖸᇩ᱃
ൠ䟽߉ѪN&1)㺘䗮ᔿ˄৽ѻতн❦˅DŽ㲭❦N&1)∄N亩'1)㺘䗮࣋ᴤᕪˈնᆳᴹཊ亩ᔿ㓗ṧ
ᵜ༽ᵲᓖ઼ཊ亩ᔿ㓗ᰦ䰤༽ᵲᓖDŽഐ↔ˈᾲᘥ㊫N亩'1)ᱟ֯⭘+ N&1)Ⲵањᴹ᭸㇇⌅ਟ3$&
ᆖҐⲴDŽ㿱.HDUQV 9D]LUDQL  ѝᴤ䈖㓶Ⲵ䇘䇪DŽ

7.4 ᰖ䲆‫ٽ‬䇴グ䰪Ⲻṭᵢགྷᵸᓜ

൘ка㢲ѝᡁԜ䇱᰾Ҷ 3$& ᆖҐⲴṧᵜ༽ᵲᓖ䲿‫ٷ‬䇮オ䰤Ⲵሩᮠ໎䮯DŽ㲭❦ᔿ  ᱟа


ᖸᴹ⭘Ⲵнㅹᔿˈնԕ_+_亩ᶕ࡫⭫ṧᵜ༽ᵲᓖᴹєњ㕪⛩DŽ俆‫ˈݸ‬ᆳਟ㜭ሬ㠤䶎ᑨᕡⲴ䗩
⭼˄എᗶалሩҾབྷⲴ_+_൘¥кⲴ䗩⭼ਟ㜭䎵ࠪ  ᖸཊ˅DŽަ⅑ˈሩҾᰐ䲀‫ٷ‬䇮オ䰤Ⲵᛵᖒˈ
ᔿ  ṩᵜᰐ⌅ᓄ⭘DŽ

䘉䟼ᡁԜ㘳㲁 + Ⲵ༽ᵲᓖⲴਖа⿽ᓖ䟿ˈ〠Ѫ + Ⲵ 9DSQLN&KHUYRQHQNLV㔤ᓖ˄ㆰ〠


9& 㔤ᡆ 9& + ˅DŽਟԕⴻࡠˈ֯⭘ 9& + ԓᴯ_+_ҏਟԕᗇࡠṧᵜ༽ᵲᓖⲴ䗩⭼DŽ൘䇨ཊᛵᖒ
лˈสҾ 9& + Ⲵṧᵜ༽ᵲᓖՊ∄  ᔿᗇࡠⲴᴤ㍗ࠁDŽਖཆˈ䘉Ӌ䗩⭼ਟԕ࡫⭫䇨ཊᰐ䲀
‫ٷ‬䇮オ䰤Ⲵṧᵜ༽ᵲᓖˈ㘼фਟ䇱᰾⴨ᖃ㍗ࠁDŽ

7.4.1 ᣼ᮙжѠᇔׁ䳼ਾ

9& 㔤㺑䟿‫ٷ‬䇮オ䰤༽ᵲᓖⲴᯩ⌅нᱟ⭘н਼‫ٷ‬䇮Ⲵᮠ䟿_+_ˈ㘼ᱟ⭘ ; ѝ㜭㻛 + ᖫᓅ४


࠶Ⲵн਼ᇎֻⲴᮠ䟿DŽ

Ѫ㋮⺞ൠ᧿䘠䘉а⛩ˈ俆‫ݸ‬ᇊѹሩаᇎֻ䳶ਸⲴ᣶ᮓ 6KDWWHULQJ ᫽֌DŽ㘳㲁ᇎֻⲴḀ


ᆀ䳶6Ž;DŽֻྲˈമ  ᱮ⽪Ҷ;ѝањवਜ਼  њᇎֻⲴᆀ䳶DŽ+ѝⲴ⇿њKሬ㠤6ѝⲴḀњࡂ
࠶ GLFKRWRP\ ˈণKሶ6࠶ࢢѪєњᆀ䳶^[ę6_K [ `ԕ৺^[ę6_K [ `DŽ㔉ᇊḀᇎֻ䳶
_6_
ਸ6ˈᴹ  ⿽ਟ㜭Ⲵࡂ࠶ˈ㲭❦ަѝⲴаӋн㜭⭡+ᶕ㺘䗮DŽᖃ6Ⲵ⇿њਟ㜭Ⲵࡂ࠶ਟ⭡+ѝ
ⲴḀ‫ٷ‬䇮ᶕ㺘䗮ᰦˈᡁԜ〠+᣶ᮓ6DŽ

定义: аᇎֻ䳶 S 㻛‫ٷ‬䇮オ䰤 H ᣶ᮓ(shatter) ˈᖃфӵᖃሩ S Ⲵ⇿њࡂ࠶ˈᆈ൘ H


ѝⲴḀ‫ٷ‬䇮о↔ࡂ࠶а㠤DŽ


മ  ᱮ⽪Ҷаवਜ਼  њᇎֻⲴ䳶ਸ6㻛‫ٷ‬䇮オ䰤ࡂ࠶Ⲵ㔃᷌DŽ⌘᜿䘉  њᇎֻⲴ  ⿽
ࡂ࠶ѝ⇿ањ䜭ਟ⭡Ḁ‫ٷ‬䇮㾶ⴆDŽ

⌘᜿ˈྲ᷌аᇎֻ䳶ਸ⋑ᴹ㻛‫ٷ‬䇮オ䰤᣶ᮓˈ䛓Ѹᗵ❦ᆈ൘Ḁᾲᘥ˄ࡂ࠶˅ˈᆳᇊѹ൘
ᇎֻ䳶ѻкˈնн㜭⭡‫ٷ‬䇮オ䰤㺘⽪DŽഐ↔ˈ+ Ⲵ䘉⿽᣶ᮓᇎֻ䳶ਸⲴ㜭࣋ᱟަ㺘⽪䘉Ӌᇎ
ֻкᇊѹⲴⴞḷᾲᘥⲴ㜭࣋Ⲵᓖ䟿DŽ

插图——原书页码:215

Instance space X˖ᇎֻオ䰤 X

മ 7-3 㻛 8 њ‫ٷ‬䇮᣶ᮓⲴवਜ਼ 3 ᇎֻⲴ䳶ਸ

ሩ⇿⿽ਟ㜭Ⲵᇎֻࡂ࠶ˈᆈ൘ањሩᓄⲴ‫ٷ‬䇮DŽ

7.4.2 Vapnik-Chervonenkis 㔪ᓜ

᣶ᮓаᇎֻ䳶ਸⲴ㜭࣋о‫ٷ‬䇮オ䰤Ⲵᖂ㓣‫ٿ‬㖞㍗ᇶ⴨‫ޣ‬DŽഎᗶㅜ  ㄐѝˈањᰐ‫ٷⲴٿ‬
䇮オ䰤ᱟ㜭ཏ㺘⽪ᇊѹ൘ᇎֻオ䰤 ; к⇿њਟ㜭ᾲᘥ˄ࡂ࠶˅Ⲵ‫ٷ‬䇮オ䰤DŽㆰ⸝ൠ䇢ˈањ
ᰐ‫ٷٿ‬䇮オ䰤㜭ཏ᣶ᮓᇎֻオ䰤DŽ䛓Ѹྲ᷌ + н㜭᣶ᮓ ;ˈնᆳਟ᣶ᮓ ; ⲴḀњབྷⲴᆀ䳶 6
Պᘾṧ˛ⴤ㿹кਟԕ䈤㻛᣶ᮓⲴ ; Ⲵᆀ䳶䎺བྷˈ+ Ⲵ㺘⽪㜭࣋䎺ᕪDŽ+ Ⲵ 9& 㔤↓ᱟ䘉ṧа⿽
ᓖ䟿ḷ߶DŽ

定义: ᇊѹ൘ᇎֻオ䰤 X кⲴ‫ٷ‬䇮オ䰤 H Ⲵ Vapnik-Chervonenkis 㔤ˈᡆ VC(H)ˈᱟ


ਟ㻛 H ᣶ᮓⲴ X Ⲵᴰབྷᴹ䲀ᆀ䳶ⲴབྷሿDŽྲ᷌ X Ⲵԫ᜿ᴹ䲀བྷⲴᆀ䳶ਟ㻛 H ᣶ᮓˈ
䛓Ѹ VC(H)įĞDŽ

G
⌘᜿ሩҾԫ᜿ᴹ䲀Ⲵ+ˈ9& + İORJ_+_DŽѪ䇱᰾䘉а⛩ˈ‫ٷ‬ᇊ9& + GDŽ䛓Ѹ+䴰㾱  њ
G
н਼‫ٷ‬䇮ᶕ᣶ᮓGњᇎֻDŽഐ↔  İ_+_ˈᡰԕG 9& + İORJ_+_DŽ

7.4.2.1 ⽰ׁ

ѪҶ㧧ᗇVC(H)Ⲵⴤ㿹Ⲵ᜿ѹˈ㘳㲁л䶒аӋ‫ٷ‬䇮オ䰤ⲴֻᆀDŽ俆‫ٷˈݸ‬ᇊᇎֻオ䰤X
Ѫᇎᮠ䳶ਸX=ƒ˄ֻྲˈ᧿䘠ӪⲴ䓛儈height˅ˈ㘼фHѪᇎᮠ䖤кⲴ४䰤Ⲵ䳶ਸDŽᦒ䀰ѻˈ
HѝⲴ‫ٷ‬䇮ᖒᔿѪa<x<bˈަѝaǃbѪԫ᜿ᇎᮠDŽᆳⲴVC(H)ᱟཊቁ˛Ѫഎㆄ䘉а䰞仈ˈᗵ享
᢮ࡠ㜭㻛H᣶ᮓⲴXⲴᴰབྷᆀ䳶DŽ㘳㲁а⢩ᇊⲴᆀ䳶ˈवਜ਼єњн਼ᇎֻˈྲS={3.1, 5.7}DŽ
䘉њS㜭㻛H᣶ᮓੇ˛എㆄᱟ㛟ᇊⲴDŽֻྲˈԕлഋњ‫ٷ‬䇮˄1<x<2˅ˈ˄1<x<4˅ ˈ˄4<x<7˅઼
˄1<x<7˅ˈਟ‫ࡠڊ‬䘉а⛩DŽᆳԜ㺘⽪ҶSкⲴഋ⿽ࡂ࠶ˈণнवਜ਼ԫօᇎֻǃਚवਜ਼ᇎֻѝ
Ⲵањǃԕ৺वਜ਼єњᇎֻDŽഐѪᡁԜ᢮ࡠҶањབྷሿѪ 2 Ⲵ䳶ਸˈᆳਟ㻛H᣶ᮓˈᡰԕH
ⲴVC㔤㠣ቁѪ 2DŽབྷሿѪ 3 Ⲵ䳶ਸᱟ੖ਟ㻛᣶ᮓ˛㘳㲁а䳶ਸS={x0, x1, x2}वਜ਼ 3 њԫ᜿ᇎ
ֻDŽнཡа㡜ᙗˈਟ‫ٷ‬ᇊx0<x1<x2DŽᱮ❦ˈ↔䳶ਸн㜭㻛᣶ᮓˈഐѪवਜ਼x0઼x2նнवਜ਼x1Ⲵ
ࡂ࠶ሶн㜭⭡অњⲴ䰝४䰤ᶕ㺘⽪DŽഐ↔ˈSѝ⋑ᴹབྷሿѪ 3 Ⲵᆀ䳶ਟ㻛᣶ᮓˈഐ↔VC(H)=2DŽ
⌘᜿䘉䟼Hᱟᰐ䲀ⲴˈնVC(H)ᴹ䲀DŽ

л䶒㘳㲁Ⲵᇎֻ䳶ਸSሩᓄxǃyᒣ䶒кⲴ⛩˄㿱മ 7-4˅
DŽԔHѪ↔ᒣ䶒޵ᡰᴹ㓯ᙗߣㆆ
䶒Ⲵ䳶ਸDŽᦒ䀰ѻˈHሩᓄᴹৼ䗃‫Ⲵޕ‬অњᝏ⸕ಘঅ‫ٷⲴݳ‬䇮オ䰤˄㿱ㅜ 4 ㄐѝሩᝏ⸕ಘⲴ
䇘䇪˅DŽHⲴVC㔤ᱟཊቁ˛ᖸᇩ᱃ਟⴻࠪ䈕ᒣ䶒޵ԫ᜿єњн਼⛩ਟ㻛H᣶ᮓˈ䘉ᱟഐѪᡁ
Ԝਟԕ᢮ࡠ 4 њ㓯ᙗ㺘䶒ˈᆳԜवਜ਼⋑ᴹ⛩ǃަѝа⛩ᡆє⛩DŽ3 њ⛩Ⲵ䳶ਸՊᘾѸṧ˛ਚ
㾱 3 њ⛩н‫ޡ‬㓯ˈቡਟԕ᢮ࡠ 23њ㓯ᙗ㺘䶒ᶕ᣶ᮓᆳԜDŽᖃ❦ 3 њ‫ޡ‬㓯Ⲵ⛩ᰐ⌅㻛᣶ᮓ˄о
ࡽֻѝᇎ䖤к 3 њ⛩ᰐ⌅㻛᣶ᮓ਼ṧⲴ⨶⭡˅DŽ൘↔VC㔤ᱟཊቁ˛2 䘈ᱟ 3˛㠣ቁᓄ䈕ᱟ 3DŽ
Ѫ䇱᰾VC(H)<dˈᗵ享䇱᰾བྷሿѪdⲴ䳶ਸ䜭н㜭㻛᣶ᮓDŽ൘↔ֻѝˈབྷሿѪ 4 Ⲵ䳶ਸ䜭н
㜭㻛᣶ᮓˈഐ↔VC(H)=3DŽVC㔤Ⲵᇊѹ㺘⽪ˈྲ᷌㜭᢮ࡠԫ᜿ањབྷሿѪdⲴᇎֻ䳶ਸˈᆳ
ਟ㻛᣶ᮓˈ䛓ѸVC(H)ıdDŽᴤа㡜ൠˈਟ䇱᰾ˈ൘r㔤オ䰤ѝ˄ྲᴹrњ䗃‫Ⲵޕ‬ᝏ⸕ಘ˅ˈ㓯
ᙗߣㆆ䶒ⲴVC㔤Ѫr+1DŽ

插图——原书页码:216

മ 7-4 ൘ xˈy ᒣ䶒ѝ㓯ᙗߣㆆ䶒Ⲵ VC 㔤Ѫ 3

a˅ањ 3 ⛩䳶ਸਟ㻛㓯ᙗߣㆆ䶒᣶ᮓDŽb˅а 3 ⛩䳶ਸн㜭㻛᣶ᮓDŽ

ᴰਾањֻᆀˈ‫ٷ‬ᇊXк⇿њᇎֻ⭡ᚠྭ 3 њᐳቄ᮷ᆇⲴਸਆ㺘⽪ˈ㘼ф‫ٷ‬ᇊHѝ⇿њ
‫ٷ‬䇮⭡㠣ཊ 3 њᐳቄ᮷ᆇ᧿䘠DŽVC(H)ᱟཊቁ˛ਟ䇱᰾䘉њ٬㠣ቁѪ 3DŽሶ⇿њᇎֻ㺘⽪Ѫ
а 3 սᆇѢˈሩᓄ⇿њᇎֻⲴйњ᮷ᆇl1ˈl2઼l3DŽ㘳㲁л䶒 3 њᇎֻ䳶ਸ˖

instance1˖100

instance2˖010

instance3˖001

䘉йњᇎֻⲴ䳶ਸਟ㻛H᣶ᮓˈᱟഐѪਟሩԫ᜿ᡰᐼᵋⲴࡂ࠶ᔪ・а‫ٷ‬䇮ˈᯩ⌅ྲл˖
ྲ᷌䈕ࡂ࠶㾱ᧂ䲔instancei ˈቡሶ᮷ᆇ™li ࣐‫ٷࡠޕ‬䇮ѝDŽֻྲˈ㾱वਜ਼instance2 ˈфᧂ䲔
instance1઼instance3DŽ䛓Ѹਟ֯⭘‫ٷ‬䇮™l1ġ™l3DŽ↔䇘䇪ਟᖸᇩ᱃ൠᢙኅࡠ⢩ᖱᮠѪnⲴᛵߥDŽ
䘉ṧˈnњᐳቄ᮷ᆇਸਆⲴVC㔤㠣ቁѪnDŽᇎ䱵кҏ⺞ᇎѪnˈᇎ䱵Ⲵ䇱᰾∄䖳ഠ䳮ˈഐѪᆳ
䴰㾱䈤᰾n+1 њᇎֻⲴ䳶ਸнਟ㜭㻛᣶ᮓDŽ

7.4.3 ṭᵢགྷᵸᓜૂ VC 㔪

ࡽ䶒㘳㲁ҶĀᴹཊቁ䲿ᵪᣭਆ䇝㓳ṧֻ᡽䏣ԕਟ㜭䘁լ↓⺞˄PAC˅ൠᆖҐࡠ C ѝԫ᜿
ⴞḷᾲᘥā䘉њ䰞仈˄ণᴹཊቁṧֻ䏣ԕԕ 1-¥Ⲵᾲ⦷¦-䈖ቭਈරオ䰤˛˅DŽ֯⭘ VC(H)
֌Ѫ H ༽ᵲᓖⲴᓖ䟿ˈቡᴹਟ㜭᧘ሬࠪ䈕䰞仈Ⲵਖа⿽䀓ㆄˈ㊫լҾࡽ䶒ᔿ 7.2 ѝⲴ䗩⭼DŽ
ᯠሬࠪⲴ䗩⭼˄㿱 Blumer et al. 1989˅Ѫ˖

1
mt (4 log 2 (2 / G )  8VC ( H ) log 2 (13 / H )) ˄7.7˅
H

↓ྲᔿ 7.2 ѝⲴ䗩⭼аṧˈᡰ䴰䇝㓳ṧֻⲴᮠⴞmԕ 1/¥Ⲵሩᮠ໎䮯DŽն䈕䗩⭼⧠൘䲿


⵰ 1/¦Ⲵሩᮠ҈ԕ㓯ᙗ໎䮯ˈ㘼нਚᱟ㓯ᙗDŽ⢩࡛㾱ᤷࠪˈࡽ䶒䗩⭼ѝⲴln|H|亩㻛ᴯᦒѪਖ
а⿽‫ٷ‬䇮オ䰤༽ᵲᓖⲴᓖ䟿ˈণVC(H)˄㘼VC(H)İlog2|H|˅DŽ
ᔿ 7.7 ሩҾ䏣ԕਟ㜭䘁լᆖҐࡠ C ѝԫ᜿ⴞḷᾲᘥᡰ䴰Ⲵ䇝㓳ṧֻ㔉ࠪҶањк⭼ˈሩ
ᓄҾԫ᜿ᐼᵋⲴ¦઼¥DŽ䘈ਟ㜭ᗇࡠањл⭼ˈྲл䶒ᇊ⨶ᡰᾲᤜⲴ˄㿱 Ehrenfeucht et al.
1989˅DŽ

ᇊ⨶ 7.3 ṧᵜ༽ᵲᓖл⭼DŽ㘳㲁ԫ᜿ᾲᘥ㊫ Cˈф VC(C)ı2ˈԫ᜿ᆖҐಘ Lˈԕ৺ԫ᜿ 0<¦<1/8ˈ


0<¥<1/100DŽᆈ൘ањ࠶ᐳ D ԕ৺ C ѝањⴞḷᾲᘥˈᖃ L 㿲ሏࡠⲴṧֻᮠⴞሿҾлᔿᰦ˖

ª1 VC (C )  1º
max « log(1 / G ),
¬H 32H »¼

Lሶԕ㠣ቁ¥Ⲵᾲ⦷䗃ࠪа‫ٷ‬䇮hˈ֯errorD(h)>¦DŽ

䈕ᇊ⨶䈤᰾ˈ㤕䇝㓳ṧֻⲴᮠⴞཚቁˈ䛓Ѹнᆈ൘ᆖҐಘ㜭ཏPACᆖҐࡠԫ᜿䶎ᒣࠑⲴ
Cѝ⇿њⴞḷᾲᘥDŽഐ↔ˈ䈕ᇊ⨶ᨀ‫׋‬Ҷᡀ࣏ⲴᆖҐᡰᗵ㾱Ⲵ䇝㓳ṧֻⲴᮠⴞⲴл⭼ˈᆳሩ
Ҿࡽ䶒к⭼㔉ࠪⲴ‫؍‬䇱‫ݵ‬䏣Ⲵᮠ䟿Ⲵк⭼ᱟа㺕‫ݵ‬DŽ⌘᜿䈕л⭼ᱟ⭡ᾲᘥ㊫CⲴ༽ᵲᓖ⺞ᇊ
Ⲵˈ㘼ࡽ䶒Ⲵк⭼⭡H⺞ᇊDŽѪӰѸ˛1

䈕л⭼䈤᰾ᔿ 7.7 㔉ࠪⲴк⭼⴨ᖃ㍗ࠁDŽഐѪєњ䗩⭼䜭ᱟ 1/¥Ⲵሩᮠ઼ VC(H)Ⲵ㓯ᙗ


ᮠ䟿㓗DŽ൘䘉єњ䗩⭼ѝᜏаⲴ४࡛ᱟк⭼ѝཊࠪⲴ log(1/¦)‫׍‬䎆ᙗDŽ

7.4.4 ⾔㔅㖇㔒Ⲻ VC 㔪

ሩҾㅜ 4 ㄐ䇘䇪ⲴӪᐕ⾎㓿㖁㔌ˈᡁԜᴹ‫ޤ‬䏓㘳㲁ᘾṧ䇑㇇ањӂ㚄অ‫Ⲵݳ‬㖁㔌Ⲵ VC
㔤ˈྲ⭡৽ੁՐ᫝䗷〻䇝㓳Ⲵࡽ侸㖁㔌DŽᵜ㢲㔉ࠪҶа㡜ᙗⲴ㔃䇪ˈԕ䇑㇇࠶ቲᰐ⧟㖁㔌Ⲵ
VC 㔤DŽ䘉а VC 㔤ਟ㻛⭘Ҿ⭼ᇊ䇝㓳ṧֻⲴᮠ䟿ˈ䈕ᮠ䗮ࡠཊབྷⲴ᡽䏣ԕ᤹➗ᐼᵋⲴ¦઼
¥٬䘁լਟ㜭↓⺞ൠᆖҐࡠањࡽ侸㖁㔌DŽᵜ㢲൘ㅜа⅑䰵䈫ᰦਟᘭ⮕ᦹˈ㘼нཡ䘎㔝ᙗDŽ

㘳㲁ањ⭡অ‫ݳ‬㓴ᡀⲴ㖁㔌 Gˈᆳᖒᡀањ࠶ቲᴹੁᰐ⧟മDŽᴹੁᰐ⧟(directed acyclic)


മᱟᕗᑖᴹᯩੁ˄ྲঅ‫ݳ‬ᴹ䗃‫઼ޕ‬䗃ࠪ˅ˈնнᆈ൘ᴹੁ⧟ⲴമDŽ࠶ቲ˄layered˅മѝ㢲⛩
ਟ㻛ࡂ࠶Ѫቲˈ䘉ṧᡰᴹㅜ l ቲࠪᶕⲴᴹੁ䗩䘋‫ࡠޕ‬ㅜ l+1 ቲ㢲⛩DŽㅜ 4 ㄐӻ㓽Ⲵ࠶ቲࡽ侸
㖁㔌ቡᱟ䘉ṧⲴ࠶ቲᴹੁᰐ⧟മⲴֻᆀDŽ

ਟԕⴻࠪˈ䘉ṧⲴ㖁㔌ⲴVC㔤Ⲵ⭼ᇊਟԕสҾަമⲴ㔃ᶴ઼ᶴ䙐䈕മⲴสᵜঅ‫Ⲵݳ‬VC
㔤DŽѪᖒᔿॆൠ᧿䘠ˈ俆‫ݸ‬ᇊѹаӋᵟ䈝DŽԔnѪ㖁㔌GⲴ䗃‫ޕ‬ᮠⴞˈᒦф‫ٷ‬ᇊਚᴹ 1 њ䗃
ࠪ㔃⛩DŽԔGⲴ⇿њ޵䜘অ‫ݳ‬Ni˄ণ⇿њ䶎䗃‫ޕ‬㢲⛩˅ᴹᴰཊr њ䗃‫ˈޕ‬ᒦᇎ⧠аᐳቄ࠭ᮠ
ci˖ƒrė{0,1}ᖒᡀа࠭ᮠ㊫CDŽֻྲˈ㤕޵䜘㢲⛩Ѫᝏ⸕ಘˈ䛓ѸCѪᇊѹ൘ƒrкⲴ㓯ᙗ䰸
٬࠭ᮠ㊫DŽ

⧠൘ਟᇊѹ C Ⲵ G-ਸᡀ˄G-composition˅Ѫˈ൘ G ѝ⤜・অ‫ݳ‬䜭ਆ㊫ C ѝⲴ࠭ᮠᰦˈ


⭡㖁㔌 G 㜭ᇎ⧠ᡰᴹ࠭ᮠⲴ㊫DŽㆰঅൠ䈤ˈC Ⲵ G-ਸᡀᱟਟ⭡㖁㔌 G 㺘⽪Ⲵ‫ٷ‬䇮オ䰤DŽ

л䶒Ⲵᇊ⨶⭼ᇊҶ C Ⲵ G ਸᡀⲴ VC 㔤ˈสҾ C Ⲵ VC 㔤઼ G Ⲵ㔃ᶴDŽ

1
ᨀ⽪˖ྲ᷌ᡁԜ൘л⭼ѝ⭘HԓᴯCˈᖃHŠCᰦՊᗇࡠmⲴањᴤ㍗ࠁⲴ⭼䲀
ᇊ⨶ 7.4 ࠶ቲᴹੁᰐ⧟㖁㔌ⲴVC㔤DŽ˄㿱Kearns & Vazirani 1994˅ԔGѪа࠶ቲᴹੁᰐ⧟മˈᴹ
nњ䗃‫ޕ‬㢲⛩઼sı2 њ޵䜘㢲⛩ˈ⇿њਟᴹ㠣ቁrњ䗃‫ޕ‬DŽԔCѪVC㔤ѪdⲴƒrкⲴᾲᘥ㊫ˈሩᓄҾਟ
⭡⇿њ޵䜘㢲⛩᧿䘠Ⲵ࠭ᮠ䳶ਸDŽԔCGѪCⲴGਸᡀˈሩᓄҾਟ⭡G㺘⽪Ⲵ࠭ᮠ䳶ਸDŽ䛓ѸVC(CG)İ
dslog(es)ˈަѝeѪ㠚❦ሩᮠᓅDŽ

⌘᜿䘉а㖁㔌 G Ⲵ VC 㔤䗩⭼䲿অњঅ‫ Ⲵݳ‬VC 㔤 d 㓯ᙗ໎䮯ˈᒦ䲿 s˄ণ㖁㔌ѝ䰸٬


অ‫Ⲵݳ‬ᮠⴞ˅Ⲵሩᮠ҈㓯ᙗ໎䮯DŽ

‫ٷ‬ᇊ㾱㘳㲁Ⲵ࠶ቲᴹੁᰐ⧟㖁㔌ѝঅњ㢲⛩䜭ᱟᝏ⸕ಘDŽഎᗶㅜ 4 ㄐѝᨀࡠⲴˈr䗃‫ޕ‬
ᝏ⸕ಘ֯⭘㓯ᙗߣㆆ䶒ᶕ㺘⽪ƒrкⲴᐳቄ࠭ᮠDŽྲ 7.4.2.1 㢲ᤷࠪⲴ䛓ṧˈ൘ƒrкⲴ㓯ᙗߣ
ㆆ䶒ⲴVC㔤Ѫr+1DŽഐ↔ˈঅ⤜Ⲵr䗃‫ޕ‬ᝏ⸕ಘVC㔤Ѫr+1DŽਟ֯⭘䘉а㔃᷌৺к䶒Ⲵᇊ⨶
ᶕ䇑㇇वਜ਼sњr 䗃‫ޕ‬ᝏ⸕ಘⲴ࠶ቲᰐ⧟㖁㔌ⲴVC㔤䗩⭼ˈྲл˖

VC(CGperceptrons ) d 2(r  1) s log(es)

⧠൘ਟԕ䇑㇇ˈѪҶ൘䈟ᐞ¦㤳ത޵ԕ㠣ቁ 1-¥Ⲵᾲ⦷ᆖҐࡠᶕ㠚CGperceptronsⲴⴞḷᾲ
ᘥˈ䏣ཏⲴ䇝㓳ṧֻᮠⴞmⲴ䗩⭼DŽሶк䶒㖁㔌VC㔤Ⲵ㺘䗮ᔿԓ‫ࡠޕ‬ᔿ 7.7ˈਟᴹ˖

1
mt (4 log(2 / G )  8VC ( H ) log(13 / H ))
H

1
t (4 log(2 / G )  16(r  1) s log(es) log(13 / H )) ˄7.8˅
H

ྲ↔ᝏ⸕ಘ㖁㔌ֻᆀᡰ⽪ˈк䶒Ⲵᇊ⨶Ⲵ֌⭘൘Ҿˈᆳᨀ‫׋‬Ҷања㡜ᙗᯩ⌅ˈสҾ㖁
㔌㔃ᶴ઼অњঅ‫ Ⲵݳ‬VC 㔤⭼ᇊ࠶ቲᰐ⧟অ‫ݳ‬㖁㔌Ⲵ VC 㔤DŽн䗷ˈк䶒Ⲵ㔃᷌н㜭ⴤ᧕ᓄ
⭘ҾਾੁՐ᫝Ⲵ㖁㔌ˈ৏ഐᴹєњDŽ俆‫↔ˈݸ‬㔃᷌ᓄ⭘Ҿᝏ⸕ಘ㖁㔌ˈ㘼нᱟ sigmoid অ‫ݳ‬
㖁㔌ˈਾ㘵ᱟਾੁՐ᫝㇇⌅ᓄ⭘Ⲵ㤳തDŽ❦㘼ˈ⌘᜿ࡠ sigmoid অ‫ Ⲵݳ‬VC 㔤㠣ቁՊоᝏ⸕
ಘঅ‫ Ⲵݳ‬VC 㔤аṧབྷDŽഐѪ䙊䗷֯⭘䏣ཏⲴᵳ٬ˈsigmoid অ‫ݳ‬ਟԕԫ᜿㋮ᓖ䙬䘁ᝏ⸕ಘDŽ
ഐ↔ˈк䶒Ⲵ m 䗩⭼㠣ቁՊо sigmoid অ‫ݳ‬㓴ᡀⲴ࠶ቲᰐ⧟㖁㔌ѝⲴаṧབྷDŽк䘠㔃䇪Ⲵㅜ
Ҽњн䏣൘Ҿˈᆳн㜭༴⨶ਾੁՐ᫝ѝⲴ䇝㓳䗷〻ˈণᔰ࿻ԕ㓖ㅹҾ 0 Ⲵᵳ٬ˈ❦ਾ৽༽ൠ
ᴤᯠ䈕ᵳ٬ˈⴤࡠ᢮ࡠаਟ᧕ਇⲴ‫ٷ‬䇮DŽഐ↔ˈਾੁՐ᫝ᑖᴹӔ৹傼䇱㓸→ḷ߶ˈᆳӗ⭏а
њᴤ‫ྭٿ‬ሿᵳ٬㖁㔌Ⲵᖂ㓣‫ٿ‬㖞DŽ䘉аᖂ㓣‫ٿ‬㖞ˈ䱽վҶᴹ᭸Ⲵ VC 㔤ˈᱟк䶒Ⲵ࠶᷀ᡰн
㜭⏥ⴆⲴDŽ

7.5 ᆜҖⲺ࠰䭏⮂䲆⁗ශ

䲔Ҷ PAC ᆖҐ⁑රԕཆˈ䇑㇇ᆖҐ⨶䇪䘈㘳㲁Ҷཊ⿽н਼Ⲵ䰞仈ṶᷦDŽᐢ㓿⹄ウⲴᆖ
Ґ䰞仈Ṷᷦѝн਼ѻ༴൘Ҿ䇝㓳ṧֻⲴ⭏ᡀᯩᔿ˄㻛ࣘ㿲ሏᆖҐṧֻ䘈ᱟѫࣘᨀࠪḕ䈒˅ˈ
ᮠᦞѝⲴಚ༠˄ᴹಚ༠ᮠᦞ䘈ᱟᰐᐞ䭉ᮠᦞ˅ˈᡀ࣏ᆖҐⲴᇊѹ˄ᗵ享ᆖࡠ↓⺞Ⲵⴞḷᾲᘥˈ
䘈ᱟᴹаᇊⲴਟ㜭ᙗ઼䘁լᙗ˅ˈᆖҐಘᡰ‫ٷⲴڊ‬ᇊ˄ᇎֻⲴ࠶ᐳᛵߥԕ৺ᱟ੖ CŽH˅ˈ઼
䇴ՠᆖҐಘⲴᓖ䟿ḷ߶˄䇝㓳ṧֻᮠ䟿ǃࠪ䭉ᮠ䟿ǃ䇑㇇ᰦ䰤˅DŽ

ᵜ㢲ሶ㘳㲁ᵪಘᆖҐⲴࠪ䭉⭼䲀˄mistake bound˅⁑රˈަѝᆖҐಘ䇴ՠḷ߶ᱟᆳ൘᭦
ᮋࡠ↓⺞‫ٷ‬䇮ࡽᙫⲴࠪ䭉ᮠDŽྲ൘ PAC 䰞仈Ṷᷦѝаṧˈ䘉䟼‫ٷ‬ᇊᆖҐಘ᧕᭦ࡠа㌫ࡇⲴ
䇝㓳ṧֻDŽ❦㘼ˈ䘉䟼ᡁԜᐼᵋ⇿᧕ਇࡠањṧֻ xˈᆖҐಘᗵ享‫ݸ‬亴⍻ⴞḷ٬ c(x)ˈѻਾ
޽⭡ᯭᮉ㘵㔉ࠪ↓⺞Ⲵⴞḷ٬DŽ䘉䟼㘳㲁Ⲵ䰞仈ᱟ˖Ā൘ᆖҐಘᆖҐࡠⴞḷᾲᘥࡽˈᆳⲴ亴
⍻Պᴹཊቁ⅑ࠪ䭉āDŽ䘉а䰞仈൘ᇎ䱵⧟ຳлॱ࠶䟽㾱ˈަѝᆖҐ䗷〻о㌫㔏䘀㹼਼ᰦ䘋㹼ˈ
㘼нᱟ㓿䗷а⇥⿫㓯Ⲵ䇝㓳䗷〻DŽֻྲˈྲ᷌㌫㔏㾱ᆖ⵰亴⍻ଚӋؑ⭘঑䍝⢙ਟ㻛‫ݱ‬䇨ˈଚ
ӋᴹⅪ䇸㹼Ѫˈᗵ享สҾ൘֯⭘ѝᩌ䳶Ⲵᮠᦞˈ❦ਾᡁԜቡ㾱൘ަ᭦ᮋࡠ↓⺞ⴞḷ࠭ᮠࡽ֯
ަࠪ䭉ⲴᮠⴞᴰሿॆDŽ䘉䟼ࠪ䭉Ⲵᙫᮠਟ㜭∄䇝㓳ṧֻⲴᙫᮠᴤ䟽㾱DŽ

䘉⿽ࠪ䭉⭼䲀ᆖҐ䰞仈ਟԕ൘䇨ཊ⢩↺Ⲵ㛼Ჟѝ䘋㹼⹄ウDŽֻྲˈᡁԜਟԕ䇑㇇ᆖҐಘ
൘ PAC ᆖҐࡠⴞḷᾲᘥࡽࠪ䭉Ⲵ⅑ᮠDŽ൘л䶒ⲴֻᆀѝˈᡁԜਚ㘳㲁൘ᆖҐಘ⺞࠷ᆖࡠⴞ
ḷᾲᘥࡽࠪ䭉Ⲵ⅑ᮠDŽަѝ⺞࠷ᆖࡠⴞḷᾲᘥ᜿ણ⵰(x)h(x)=c(x)DŽ

7.5.1 Find-S ㇍⌋Ⲻ࠰䭏⮂䲆

޽⅑㘳㲁‫ٷ‬䇮オ䰤Hवਜ਼㠣ཊnњᐳቄ᮷ᆇ˄l1ĂlnᡆᆳԜⲴ੖ᇊ˅ⲴਸਆⲴᛵߥ˄ֻྲ˖
Richġ™Handsome˅DŽഎᗶㅜ 2 ㄐѝⲴFind-S㇇⌅ˈᆳ໎䟿ᔿൠ䇑㇇о䇝㓳ṧֻа㠤Ⲵᶱབྷ⢩
↺‫ٷ‬䇮DŽሩ‫ٷ‬䇮オ䰤HⲴFind-S㇇⌅Ⲵањㆰ⌱ᇎ⧠ྲл˖

Find-S˖
x ሶh㻛࿻ॆѪᴰ⢩↺‫ٷ‬䇮l1ġ™l1ġl2ġ™l2…lnġ™ln
x ሩ⇿њ↓ֻ x
x Ӿ h ѝ〫৫ԫօн┑䏣 x Ⲵ᮷ᆇ
x 䗃ࠪ‫ٷ‬䇮 h

ྲ᷌ CŽH ф䇝㓳ᮠᦞᰐಚ༠ˈFind-S ᶱ䲀ᰦ᭦ᮋࡠањᰐᐞ䭉Ⲵ‫ٷ‬䇮DŽFind-S ᔰ࿻Ҿ


ᴰ⢩↺Ⲵ‫ٷ‬䇮˄ᆳሶ⇿њᇎֻ࠶Ѫ৽ֻ˅ˈ❦ਾ໎䟿ᔿൠ⌋ॆ䈕‫ٷ‬䇮ˈԕ㾶ⴆ㿲ሏࡠⲴ↓ֻDŽ
ሩҾ䘉䟼֯⭘Ⲵ‫ٷ‬䇮㺘⽪ˈ⌋ॆ䗷〻⭡ࡐ䲔н┑䏣Ⲵ᮷ᆇ᫽֌ᶴᡀDŽ

ᱟ੖ਟԕ䇑㇇ࠪањ䗩⭼ˈԕ᧿䘠 Find-S ൘⺞࠷ᆖࡠⴞḷᾲᘥ c ࡽ‫ޘ‬䜘Ⲵࠪ䭉⅑ᮠ˛


എㆄᱟ㛟ᇊⲴDŽѪ䇱᰾ѻˈ俆‫⌘ݸ‬᜿ྲ᷌ cHˈ䛓Ѹ Find-S ≨䘌нՊሶа৽ֻ䭉䈟ൠࡂ࠶
Ѫ↓ֻDŽ৏ഐѪᖃࡽ‫ٷ‬䇮 h ᙫ∄ⴞḷᾲᘥ c ᴤ⢩↺DŽᡁԜਚ䴰㾱䇑㇇ሶ↓ֻࡂ࠶Ѫ৽ֻⲴࠪ
䭉⅑ᮠDŽ൘ Find-S ⺞࠷ᗇࡠ c ࡽˈ䘉ṧⲴࠪ䭉ᴹཊቁ⅑˛㘳㲁 Find-S ㇇⌅䙷ࡠⲴㅜањ↓
ֻDŽᆖҐಘᖃ❦Պ൘࠶㊫∄ֻᰦࠪ䭉ˈഐѪᆳⲴࡍ࿻‫ٷ‬䇮ሶ‫ޘ‬䜘ᇎֻ䜭࠶Ѫ৽ֻDŽ❦㘼ˈ㔃
᷌ሶᱟࡍ࿻‫ٷ‬䇮ѝ 2n њ亩ѝॺᮠሶ㻛ࡐ৫ˈਚ⮉л n њ亩DŽሩ⇿њਾ㔝Ⲵ↓ֻˈ㤕ᆳ㻛ᖃ
ࡽ‫ٷ‬䇮䈟࠶㊫ˈ࢙։ n њ亩ѝ㠣ቁᴹа亩ᗵ享Ӿ‫ٷ‬䇮ѝࡐ৫DŽഐ↔ˈࠪ䭉Ⲵᙫᮠ㠣ཊѪ n+1DŽ
䈕ࠪ䭉⅑ᮠᱟᴰൿᛵߥлᡰ䴰Ⲵ⅑ᮠˈሩᓄҾᆖҐᴰа㡜Ⲵⴞḷᾲᘥ˖˄x˅c(x)=1ˈᒦф
ᇎֻᒿࡇҏᱟᴰൿᛵߥлⲴ⇿⅑ࠪ䭉ਚ㜭〫৫ањ᮷ᆇDŽ

7.5.2 Halving ㇍⌋Ⲻ࠰䭏⮂䲆

ㅜҼњֻᆀˈ㘳㲁ањ㇇⌅ˈᆳⲴᢗ㹼䗷〻ᱟ㔤ᣔањਈරオ䰤ˈᒦ൘䙷ࡠᯠṧֻᰦ㋮
ॆ䈕ਈරオ䰤DŽㅜ 2 ㄐⲴ‫ى‬䘹⎸䲔㇇⌅઼ࡇ㺘ਾ⎸䲔㇇⌅䜭ᱟ䘉ṧⲴ㇇⌅DŽᵜ㢲ᡁԜ᧘ሬ䘉
ṧⲴᆖҐಘ䪸ሩԫ᜿ᴹ䲀‫ٷ‬䇮オ䰤 H ᴰൿᛵߥлࠪ䭉ᮠ䟿Ⲵ䗩⭼ˈᒦ޽⅑‫ٷ‬ᇊⴞḷᾲᘥ㜭
㻛⺞࠷ᆖҐࡠDŽ

Ѫ࠶᷀ᆖҐ䗷〻ѝࠪ䭉Ⲵᮠ䟿ˈᗵ享俆‫ݸ‬㋮⺞ᤷᇊᆖҐಘሩ⇿њᯠᇎֻՊ֌ࠪᘾṧⲴ亴
⍻DŽ‫ٷ‬ᇊ䈕亴⍻ᱟ൘ᖃࡽਈරオ䰤Ⲵᡰᴹ‫ٷ‬䇮ѝ֌ཊᮠᣅ⾘ᗇᶕDŽྲ᷌ਈරオ䰤ѝཊᮠ‫ٷ‬䇮
ሶᯠᇎֻࡂ࠶Ѫ↓ֻˈ䛓Ѹ䈕亴⍻⭡ᆖҐಘ䗃ࠪDŽ੖ࡉ䗃ࠪ৽ֻⲴ亴⍻DŽ

䘉⿽ሶਈරオ䰤ᆖҐ઼⭘ཊᮠᣅ⾘ᶕ䘋㹼ਾ㔝亴⍻є㘵㔃ਸ䎧ᶕⲴ㇇⌅䙊ᑨ㻛〠Ѫ
Halving ㇇⌅DŽሩԫ᜿ᴹ䲀 HˈHalving ㇇⌅൘⺞࠷ᆖҐࡠⴞḷᾲᘥࡽࠪ䭉Ⲵᴰབྷ⅑ᮠᱟཊቁ˛
⌘᜿Ā⺞࠷āൠᆖҐࡠⴞḷᾲᘥㅹҾ䈤ࡠ䗮ањ⣦ᘱˈਈරオ䰤ѝਚवਜ਼ањ‫ٷ‬䇮˄ྲᖰᑨ
䛓ṧ‫ٷ‬ᇊⴞḷᾲᘥ c ൘ H ѝ˅DŽ

Ѫ᧘ሬ䈕ࠪ䭉⭼䲀ˈ⌘᜿Halving㇇⌅ਚ൘ᖃࡽਈරオ䰤Ⲵཊᮠ‫ٷ‬䇮н㜭↓⺞࠶㊫ᯠṧ
ֻᰦࠪ䭉DŽ൘䘉⿽ᛵߥлˈаն↓⺞࠶㊫㔃᷌ᨀ‫׋‬㔉ᆖҐಘਾˈਈරオ䰤ਟ߿ሿࡠᆳⲴᴰཊ
аॺབྷሿ˄ণਚᴹᣅቁᮠ⾘Ⲵ‫ٷ‬䇮㻛‫˅⮉؍‬DŽ⭡Ҿ⇿⅑ࠪ䭉ሶਈරオ䰤㠣ቁ߿ሿаॺˈ㘼ф
ࡍ࿻ਈරオ䰤वਜ਼|H|њᡀઈˈᡰԕਈරオ䰤ࡠਚवਜ਼ањᡀઈࡽࠪ䭉⅑ᮠᴰབྷѪlog2|H|DŽᇎ
䱵кਟ䇱᰾䈕䗩⭼Ѫ¬log2|H|¼DŽֻྲˈ㘳㲁|H|=7 ⲴᛵߥDŽㅜањࠪ䭉ਟሶ|H|߿ሿࡠᴰཊѪ 3ˈ
ㅜҼ⅑ࠪ䭉ቡਟሶަ߿ሿࡠ 1DŽ

⌘᜿¬log2|h|¼ѪᴰൿᛵߥлⲴ䗩⭼ˈᒦфᴹਟ㜭Halving㇇⌅нࠪԫօᐞ䭉ቡ⺞࠷ᆖҐࡠ
ⴞḷᾲᘥDŽഐѪণ֯ཊᮠ⾘㔃᷌ᱟ↓⺞Ⲵˈ㇇⌅ӽሶ〫৫䛓Ӌн↓⺞Ⲵǃቁᮠ⾘‫ٷ‬䇮DŽ㤕↔
ᛵߥ൘ᮤњ䇝㓳䗷〻ѝਁ⭏ˈ䛓Ѹਈරオ䰤ਟ൘нࠪᐞ䭉Ⲵᛵߥл߿ሿࡠঅњᡀઈDŽ

ሩ Halving ㇇⌅Ⲵањᴹ䏓Ⲵᢙኅᱟ‫ݱ‬䇨‫ٷ‬䇮ԕн਼Ⲵᵳ٬䘋㹼ᣅ⾘DŽㅜ 6 ㄐ᧿䘠Ҷ䍍


ਦᯟᴰՈ࠶㊫ಘˈᆳቡ൘‫ٷ‬䇮ѝ䘋㹼࣐ᵳᣅ⾘DŽ൘䍍ਦᯟᴰՈ࠶㊫ಘѝˈѪ⇿њ‫ٷ‬䇮䍻ҸⲴ
ᵳ٬Ѫަ᧿䘠ⴞḷᾲᘥⲴՠ䇑ਾ傼ᾲ⦷˄㔉ᇊ䇝㓳ᮠᦞл˅DŽᵜ㢲Ⲵਾ䶒ሶ᧿䘠ਖаสҾ࣐
ᵳᣅ⾘Ⲵ㇇⌅ˈ〠Ѫ࣐ᵳཊᮠ㇇⌅DŽ

7.5.3 ᴶՎ࠰䭏⮂䲆

к䶒Ⲵ࠶᷀㔉ࠪҶєњ⢩ᇊ㇇⌅˖Find-S઼‫ى‬䘹⎸䲔㇇⌅൘ᴰൿᛵߥлⲴࠪ䭉⭼䲀DŽа
њᖸᴹ䏓Ⲵ䰞仈ᱟˈሩҾԫ᜿ᾲᘥ㊫Cˈ‫ٷ‬ᇊH=CˈᴰՈⲴࠪ䭉䗩⭼ᱟӰѸ˛ᴰՈࠪ䭉䗩⭼
ᱟᤷ൘ᡰᴹਟ㜭ⲴᆖҐ㇇⌅ѝˈᴰൿᛵߥлࠪ䭉䗩⭼ѝᴰሿⲴ䛓ањDŽᴤ㋮⺞ൠ䈤ˈሩԫ᜿
ᆖҐ㇇⌅A઼ԫ᜿ⴞḷᾲᘥcˈԔMA(c)ԓ㺘AѪҶ⺞࠷ᆖࡠcˈ൘ᡰᴹਟ㜭䇝㓳ṧֻᒿࡇѝࠪ

䭉Ⲵᴰབྷ٬DŽ⧠൘ሩҾԫ᜿䶎オᾲᘥ㊫CˈԔMA(C)į max cC M A (c) DŽ⌘᜿к䶒ᡁԜ䇱᰾

ҶᖃCᱟ㠣ཊnњᐳቄ᮷ᆇ᧿䘠Ⲵᾲᘥ㊫ᰦˈ M Find  S (C ) n  1 DŽ਼ᰦˈሩԫ᜿ᾲᘥ㊫Cˈ

ᡁԜᴹ M Halving (C ) d log 2 (| C |) DŽ

л䶒ᇊѹᾲᘥ㊫ C ⲴᴰՈࠪ䭉䗩⭼DŽ

定义: ԔCѪԫ᜿䶎オᾲᘥ㊫DŽCⲴᴰ ᴰՈࠪ䭉⭼䲀˄optimal mistake bound˅ᇊѹѪ


Opt(C)ˈᱟᡰᴹਟ㜭ᆖҐ㇇⌅AѝMA(C)Ⲵᴰሿ٬DŽ

Opt (C ) { min M A (C )
Alearning _a lg orithms

⭘䶎ᖒᔿⲴ䈝䀰ᶕ䇢ˈ䈕ᇊѹ㺘᰾ Opt(C)ᱟ C ѝᴰഠ䳮Ⲵ䛓њⴞḷᾲᘥ֯⭘ᴰн࡙Ⲵ


䇝㓳ṧֻᒿࡇˈ⭘ᴰྭⲴ㇇⌅Ⲵࠪ䭉⅑ᮠDŽLittlestone˄1987˅䇱᰾ሩԫ᜿ᾲᘥ㊫ Cˈ൘ C
ⲴᴰՈࠪ䭉䗩⭼ˈHalving ㇇⌅䗩⭼઼ C Ⲵ VC 㔤ѻ䰤ᆈ൘аᴹ䏓Ⲵ㚄㌫ˈྲл˖

VC (C ) d Opt (C ) d M Halving (C ) d log 2 (| C |)

ᴤ䘋а↕ˈᆈ൘䘉ṧⲴᾲᘥ㊫֯к䶒Ⲵ 4 њ䟿ᚠྭ⴨ㅹDŽ䘉ṧⲴᾲᘥ㊫ަѝѻаᱟԫ᜿
ᴹ䲀䳶ਸⲴᑲ䳶CPDŽ൘↔ᛵߥлˈVC(CP)=|X|=log2(|CP|)ˈഐ↔ᡰᴹ䘉 4 њ䟿⴨ㅹDŽLittlestone
˄1987˅ᨀ‫׋‬ҶަԆᾲᘥ㊫ⲴֻᆀˈަѝVC(C)ѕṬሿҾOpt(C)ˈOpt(C)ѕṬሿҾMHalving(C)DŽ

7.5.4 ࣖᵹཐᮦ㇍⌋

ᵜ㢲䇘䇪 Halving ㇇⌅Ⲵᴤа㡜Ⲵᖒᔿˈ〠Ѫ࣐ᵳཊᮠ㇇⌅DŽ࣐ᵳཊᮠ㇇⌅䙊䗷൘а亴


⍻㇇⌅⊐ѝ䘋㹼࣐ᵳᣅ⾘ᶕ֌ࠪ亴⍻ˈᒦ䙊䗷᭩ਈ⇿њ亴⍻㇇⌅Ⲵᵳ䟽ᶕᆖҐDŽ䘉Ӌ亴⍻㇇
⌅ਟ㻛ⴻ֌ᱟ H ѝⲴн਼‫ٷ‬䇮ˈᡆ㻛ⴻ֌ᵜ䓛䲿ᰦ䰤ਈॆⲴн਼ᆖҐ㇇⌅DŽሩҾ䘉Ӌ亴⍻
㇇⌅ˈᡰ䴰㾱Ⲵਚᱟ൘㔉ᇊаᇎֻᰦ亴⍻ⴞḷᾲᘥⲴ٬DŽ࣐ᵳཊᮠ㇇⌅Ⲵањᴹ䏓኎ᙗᱟᆳ
ਟԕ༴⨶на㠤Ⲵ䇝㓳ᮠᦞDŽ䘉ᱟഐѪᆳнՊ⎸䲔ᦹоṧֻна㠤Ⲵ‫ٷ‬䇮ˈ㘼ਚᱟ䱽վަᵳ
䟽DŽᆳⲴㅜҼњᴹ䏓኎ᙗᱟˈ㾱䇑㇇↔㇇⌅Ⲵࠪ䭉ᮠ䟿䗩⭼ˈਟԕ⭘亴⍻㇇⌅⊐ѝᴰྭⲴ䛓
њ㇇⌅Ⲵࠪ䭉ᮠ䟿ᶕ䇑㇇DŽ

࣐ᵳཊᮠ㇇⌅аᔰ࿻ሶ⇿њ亴⍻㇇⌅䍻ԕᵳ䟽 1ˈ❦ਾ㘳㲁䇝㓳ṧֻDŽᰐ䇪օᰦа亴⍻
㇇⌅䈟࠶㊫аᯠ䇝㓳ṧֻᰦˈᆳⲴᵳ䟽㻛҈ԕḀњ㌫ᮠ£ˈ0İ£DŽ࣐ᵳཊᮠ㇇⌅Ⲵ⺞࠷
ᇊѹ㿱㺘 DŽ⌘᜿ྲ᷌£ ˈ䛓Ѹ࣐ᵳཊᮠ㇇⌅ㅹҾ Halving ㇇⌅DŽਖаᯩ䶒ˈྲ᷌Ѫ£
䘹ᤙަԆⲴ٬ˈ⋑ᴹањ亴⍻㇇⌅Պ㻛ᆼ‫ޘ‬৫䲔DŽྲ᷌а㇇⌅䈟࠶㊫ањṧֻˈᆳ൘ሶᶕՊ
ঐ䖳ቁⲴ⾘ᮠ∄ֻDŽ

㺘 7-1 ࣐ᵳཊᮠ㇇⌅

aiԓ㺘㇇⌅⊐Aѝㅜiњ亴⍻㇇⌅DŽwiԓ㺘оai⴨‫ޣ‬㚄Ⲵᵳ٬DŽ
 ሩᡰᴹiˈࡍ࿻ॆwiѪ 1
 ሩ⇿њ䇝㓳ṧֻ<x, c(x)>
 ࡍ࿻ॆq0઼q1Ѫ 0
 ሩ⇿њ亴⍻㇇⌅ai
 ྲ᷌ai(x)=0ˈ䛓Ѹq0mq0+wi
ྲ᷌ai(x)=1ˈ䛓Ѹq1mq1+wi
 ྲ᷌q1>q0ˈ䛓Ѹ亴⍻c(x)=1
ྲ᷌q0>q1ˈ䛓Ѹ亴⍻c(x)=0
ྲ᷌q1=q0ˈ䛓Ѹሩc(x)䲿ᵪ亴⍻ 0 ᡆ 1
 ሩAѝ⇿њ亴⍻㇇⌅aiˈ‫˖ڊ‬
ྲ᷌ai(x) zc(x)ˈ䛓ѸwimEwi

⧠൘䇱᰾ˈ࣐ᵳཊᮠ㇇⌅Ⲵࠪ䭉ᮠ䟿䗩⭼ਟԕ⭡ᣅ⾘⊐ѝᴰ֣亴⍻㇇⌅Ⲵࠪ䭉ᮠᶕ㺘
⽪DŽ

ᇊ⨶ 7.5 ࣐ᵳཊᮠ㇇⌅Ⲵ⴨ሩ䈟ᐞ⭼䲀DŽԔ D Ѫԫ᜿Ⲵ䇝㓳ṧֻᒿࡇˈԔ A Ѫԫ᜿ n њ亴⍻㇇


⌅Ⲵ䳶ਸˈԔ k Ѫ A ѝԫ᜿㇇⌅ሩṧֻᒿࡇ D Ⲵࠪ䭉⅑ᮠⲴᴰሿ٬DŽ䛓Ѹ֯⭘£=1/2 Ⲵ࣐ᵳཊᮠ㇇
⌅൘ D кࠪ䭉⅑ᮠᴰཊѪ˖
2.4(k+log2n)

䇱᰾˖ሩᇊ⨶Ⲵ䇱᰾ਟ䙊䗷∄䖳ᴰ֣亴⍻㇇⌅Ⲵᴰ㓸ᵳ䟽઼ᡰᴹ㇇⌅Ⲵᵳ䟽ѻ઼DŽԔajԓ㺘Aѝ
а㇇⌅ˈᒦфᆳࠪ䭉Ⲵ⅑ᮠѪᴰՈⲴk⅑DŽоaj⴨㚄㌫Ⲵᵳ䟽wjሶѪ(1/2)kˈഐѪᆳⲴࡍ࿻ᵳ䟽Ѫ 1ˈᒦ

¦
n
൘⇿⅑ࠪ䭉ᰦ҈ԕ 1/2DŽ⧠൘㘳㲁Aѝᡰᴹnњ㇇⌅Ⲵᵳ䟽઼W=
i 1
wi DŽWࡍ࿻ѪnDŽሩ࣐ᵳཊᮠ㇇

⌅Ⲵ⇿⅑ࠪ䭉ˈW㻛߿ሿѪᴰཊ 3/4 WDŽަ৏ഐᱟ࣐ᵳᣅ⾘ঐᴹཊᮠⲴ㇇⌅ᴰቁᤕᴹᮤњᵳ䟽WⲴаॺ


٬ˈ㘼䘉а䜘࠶ሶ㻛҈ԕഐᆀ 1/2DŽԔMԓ㺘࣐ᵳཊᮠ㇇⌅ሩ䇝㓳ᒿࡇDⲴᙫࠪ䭉⅑ᮠˈଚѸᴰ㓸Ⲵᙫ
M
§3·
ᵳ䟽WᴰཊѪ n¨ ¸ DŽഐѪᴰ㓸Ⲵᵳ䟽wjнՊ∄ᴰ㓸ᙫᵳ䟽བྷˈഐ↔ᴹ˖
©4¹

k M
§1· §3·
¨ ¸ d n¨ ¸
©2¹ ©4¹

䟽ᯠᆹᧂ਴亩ᗇࡠ˖

(k  log 2 n)
Md d 2.4(k  log 2 n)
§3·
 log 2 ¨ ¸
©4¹

ᇊ⨶ᗇ䇱DŽ

ᾲᤜൠ䈤ˈк䶒Ⲵᇊ⨶䈤᰾࣐ᵳཊᮠ㇇⌅Ⲵࠪ䭉ᮠ䟿нՊབྷҾ㇇⌅⊐ѝᴰ֣㇇⌅ࠪ䭉ᮠ
䟿ˈ࣐ка䲿⵰㇇⌅⊐བྷሿሩᮠ໎䮯Ⲵ亩ˈ޽҈ԕаᑨᮠഐᆀDŽ

䈕ᇊ⨶⭡ Littlestone Warmuth˄˅䘋а↕а㡜ॆˈ䇱᰾Ҷሩԫ᜿ İ£ˈк䘠


䗩⭼Ѫ˖

1
k log 2  log 2 n
E

2
log 2
1 E

7.6 ቅ㔉ૂ㺛‫ݻ‬䈱⢟

ᵜㄐⲴ㾱⛩वᤜ˖
x ਟ㜭䘁լ↓⺞⁑ර˄PAC˅䪸ሩⲴ㇇⌅ӾḀᾲᘥ㊫ C ѝᆖҐⴞḷᾲᘥˈ֯⭘᤹
аᵚ⸕նപᇊⲴᾲᘥ࠶ᐳѝ䲿ᵪᣭਆⲴ䇝㓳ṧֻDŽᆳ㾱≲ᆖҐಘਟ㜭˄ԕ㠣ቁ
1-¥Ⲵᾲ⦷˅ᆖҐࡠа䘁լ↓⺞˄䭉䈟⦷ሿҾ¦˅Ⲵ‫ٷ‬䇮ˈ㘼䇑㇇䟿઼䇝㓳ṧֻ
ᮠ䜭ਚ䲿⵰ 1/¥ˈ1/¦ˈᇎֻ䮯ᓖ઼ⴞḷᾲᘥ䮯ᓖⲴཊ亩ᔿ㓗㓯ᙗ໎䮯DŽ
x ൘ PAC ᆖҐ⁑රⲴṶᷦлˈԫօ֯⭘аᴹ䲀‫ٷ‬䇮オ䰤 H˄ަѝ CŽH˅Ⲵа㠤ᆖ
Ґಘˈሶԕᾲ⦷ 1-¥䗃ࠪањⴞḷᾲᘥѝ䈟ᐞ൘¦㤳ത޵Ⲵ‫ٷ‬䇮ˈᡰ䴰䲿ᵪᣭ
ਆ䇝㓳ṧֻᮠⴞѪ mˈф m ┑䏣
1
mt (ln(1 / G )  ln H )
H
䈕ᔿ㔉ࠪҶ PAC ⁑රлᡀ࣏ⲴᆖҐᡰ䴰Ⲵ䏣ཏⲴ䇝㓳ṧֻᮠⴞⲴ䗩⭼DŽ
x PAC ᆖҐ⁑රⲴањᴹ㓖ᶏⲴ‫ٷ‬ᇊᱟˈᆖҐಘ亴‫⸕ݸ‬䚃Ḁਇ䲀Ⲵᾲᘥ㊫ Cˈᆳ
वਜ਼㾱ᆖҐⲴⴞḷᾲᘥDŽ⴨৽ˈнਟ⸕ᆖҐ˄agnostic learning˅㘳㲁ᴤа㡜Ⲵ䰞
仈ṶᷦˈަѝᆖҐಘн‫ٷ‬ᇊⴞḷᾲᘥᡰ൘Ⲵ㊫࡛DŽᆖҐಘਚӾ䇝㓳ᮠᦞѝ䗃ࠪ H
ѝᴹᴰሿ䈟ᐞ⦷˄ਟ㜭䶎 0˅Ⲵ‫ٷ‬䇮DŽ൘䘉њਇ䲀䖳ቁⲴнਟ⸕ᆖҐ⁑රѝˈᆖ
Ґಘ‫؍‬䇱ԕᾲ⦷ 1-¥Ӿ H ѝᴰਟ㜭ᴹ‫ٷ‬䇮ѝ䗃ࠪ䭉䈟⦷ሿҾ¦Ⲵ‫ٷ‬䇮ˈ㾱㿲ሏ
Ⲵ䲿ᵪᣭਆ䇝㓳ṧֻᮠⴞ m ┑䏣˖
1
mt (ln(1 / G )  ln H )
2H 2
x ᡀ࣏ⲴᆖҐᡰ䴰Ⲵ䇝㓳ֻᮠⴞᖸᕪ⛸ൠਇࡠᆖҐಘᡰ㘳㲁Ⲵ‫ٷ‬䇮オ䰤༽ᵲᓖⲴ
ᖡ૽DŽሩҾ‫ٷ‬䇮オ䰤 H ༽ᵲᓖⲴањᴹ⭘Ⲵᓖ䟿ᱟ VC 㔤ˈVC(H)DŽVC(H)ᱟਟ
㻛 H ᣶ᮓ˄ԕᡰᴹਟ㜭ᯩᔿ࠶ࢢ˅ᴰབྷᇎֻᆀ䳶ⲴབྷሿDŽ
x ൘ PAC ⁑රлԕ VC(H)㺘⽪Ⲵ䏣ԕሬ㠤ᡀ࣏ᆖҐⲴ䇝㓳ṧֻᮠⴞⲴк⭼Ѫ
1
mt (4 log 2 (2 / G )  8VC ( H ) log 2 (13 / H ))
H
л⭼Ѫ

ª1 VC (C )  1º
m t max « log(1 / G ),
¬H 32H »¼
x ਖа⿽ᆖҐ⁑ᔿ〠Ѫࠪ䭉⭼䲀⁑ᔿˈᆳ⭘Ҿ࠶᷀ањᆖҐಘ൘⺞࠷ᆖҐࡠⴞḷ
ᾲᘥѻࡽՊӗ⭏Ⲵ䈟࠶㊫⅑ᮠDŽֻྲˈHalving㇇⌅൘ᆖҐࡠHѝⲴԫ᜿ⴞḷᾲ
ᘥࡽՊᴹ㠣ཊ¬log2|H|¼⅑ࠪ䭉DŽሩԫ᜿ᾲᘥ㊫Cˈᴰൿᛵߥлᴰ֣㇇⌅ሶᴹOpt(C)
⅑ࠪ䭉ˈަѝ˖
VC(C)İOpt(C)İ log2(|C|)
x ࣐ᵳཊᮠ㇇⌅㔃ਸҶཊњ亴⍻㇇⌅Ⲵ࣐ᵳᣅ⾘ᶕ࠶㊫ᯠⲴᇎֻDŽᆳสҾ䘉Ӌ亴
⍻㇇⌅൘ṧֻᒿࡇѝⲴࠪ䭉ᶕᆖҐ⇿њ㇇⌅Ⲵᵳ٬DŽᴹ䏓Ⲵᱟˈ࣐ᵳཊᮠ㇇⌅
ӗ⭏Ⲵ䭉䈟⭼䲀ਟ⭘㇇⌅⊐ѝᴰ֣亴⍻㇇⌅Ⲵࠪ䭉ᮠᶕ䇑㇇DŽ

䇑㇇ᆖҐ⨶䇪ѝ䇨ཊᰙᵏⲴᐕ֌䪸ሩⲴ䰞仈ᱟˈ൘㔉ᇊањнᇊ䮯Ⲵ䇝㓳ṧֻᒿֻᰦˈ
ᆖҐಘᱟ੖㜭൘ᶱ䲀ᰦ⺞ᇊⴞḷᾲᘥDŽ൘ᶱ䲀⁑රлⲴ⺞ᇊᯩ⌅⭡ Gold  㔉ࠪDŽ‫ޣ‬Ҿ
↔亶ฏⲴањྭⲴ㔬䘠㿱 Angluin DŽVapnik  䈖㓶㘳ḕҶа㠤᭦ᮋ˄uniform
convergence˅Ⲵ䰞仈ˈ㘼ᇶ࠷⴨‫ Ⲵޣ‬PAC ᆖҐ⁑ර⭡ Valiant  ᨀࠪDŽᵜㄐѝ¦䈖ቭਈ
රオ䰤Ⲵ䇘䇪สҾ Haussler  Ⲵ䱀䘠DŽ൘ PAC ⁑රлⲴа㓴ᴹ⭘Ⲵ㔃䇪ਟ൘ Blueretal
˄˅ѝ᢮ࡠDŽKearns Vazirani  ᨀ‫׋‬Ҷ䇑㇇ᆖҐ⨶䇪ѝ䇨ཊ㔃䇪ⲴањՈ⿰Ⲵ䱀
䘠DŽ↔亶ฏаӋᰙᵏⲴ᮷ㄐवᤜ Anthsny Biggs  ઼ Natarajan  DŽ

ⴞࡽ䇑㇇ᆖҐ⨶䇪Ⲵ⹄ウ㾶ⴆҶ䇨䇨ཊཊⲴᆖҐ⁑ර઼ᆖҐ㇇⌅DŽ䇨ཊ䘉ᯩ䶒Ⲵ⹄ウਟ
ԕ൘䇑㇇ᆖҐ⨶䇪˄COLT˅ⲴᒤᓖՊ䇞Ⲵ䇪᮷䳶ѝ᢮ࡠDŽᵏ࠺ljᵪಘᆖҐNJ MachineLearning
ѝаӋ⢩↺Ⲵḿⴞҏ⎹৺䘉аѫ仈DŽ
Ґ仈

 㘳㲁䇝㓳ањє䗃‫ޕ‬ᝏ⸕ಘDŽ㔉ࠪ䇝㓳ṧֻᮠⴞⲴк⭼ˈԕ‫؍‬䇱ᆖҐࡠⲴᝏ⸕ಘᴹ
Ⲵ㖞ؑᓖˈަⵏᇎ䭉䈟⦷н䎵䗷 DŽ䘉а䗩⭼ᱟ੖ᇎ䱵˛

 㘳㲁ᾲᘥ㊫ C ⲴᖒᔿѪ˄aİxİb˅ġ˄cİyİd˅ަѝ abcd Ѫ४䰤˄˅


䰤ⲴᮤᮠDŽ⌘᜿䈕㊫ѝⲴ⇿њᾲᘥሩᓄањ⸙ᖒˈᆳⲴ䗩⭼ᱟ xy ᒣ䶒Ⲵа䜘࠶кⲴᮤᮠ٬DŽ
ᨀ⽪˖㔉ᇊањ䈕ᒣ䶒кⲴ४䰤ˈަ䗩⭼Ѫ⛩  ઼ nn DŽ൘↔४䰤޵н਼Ⲵᇎ䗩
2
§ n(n  1) ·
⭼⸙ᖒⲴᮠ䟿Ѫ ¨ ¸ DŽ
© 2 ¹

a 㔉ࠪ䲿ᵪᣭਆ䇝㓳ṧֻⲴᮠ䟿Ⲵк⭼ˈ֯䏣ԕ‫؍‬䇱ሩ C ѝԫ᜿ⴞḷᾲᘥ cˈԫа֯


⭘ H C ⲴᆖҐಘሶԕ Ⲵᾲ⦷䗃ࠪањ䭉䈟⦷ᴰཊѪ  Ⲵ‫ٷ‬䇮DŽ

b ⧠‫ٷ‬ᇊ⸙ᖒ䗩⭼ abcd ਆᇎᮠ٬DŽ䟽ᯠഎㆄㅜањ䰞仈DŽ

൘ᵜㄐѝᡁԜ᧘ሬҶ䇝㓳ṧֻᮠ䟿Ⲵ㺘䗮ᔿˈ֯䏣ԕ‫؍‬䇱⇿њ‫ٷ‬䇮Ⲵⵏᇎ䭉䈟⦷н
ՊᐞҾަ㿲ሏࡠⲴ䇝㓳䭉䈟⦷errorD h ࣐к¦DŽ⢩࡛ൠˈᡁԜ֯⭘ҶHoeffding⭼䲀ᶕ᧘ሬ
ᔿ DŽ䈅᧘ሬ䇝㓳ṧֻᮠⴞⲴਖа㺘䗮ᔿˈ֯䏣ԕ‫؍‬䇱⇿њ‫ٷ‬䇮Ⲵⵏᇎ䭉䈟⦷нՊᐞҾ 
¤ errorD h DŽ᧘ሬⲴ䗷〻ਟ֯⭘л䶒Ⲵ䙊⭘ⲴChernoff⭼䲀DŽ

Chernoff⭼䲀˖‫ٷ‬ᇊxĂxmˈѪmњ⤜・⺜ᐱᣅ᧧˄Bernonlliᇎ傼˅Ⲵ䗃ࠪˈަѝ⇿
⅑ᇎ傼↓䶒Ⲵᾲ⦷ѪPr>Xi @ pˈ㘼৽䶒ᾲ⦷Pr>Xi @ pDŽᇊѹS XXĂXmѪ䘉m⅑ᇎ
傼䗃ࠪⲴ઼DŽSmⲴᵏᵋ٬ѪE>Sm@ pDŽChernoff⭼䲀᧿䘠ҶSmԕḀഐᆀ ݤİ н਼Ҿ
pⲴᾲ⦷˖

Pr[ S / m ! (1  J ) p ] d e  mpJ
2
/3


Pr[ S / m ! (1  J ) p ] d e  mpJ
2
/2


 㘳㲁аᆖҐ䰞仈ˈަѝ X ƒѪᇎᮠ䳶ਸˈᒦф C H ѪᇎᮠкⲴ४䰤䳶ਸˈ


H ^ axb _abęƒ`DŽ㤕а‫ٷ‬䇮о↔ⴞḷᾲᘥⲴ m њṧֻа㠤ˈ䛓Ѹᆳ䭉䈟⦷㠣ቁѪ¦
Ⲵᾲ⦷ᱟཊቁ˛֯⭘ VC 㔤䀓ߣ↔䰞仈DŽᱟ੖㜭᢮ࡠਖа⿽ᯩ⌅สҾᴰสᵜⲴ৏⨶ᒦфн⭘
VC 㔤ᶕ䀓ߣ↔䰞仈˛

 㘳㲁ሩᓄ xy ᒣ䶒кᡰᴹ⛩Ⲵᇎֻオ䰤 Xˈ㔉ࠪлࡇ‫ٷ‬䇮オ䰤Ⲵ VC 㔤˖

 a Hr xyᒣ䶒кᡰᴹ⸙ᖒⲴ䳶ਸDŽণH {((a  x  b) š (c  y  d )) | a, b, c, d  ƒ} 

 b Hc xyᒣ䶒ⲴശDŽ൘ശ޵Ⲵ⛩㻛࠶㊫Ѫ↓ֻDŽ

 c Ht xyᒣ䶒޵Ⲵй䀂ᖒDŽ൘й䀂ᖒ޵Ⲵ⛩㻛࠶㊫Ѫ↓ֻDŽ
 ߉ࠪҐ仈  ѝሩHrⲴања㠤ᆖҐಘDŽ䲿ᵪ⭏ᡀа㓴н਼Ⲵⴞḷᾲᘥˈሩᓄᒣ䶒
кн਼Ⲵ⸙ᖒDŽѪ⇿ањⴞḷᾲᘥ䲿ᵪ⭏ᡀṧֻˈަѝⲴᇎֻ࠶ᐳѪ⸙ᖒ!ࡠ!
޵Ⲵ൷र࠶ᐳDŽ൘മк⭫ࠪሩᓄ䇝㓳ṧֻᮠⴞⲴmⲴ⌋ॆ䭉䈟⦷DŽ൘਼аമкˈ⭫ࠪ¥ 
ᰦ¦઼mѻ䰤⨶䇪кⲴ‫ޣ‬㌫ᴢ㓯DŽ䈕⨶䇪ᱟ੖оᇎ傼⴨ㅖਸ˛

 㘳㲁‫ٷ‬䇮㊫HrdѪnњᐳቄਈ䟿кⲴĀ㿴ࡉⲴˈ␡ᓖ  ⲴߣㆆṁāDŽ䘉ṧⲴߣㆆṁᱟ


ᤷ␡ᓖѪ ˄ণᴹഋњਦ㔃⛩ˈоṩⲴ⸙⿫䜭Ѫ ˅ˈфṩⲴᐖᆀ㔃⛩઼ਣᆀ㔃⛩㾱≲वਜ਼਼
ṧⲴਈ䟿DŽֻྲˈл䶒ⲴṁѪHrdѝⲴањᇎֻDŽ

插图——原书页码:228

a ԕnⲴ࠭ᮠᖒᔿ㺘⽪ࠪHrd2ѝᴹཊቁ䈝⌅н਼ⲴṁDŽ

(b)㔉ࠪPAC⁑රлᡰ䴰Ⲵṧֻᮠⴞк⭼ˈ֯ᆖҐࡠHrd2䭉䈟⦷Ѫ¦ˈ㖞ؑᓖѪ¥DŽ

(c)㘳㲁л䶒ⲴሩHrd2㊫Ⲵ࣐ᵳཊᮠ㇇⌅DŽᔰ࿻ˈHrd2ѝᡰᴹ‫ٷ‬䇮ࡍ࿻ᵳ٬䜭Ѫ DŽ⇿⅑
䙷ࡠᯠṧֻˈ㾱สҾHrd2ѝᡰᴹ‫ٷ‬䇮Ⲵ࣐ᵳᣅ⾘䘋㹼亴⍻DŽ❦ਾˈнᱟ⎸䲔ᦹна㠤Ⲵṁˈ
㘼ᱟሶᆳԜⲴᵳ٬ԕഐᆀ  䘋㹼ࡺ߿DŽ↔䗷〻ᴰཊՊᴹཊቁ⅑ࠪ䭉˛ԕHrd2ѝᴰ֣ṁⲴࠪ䭉
ᮠ઼nᶕ㺘⽪DŽ

7.8 ᵜ䰞仈ѫ㾱㘳㲁㾱ᵜㄐѝⲴ PAC ࠶઼᷀ㅜ 5 ㄐ䇘䇪Ⲵ‫ٷ‬䇮䇴ՠѻ䰤Ⲵ㚄㌫DŽ㘳㲁а

ᆖҐԫ࣑ˈަѝᇎֻ䜭⭡ n њᐳቄਈ䟿᧿䘠˄ྲ˖ x1 š x 2 š x3 ... š x n ˅ˈᒦфަᣭਆ᤹➗

Ḁപᇊնᵚ⸕Ⲵᾲ⦷࠶ᐳ DDŽⴞḷᾲᘥᐢ⸕ਟ⭡ᐳቄ኎ᙗᡆᆳԜⲴ੖ᇊⲴਸਆᶕ㺘⽪˄ྲ

x 2 š x5 ˅ˈᒦфᆖҐ㇇⌅֯⭘䈕ᾲᘥ㊫֌ѪᆳⲴ‫ٷ‬䇮オ䰤 HDŽања㠤ᆖҐಘ㻛㔉Ҹ 100

њ᤹ D ᣭਆⲴ䇝㓳ṧֻDŽᆳӾ H ѝ䗃ࠪањ‫ٷ‬䇮 hˈᱟоᡰᴹ 100 њṧֻа㠤Ⲵ˄ণ൘䘉


Ӌ䇝㓳ṧֻк h Ⲵ䭉䈟⦷Ѫ 0DŽ˅

(a)ᡁԜᝏ‫ޤ‬䏓Ⲵᱟ h Ⲵⵏᇎ䭉䈟⦷ˈণሶᶕ᤹ D ᣭਆⲴᇎֻ㻛䈟࠶㊫Ⲵᾲ⦷ᱟཊቁDŽ


สҾк䶒Ⲵؑ᚟ˈ㜭੖㔉ࠪањ४䰤ˈ֯ⵏᇎ䭉䈟⦷㩭‫ަޕ‬ѝⲴᾲ⦷㠣ቁѪ 95%˛ྲ᷌㜭ˈ
䈧᧿䘠䈕४䰤ᒦㆰ䘠⨶⭡DŽ੖ࡉˈ䀓䟺ഠ䳮ᡰ൘DŽ

(b)⧠൘ᣭਆ 100 њᯠⲴᇎֻˈᣭਆ᤹➗࠶ᐳ D ᒦ⴨ӂ⤜・DŽ㔃᷌ਁ⧠ h ሶ 100 њᯠṧ


ֻѝⲴ 30 њ䈟࠶㊫ҶDŽ㜭੖㔉ࠪањ४䰤֯ⵏᇎ䭉䈟⦷㩭‫ަޕ‬ѝᾲ⦷㓖Ѫ 95%˛˄൘䘉䟼
ᘭ⮕ԕࡽሩ䇝㓳ᮠᦞⲴᙗ㜭DŽ˅ྲ᷌㜭ཏˈ䈧᧿䘠䈕४䰤ᒦㆰ䘠⨶⭡DŽ੖ࡉ䀓䟺ഠ䳮ᡰ൘DŽ

(c)ণ֯ h 㜭ཏᆼழൠ࠶㊫䇝㓳ṧֻˈᆳӽ❦ᢺᯠṧֻ 30%䈟࠶㊫ҶDŽࡔᯝ䘉⿽ᛵߥᱟ


ሩ䖳བྷⲴ n 䘈ᱟ䖳ሿⲴ n ᴤᴹਟ㜭ࠪ⧠DŽ⭘аਕ䈍䈤᰾֐ⲴഎㆄⲴ⨶⭡DŽ
ㅢ8ㄖ  ะӄᇔׁⲺᆜҖ

已知一系列的训练样例,很多学习方法为目标函数建立起明确的一般化描述;
但与此不同,基于实例的学习方法只是简单地把训练样例存储起来。从这些实例中
泛化的工作被推迟到必须分类新的实例时。每当学习器遇到一个新的查询实例,它
分析这个新实例与以前存储的实例的关系,并据此把一个目标函数值赋给新实例。
基于实例的学习方法包括最近邻(nearest neighbor)法和局部加权回归(locally
weighted regression)法,它们都假定实例可以被表示为欧氏空间中的点。基于实
例的学习方法还包括基于案例的推理(case-based reasoning),它对实例采用更
复杂的符号表示。基于实例的学习方法有时被称为消极(lazy)学习法,因为它们
把处理工作延迟到必须分类新的实例时。这种延迟的或消极的学习方法有一个关键
的优点,即它们不是在整个实例空间上一次性地估计目标函数,而是针对每个待分
类新实例作出局部的和相异的估计。

8.1 ㆶԁ

สҾᇎֻⲴᆖҐᯩ⌅ѝˈᴰ䘁䛫⌅઼ተ䜘࣐ᵳഎᖂ⌅⭘Ҿ䙬䘁ᇎ٬ᡆ⿫ᮓⴞḷ࠭ᮠˈᆳ
Ԝ൘ᾲᘥк䜭ᖸㆰ᰾DŽሩҾ䘉Ӌ㇇⌅ˈᆖҐ䗷〻ਚᱟㆰঅൠᆈۘᐢ⸕Ⲵ䇝㓳ᮠᦞDŽᖃ䙷ࡠᯠ
Ⲵḕ䈒ᇎֻᰦˈа㌫ࡇ⴨լⲴᇎֻ㻛Ӿᆈۘಘѝਆࠪˈᒦ⭘ᶕ࠶㊫ᯠⲴḕ䈒ᇎֻDŽ䘉Ӌᯩ⌅
оަԆㄐ䇘䇪Ⲵᯩ⌅⴨∄ˈањ‫ޣ‬䭞ᐞᔲᱟ˖สҾᇎֻⲴᯩ⌅ਟԕѪн਼Ⲵᖵ࠶㊫ḕ䈒ᇎֻ
ᔪ・н਼Ⲵⴞḷ࠭ᮠ䙬䘁DŽһᇎкˈᖸཊᢰᵟਚᔪ・ⴞḷ࠭ᮠⲴተ䜘䙬䘁ˈሶަᓄ⭘Ҿоᯠ
ḕ䈒ᇎֻ䛫䘁Ⲵᇎֻˈ㘼Ӿнᔪ・൘ᮤњᇎֻオ䰤к䜭㺘⧠㢟ྭⲴ䙬䘁DŽᖃⴞḷ࠭ᮠᖸ༽ᵲˈ
նᆳਟ⭘нཚ༽ᵲⲴተ䜘䙬䘁᧿䘠ᰦˈ䘉ṧ‫ڊ‬ᴹᱮ㪇ⲴՈ࣯DŽ

สҾᇎֻⲴᯩ⌅ҏਟԕ֯⭘ᴤ༽ᵲⲴㅖਧ㺘⽪⌅ᶕ᧿䘠ᇎֻDŽ൘สҾṸֻⲴᆖҐѝˈᇎ
ֻণԕ䘉⿽ᯩᔿ㺘⽪ˈ㘼фҏ᤹➗䘉⿽ᯩᔿᶕ⺞ᇊ䛫䘁ᇎֻDŽสҾṸֻⲴ᧘⨶ᐢ㓿㻛ᓄ⭘ࡠ
ᖸཊԫ࣑ѝˈ∄ྲˈ൘૘䈒ਠкᆈ઼ۘ༽⭘䗷৫Ⲵ㓿傼˗ṩᦞԕࡽⲴ⌅ᖻṸԦ䘋㹼᧘⨶˗䙊
䗷༽⭘ԕࡽ≲䀓Ⲵ䰞仈Ⲵ⴨‫ޣ‬䜘࠶ᶕ䀓ߣ༽ᵲⲴ䈳ᓖ䰞仈DŽ

สҾᇎֻᯩ⌅Ⲵањн䏣ᱟˈ࠶㊫ᯠᇎֻⲴᔰ䬰ਟ㜭ᖸབྷDŽ䘉ᱟഐѪࠐѾᡰᴹⲴ䇑㇇䜭
ਁ⭏൘࠶㊫ᰦˈ㘼нᱟ൘ㅜа⅑䙷ࡠ䇝㓳ṧֻᰦDŽᡰԕˈྲօᴹ᭸ൠ㍒ᕅ䇝㓳ṧֻˈԕ߿ቁ
ḕ䈒ᰦᡰ䴰䇑㇇ᱟањ䟽㾱Ⲵᇎ䐥䰞仈DŽ↔㊫ᯩ⌅ⲴㅜҼњн䏣ᱟ˄ቔަሩҾᴰ䘁䛫⌅˅ˈ
ᖃӾᆈۘಘѝỰ㍒⴨լⲴ䇝㓳ṧֻᰦˈᆳԜа㡜㘳㲁ᇎֻⲴᡰᴹ኎ᙗDŽྲ᷌ⴞḷᾲᘥӵ‫׍‬䎆
Ҿᖸཊ኎ᙗѝⲴࠐњᰦˈ䛓Ѹⵏ↓ᴰĀ⴨լāⲴᇎֻѻ䰤ᖸਟ㜭⴨䐍⭊䘌DŽ

൘ла㢲ᡁԜሶӻ㓽 k-䘁䛫˄k-Nearest Neighbor˅⌅ˈԕ৺䘉њᒯ⌋ᓄ⭘Ⲵᯩ⌅Ⲵࠐњ


ਈփDŽ൘↔ѻਾᡁԜሶ䇘䇪ተ䜘࣐ᵳഎᖂ⌅ˈа⿽ᔪ・ⴞḷ࠭ᮠⲴተ䜘䙬䘁ⲴᆖҐᯩ⌅ˈ䘉
⿽ᯩ⌅ਟԕ㻛ⴻ֌ k-䘁䛫⌅Ⲵа㡜ᖒᔿDŽ❦ਾᡁԜ᧿䘠ᖴੁส࠭ᮠ˄radial basis function˅
㖁㔌ˈ䘉⿽㖁㔌ѪสҾᇎֻⲴᆖҐ㇇⌅઼⾎㓿㖁㔌ᆖҐ㇇⌅ᨀ‫׋‬Ҷањᴹ䏓ⲴẕằDŽ޽ла
㢲䇘䇪สҾṸֻⲴ᧘⨶ˈа⿽֯⭘ㅖਧ㺘⽪઼สҾ⸕䇶Ⲵ᧘⨶˄knowledge-based inference˅
Ⲵᯩ⌅DŽ䘉а㢲वᤜҶањสҾṸֻⲴ᧘⨶ᓄ⭘ᇎֻˈ⭘Ҿ䀓ߣᐕ〻䇮䇑䰞仈DŽᴰਾˈᡁԜ
䇘䇪Ҷᵜㄐ䇢䘠Ⲵ⎸ᶱᆖҐᯩ⌅઼ᵜҖަԆ਴ㄐⲴ〟ᶱ˄eager˅ᆖҐᯩ⌅䰤ⲴᐞᔲDŽ

8.2 k-䘇䛱⌋

สҾᇎֻⲴᆖҐᯩ⌅ѝᴰสᵜⲴᱟk-䘁䛫㇇⌅DŽ䘉њ㇇⌅‫ٷ‬ᇊᡰᴹⲴᇎֻሩᓄҾn㔤⅗
∿オ䰤ƒnѝⲴ⛩DŽањᇎֻⲴᴰ䘁䛫ᱟṩᦞḷ߶⅗∿䐍⿫ᇊѹⲴDŽᴤ㋮⺞ൠ䇢ˈᢺԫ᜿Ⲵ
ᇎֻx㺘⽪Ѫл䶒Ⲵ⢩ᖱੁ䟿˖

<a1(x)ˈa2(x)ˈ}an(x)>

ަѝar(x)㺘⽪ᇎֻxⲴㅜrњ኎ᙗ٬DŽ䛓Ѹєњᇎֻxi઼xj䰤Ⲵ䐍⿫ᇊѹѪd(xi, xj)ˈަѝ˖

n
d(xi, xj){ ¦ (a ( x )  a ( x
r 1
r i r j )) 2

൘ᴰ䘁䛫ᆖҐѝˈⴞḷ࠭ᮠ٬ਟԕѪ⿫ᮓ٬ҏਟԕѪᇎ٬DŽᡁԜ‫ݸ‬㘳㲁ᆖҐԕлᖒᔿⲴ
⿫ᮓⴞḷ࠭ᮠf : ƒnoVDŽަѝVᱟᴹ䲀䳶ਸ{v1, }vs}DŽ㺘 8-1 㔉ࠪҶ䙬䘁⿫ᮓⴞḷ࠭ᮠⲴk-

䘁䛫㇇⌅DŽ↓ྲ㺘ѝᡰᤷࠪⲴˈ䘉њ㇇⌅Ⲵ䘄എ٬ fˆ (xq)Ѫሩf(xq)Ⲵՠ䇑ˈᆳቡᱟ䐍⿫xqᴰ

䘁Ⲵkњ䇝㓳ṧֻѝᴰᲞ䙽Ⲵf٬DŽྲ᷌ᡁԜ䘹ᤙk=1ˈ䛓ѸĀ1-䘁䛫㇇⌅āቡᢺf(xi)䍻㔉 fˆ (xq)ˈ

ަѝxiᱟᴰ䶐䘁xqⲴ䇝㓳ᇎֻDŽሩҾ䖳བྷⲴk٬ˈ䘉њ㇇⌅䘄എࡽkњᴰ䶐䘁Ⲵ䇝㓳ᇎֻѝᴰ
Პ䙽Ⲵf٬DŽ

㺘 8-1 䙬䘁⿫ᮓ٬࠭ᮠf : ƒnoVⲴk-䘁䛫㇇⌅

䇝㓳㇇⌅˖K-NN(k nearest neighbor learning)⺞ᇎᱟ࠶㊫㇇⌅ˈᱟ᤹➗оᮠᦞ⛩ᴰ᧕䘁


Ⲵ⛩Ⲵᣅ⾘ᶕߣᇊ䈕⛩኎Ҿଚњ㊫DŽ
zሩҾ⇿њ䇝㓳ṧֻ<x, f(x)>ˈᢺ䘉њṧֻ࣐‫ࡇޕ‬㺘 training_examples
࠶㊫㇇⌅˖
z㔉ᇊањ㾱࠶㊫Ⲵḕ䈒ᇎֻxq
z൘training_examplesѝ䘹ࠪᴰ䶐䘁xqⲴkњᇎֻˈᒦ⭘x1}xk㺘⽪
z䘄എ
k
fˆ ( x q ) m arg max ¦ G (v, f ( xi ))
vV i 1

ަѝྲ᷌ a=b 䛓ѸG(a, b)=1ˈ੖ࡉG(a, b)=0DŽ

മ 8-1 മ䀓Ҷа⿽ㆰঅᛵߥлⲴk-䘁䛫㇇⌅ˈ൘䘉䟼ᇎֻᱟҼ㔤オ䰤ѝⲴ⛩ˈⴞḷ࠭ᮠ
ާᴹᐳቄ٬DŽ↓৽䇝㓳ṧֻ⭘Ā+ā઼Ā-ā࠶࡛㺘⽪DŽമѝҏ⭫ࠪҶањḕ䈒⛩xqDŽ⌘᜿൘
䘉ᑵമѝˈ1-䘁䛫㇇⌅ᢺxq࠶㊫Ѫ↓ֻˈ❦㘼 5-䘁䛫㇇⌅ᢺxq࠶㊫Ѫ৽ֻDŽ

插图——原书页码:233
മ 8-1 k-䘁䛫㇇⌅

ᐖമ⭫ࠪҶа㌫ࡇⲴ↓৽䇝㓳ṧ઼ֻањ㾱࠶㊫Ⲵḕ䈒ᇎֻxqDŽ1-䘁䛫㇇⌅ᢺxq࠶㊫Ѫ↓ֻˈ❦㘼
5-䘁䛫㇇⌅ᢺxq࠶㊫Ѫ৽ֻDŽਣമᱟሩҾањިරⲴ䇝㓳ṧֻ䳶ਸ 1-䘁䛫㇇⌅ሬ㠤Ⲵߣㆆ䶒DŽത㔅
⇿њ䇝㓳ṧֻⲴࠨཊ䗩ᖒ㺘⽪ᴰ䶐䘁䘉њ⛩Ⲵᇎֻオ䰤˄ণ䘉њオ䰤ѝⲴᇎֻՊ㻛 1-䘁䛫㇇⌅䍻Ҹ
䈕䇝㓳ṧֻᡰ኎Ⲵ࠶㊫˅DŽ

k-䘁䛫⌅䳀ਜ਼㘳㲁Ⲵ‫ٷ‬䇮オ䰤HⲴ⢩ᙗᱟӰѸ઒˛⌘᜿k-䘁䛫㇇⌅Ӿᶕнᖒᡀ‫ޣ‬Ҿⴞḷ

࠭ᮠfⲴ᰾⺞Ⲵа㡜‫ٷ‬䇮 fˆ DŽᆳӵ൘䴰㾱ᰦ䇑㇇⇿њᯠḕ䈒ᇎֻⲴ࠶㊫DŽ❦㘼ˈᡁԜ‫❦׍‬ਟ

ԕ䰞˖䳀ਜ਼Ⲵа㡜࠭ᮠᱟӰѸ˛ᡆ㘵䈤ˈྲ᷌‫؍‬ᤱ䇝㓳ṧֻнਈˈᒦ⭘XѝⲴ⇿њਟ㜭ᇎֻ
ḕ䈒㇇⌅ˈՊᗇࡠӰѸṧⲴ࠶㊫˛മ 8-1 ѝⲴਣമ⭫ࠪҶ 1-䘁䛫㇇⌅൘ᮤњᇎֻオ䰤кሬ㠤
Ⲵߣㆆ䶒ᖒ⣦DŽߣㆆ䶒ᱟത㔅⇿њ䇝㓳ṧֻⲴࠨཊ䗩ᖒⲴਸᒦDŽሩҾ⇿њ䇝㓳ṧֻˈཊ䗩ᖒ
ᤷࠪҶањḕ䈒⛩䳶ਸˈᆳⲴ࠶㊫ᆼ‫⴨⭡ޘ‬ᓄ䇝㓳ṧֻߣᇊDŽ൘䘉њཊ䗩ᖒཆⲴḕ䈒⛩ᴤ᧕
䘁ަԆⲴ䇝㓳ṧֻDŽ䘉⿽㊫රⲴമ㓿ᑨ㻛〠Ѫ䘉њ䇝㓳ṧֻ䳶ਸⲴVoronoiമ ķ (Voronoi
diagram)DŽ

ሩࡽ䶒Ⲵk-䘁䛫㇇⌅֌ㆰঅⲴ‫؞‬᭩ਾˈᆳቡਟ㻛⭘Ҿ䙬䘁䘎㔝٬Ⲵⴞḷ࠭ᮠDŽѪҶᇎ⧠
䘉а⛩ˈᡁԜ䇙㇇⌅䇑㇇kњᴰ᧕䘁ṧֻⲴᒣ൷٬ˈ㘼нᱟ䇑㇇ަѝⲴᴰᲞ䙽Ⲵ٬DŽᴤ㋮⺞
ൠ䇢ˈѪҶ䙬䘁ањᇎ٬ⴞḷ࠭ᮠf:ƒnoƒˈᡁԜਚ㾱ᢺ㇇⌅ѝⲴ‫ޜ‬ᔿᴯᦒѪ˖

¦
k
f ( xi )
fˆ ( x q ) m i 1
˄8.1˅
k

8.2.1 䐓⿱ࣖᵹᴶ䘇䛱㇍⌋

ሩk-䘁䛫㇇⌅Ⲵањᱮ㘼᱃㿱Ⲵ᭩䘋ᱟሩkњ䘁䛫Ⲵ䍑⥞࣐ᵳˈṩᦞᆳԜ⴨ሩḕ䈒⛩xqⲴ
䐍⿫ˈሶ䖳བྷⲴᵳ٬䍻㔉䖳䘁Ⲵ䘁䛫DŽֻྲˈ൘㺘 8-1 䙬䘁⿫ᮓⴞḷ࠭ᮠⲴ㇇⌅ѝˈᡁԜਟ
ԕṩᦞ⇿њ䘁䛫оxqⲴ䐍⿫ᒣᯩⲴ‫ق‬ᮠ࣐ᵳ䘉њ䘁䛫ⲴĀ䘹ѮᵳāDŽᯩ⌅ᱟ䙊䗷⭘лᔿਆԓ
㺘 8-1 ㇇⌅ѝⲴ‫ޜ‬ᔿᶕᇎ⧠˖

k
fˆ ( x q ) m arg max ¦ wi G (v, f ( xi )) ˄8.2˅
vV i 1

1
ަѝ˖ wi {
d ( xq , xi ) 2

˄8.3˅

ķ
䈁⌘˖৸〠ở἞ཊ䗩ᖒ˄Thiessen Polygons˅ˈਟԕ⨶䀓Ѫሩオ䰤Ⲵа⿽࠶ࢢᯩᔿˈањở἞ཊ䗩ᖒ޵Ⲵ
ԫа⛩ࡠᵜở἞ཊਈᖒѝᗳ⛩Ⲵ䐍⿫䜭ሿҾࡠަԆở἞ཊ䗩ᖒѝᗳ⛩Ⲵ䐍⿫DŽ
ѪҶ༴⨶ḕ䈒⛩xqᚠྭ३䝽Ḁњ䇝㓳ṧֻxiˈӾ㘼ሬ㠤࠶⇽Ѫ 0 ⲴᛵߥˈᡁԜԔ䘉⿽ᛵ

ߥлⲴ fˆ (xq)ㅹҾf(xi)DŽྲ᷌ᴹཊњ䘉ṧⲴ䇝㓳ṧֻˈᡁԜ֯⭘ᆳԜѝঐཊᮠⲴ࠶㊫DŽ

ᡁԜҏਟԕ⭘㊫լⲴᯩᔿሩᇎ٬ⴞḷ࠭ᮠ䘋㹼䐍⿫࣐ᵳˈਚ㾱⭘лᔿᴯᦒ㺘 8-1 ѝⲴ‫ޜ‬


ᔿ˖

¦
k
wi f ( xi )
fˆ ( x q ) m i 1
˄8.4˅
¦
k
i
w
1 i

ަѝwiⲴᇊѹо‫ޜ‬ᔿ˄8.3˅ѝ⴨਼DŽ⌘᜿‫ޜ‬ᔿ˄8.4˅ѝⲴ࠶⇽ᱟањᑨ䟿ˈᆳሶн਼

ᵳ٬Ⲵ䍑⥞ᖂаॆ˄ֻྲˈᆳ‫؍‬䇱ྲ᷌ሩᡰᴹⲴ䇝㓳ṧֻxiˈf(xi)=cˈ䛓Ѹ fˆ (xq)mc˅DŽ

⌘᜿ԕкk-䘁䛫㇇⌅Ⲵᡰᴹਈփ䜭ਚ㘳㲁kњ䘁䛫ԕ࠶㊫ḕ䈒⛩DŽྲ᷌֯⭘᤹䐍⿫࣐ᵳˈ

䛓Ѹ‫ݱ‬䇨ᡰᴹⲴ䇝㓳ṧֻᖡ૽xqⲴ࠶㊫һᇎк⋑ᴹൿ༴ˈഐѪ䶎ᑨ䘌Ⲵᇎֻሩ fˆ (xq)Ⲵᖡ૽

ᖸሿDŽ㘳㲁ᡰᴹṧֻⲴᜏан䏣ᱟՊ֯࠶㊫䘀㹼ᗇᴤធDŽྲ᷌࠶㊫ањᯠⲴḕ䈒ᇎֻᰦ㘳㲁
ᡰᴹⲴ䇝㓳ṧֻˈᡁԜ〠↔Ѫ‫ޘ‬ተ˄global˅⌅DŽྲ᷌ӵ㘳㲁ᴰ䶐䘁Ⲵ䇝㓳ṧֻˈᡁԜ〠↔
Ѫተ䜘˄local˅⌅DŽᖃ‫ޜ‬ᔿ˄8.4˅Ⲵ⌅ࡉ㻛ᓄ⭘Ѫ‫ޘ‬ተ⌅ᰦˈᆳ㻛〠ѪShepard⌅˄Shepard
1968˅DŽ

8.2.2 ሯ k-䘇䛱㇍⌋Ⲻ䈪᱄

᤹䐍⿫࣐ᵳⲴ k-䘁䛫㇇⌅ᱟа⿽䶎ᑨᴹ᭸Ⲵᖂ㓣᧘⨶ᯩ⌅DŽᆳሩ䇝㓳ᮠᦞѝⲴಚ༠ᴹᖸ
ྭⲴ励ἂᙗˈ㘼фᖃ㔉ᇊ䏣ཏབྷⲴ䇝㓳䳶ਸᰦᆳҏ䶎ᑨᴹ᭸DŽ⌘᜿䙊䗷ਆ k њ䘁䛫Ⲵ࣐ᵳᒣ
൷ˈਟԕ⎸䲔ᆔ・Ⲵಚ༠ṧֻⲴᖡ૽DŽ

k-䘁䛫㇇⌅Ⲵᖂ㓣‫ٿ‬㖞(inductive bias)ᱟӰѸ઒˛䙊䗷࠶᷀മ 8-1 ѝⲴ⽪ֻˈਟԕᖸᇩ᱃


ൠ⨶䀓䘉⿽㇇⌅࠶㊫ᯠḕ䈒ᇎֻⲴṩᦞDŽᆳⲴᖂ㓣‫ٿ‬㖞ሩᓄҾ‫ٷ‬ᇊ˖ањᇎֻⲴ࠶㊫xqᴰ⴨
լҾ൘⅗∿オ䰤ѝᆳ䱴䘁ⲴᇎֻⲴ࠶㊫DŽ

ᓄ⭘ k-䘁䛫㇇⌅Ⲵањᇎ䐥䰞仈ᱟˈᇎֻ䰤Ⲵ䐍⿫ᱟṩᦞᇎֻⲴᡰᴹ኎ᙗ˄ҏቡᱟवਜ਼
ᇎֻⲴ⅗∿オ䰤Ⲵᡰᴹ඀ḷ䖤˅䇑㇇ⲴDŽ䘉о䛓Ӌਚ䘹ᤙ‫ޘ‬䜘ᇎֻ኎ᙗⲴањᆀ䳶Ⲵᯩ⌅н
਼ˈֻྲߣㆆṁᆖҐ㌫㔏DŽѪҶ⨶䀓䘉⿽ㆆ⮕Ⲵᖡ૽ˈ㘳㲁ᢺ k-䘁䛫㇇⌅ᓄ⭘ࡠ䘉ṧањ䰞
仈˖⇿њᇎֻ⭡ 20 њ኎ᙗ᧿䘠ˈն൘䘉Ӌ኎ᙗѝӵᴹ 2 њоᆳⲴ࠶㊫ᱟᴹ‫ޣ‬DŽ൘䘉⿽ᛵߥ
лˈ䘉єњ⴨‫ޣ‬኎ᙗⲴ٬а㠤Ⲵᇎֻਟ㜭൘䘉њ 20 㔤Ⲵᇎֻオ䰤ѝ⴨䐍ᖸ䘌DŽ㔃᷌ˈ‫׍‬䎆
䘉 20 њ኎ᙗⲴ⴨լᙗᓖ䟿Պ䈟ሬ k-䘁䛫㇇⌅Ⲵ࠶㊫DŽ䘁䛫䰤Ⲵ䐍⿫Պ㻛བྷ䟿Ⲵн⴨‫ޣ‬኎ᙗ
ᡰ᭟䝽DŽ䘉⿽⭡Ҿᆈ൘ᖸཊн⴨‫ޣ‬኎ᙗᡰሬ㠤Ⲵ䳮仈ˈᴹᰦ㻛〠Ѫ㔤ᓖ⚮䳮˄curse of
dimensionality˅DŽᴰ䘁䛫ᯩ⌅ሩ䘉њ䰞仈⢩࡛᭿ᝏDŽ

䀓ߣ䈕䰞仈Ⲵањᴹ䏓Ⲵᯩ⌅ᱟˈ ˄1˅ᖃ䇑㇇єњᇎֻ䰤Ⲵ䐍⿫ᰦሩ⇿њ኎ᙗ࣐ᵳDŽ䘉
⴨ᖃҾ᤹∄ֻ㕙᭮⅗∿オ䰤ѝⲴ඀ḷ䖤ˈ㕙⸝ሩᓄҾнཚ⴨‫ޣ‬኎ᙗⲴ඀ḷ䖤ˈ᣹䮯ሩᓄҾᴤ
⴨‫Ⲵޣ‬኎ᙗⲴ඀ḷ䖤DŽ⇿њ඀ḷ䖤ᓄըኅⲴᮠ䟿ਟԕ䙊䗷Ӕ৹傼䇱Ⲵᯩ⌅㠚ࣘߣᇊDŽާփ‫ڊ‬
⌅ྲлˈ俆‫ٷݸ‬ᇊ֯⭘ഐᆀzjըኅ˄҈˅ㅜjṩ඀ḷ䖤ˈ䘹ᤙzjⲴ਴њ٬z1}znԕ֯ᆖҐ㇇⌅Ⲵ
ⵏᇎ࠶㊫䭉䈟⦷ᴰሿॆDŽަ⅑ˈ䘉њⵏᇎ䭉䈟⦷ਟԕ֯⭘Ӕ৹傼䇱ᶕՠ䇑DŽᡰԕˈа⿽㇇⌅
ᱟ䲿ᵪ䘹ਆ⧠ᴹᮠᦞⲴањᆀ䳶֌Ѫ䇝㓳ṧֻˈ❦ਾߣᇊz1}znⲴ٬࢙֯։ṧֻⲴ࠶㊫䭉䈟
⦷ᴰሿॆDŽ䙊䗷ཊ⅑䟽༽䘉њ༴⨶䗷〻ˈਟԕ࣐֯ᵳഐᆀⲴՠ䇑ᴤ࣐߶⺞DŽ䘉⿽ըኅ඀ḷ䖤
ԕՈॆk-䘁䛫㇇⌅Ⲵ䗷〻ˈᨀ‫׋‬Ҷа⿽ᣁࡦᰐ‫ޣ‬኎ᙗᖡ૽ⲴᵪࡦDŽ

˄2˅ਖཆа⿽ᴤᕪᴹ࣋Ⲵᯩ⌅ᱟӾᇎֻオ䰤ѝᆼ‫⎸ޘ‬䲔ᴰн⴨‫Ⲵޣ‬኎ᙗDŽ䘉ㅹ᭸Ҿ䇮
㖞Ḁњ㕙᭮ഐᆀzjѪ 0DŽMoore & Lee˄1994˅䇘䇪Ҷᴹ᭸ⲴӔ৹傼䇱ᯩ⌅ˈѪk-䘁䛫㇇⌅䘹
ᤙ⴨‫Ⲵޣ‬኎ᙗᆀ䳶DŽ⺞࠷ൠ䇢ˈԆԜ᧒㍒ҶสҾĀ⮉а⌅ā˄leave-one-out˅ⲴӔ৹傼䇱ˈ൘
䘉⿽ᯩ⌅ѝˈmњ䇝㓳ᇎֻⲴ䳶ਸԕ਴⿽ਟ㜭ᯩᔿ㻛࠶ᡀm-1 њᇎֻⲴ䇝㓳䳶ਸ઼ 1 њᇎֻ
Ⲵ⍻䈅䳶ਸDŽ䘉⿽ᯩ⌅൘k-䘁䛫㇇⌅ѝᱟᇩ᱃ᇎ⧠ⲴˈഐѪ⇿а⅑䟽ᯠᇊѹ䇝㓳䳶ᰦн䴰㾱
仍ཆⲴ䇝㓳ᐕ֌DŽ⌘᜿к䶒Ⲵє⿽ᯩ⌅䜭ਟԕ㻛ⴻ֌ԕḀњᑨ䟿ഐᆀըኅ඀ḷ䖤DŽਖཆа⿽
ਟ䘹Ⲵ‫⌅ڊ‬ᱟ֯⭘ањ൘ᇎֻオ䰤кਈॆⲴ٬ըኅ඀ḷ䖤DŽ䘉ṧ໎࣐Ҷ㇇⌅䟽ᯠᇊѹ䐍⿫ᓖ
䟿Ⲵ㠚⭡ᓖˈ❦㘼ᆳҏ໎࣐Ҷ䗷ᓖᤏਸⲴ仾䲙DŽᡰԕˈተ䜘ըኅ඀ḷ䖤Ⲵᯩ⌅ᱟнཚᑨ㿱ⲴDŽ

ᓄ⭘k-䘁䛫㇇⌅Ⲵਖཆањᇎ䐥䰞仈ᱟྲօᔪ・儈᭸Ⲵ㍒ᕅDŽഐѪ䘉њ㇇⌅᧘䘏ᡰᴹⲴ
༴⨶ˈⴤࡠ᧕᭦ࡠањᯠⲴḕ䈒ˈᡰԕ༴⨶⇿њᯠḕ䈒ਟ㜭䴰㾱བྷ䟿Ⲵ䇑㇇DŽⴞࡽᐢ㓿ᔰਁ
Ҷᖸཊᯩ⌅⭘ᶕሩᆈۘⲴ䇝㓳ṧֻ䘋㹼㍒ᕅˈԕ‫ׯ‬൘໎࣐аᇊᆈۘᔰ䬰ᛵߥлᴤ儈᭸ൠ⺞ᇊ
ᴰ䘁䛫DŽа⿽㍒ᕅᯩ⌅ᱟkd-tree˄Bentley 1975˗Friedman et al. 1977˅ˈᆳᢺᇎֻᆈۘ൘ṁⲴ
ਦ㔃⛩޵ˈ䛫䘁Ⲵᇎֻᆈۘ൘਼ањᡆ䱴䘁Ⲵ㔃⛩޵DŽ䙊䗷⍻䈅ᯠḕ䈒xqⲴ䘹ᇊ኎ᙗˈṁⲴ
޵䜘㔃⛩ᢺḕ䈒xqᧂࡇࡠ⴨‫Ⲵޣ‬ਦ㔃⛩DŽ

8.2.3 ᵥ䈣⌞䀙

൘‫ޣ‬Ҿᴰ䘁䛫⌅઼ተ䜘࣐ᵳഎᖂ⌅Ⲵᖸཊ᮷⥞ѝˈ֯⭘ҶаӋᶕ㠚㔏䇑⁑ᔿ䇶࡛亶ฏⲴ
ᵟ䈝DŽ൘䰵䈫䘉Ӌ᮷⥞ᰦˈ⸕䚃лࡇᵟ䈝ᱟᴹᑞࣙⲴ˖

z എᖂ˄Regression˅Ⲵਜ਼ѹᱟ䙬䘁ањᇎ٬ⴞḷ࠭ᮠDŽ

z ↻ᐞ˄Residual˅ᱟ䙬䘁ⴞḷ࠭ᮠᰦⲴ䈟ᐞ fˆ (x)- f(x)DŽ

z Ṩ࠭ᮠ˄Kernel function˅ᱟањ䐍⿫࠭ᮠˈᆳ⭘ᶕߣᇊ⇿њ䇝㓳ṧֻⲴ
ᵳ٬DŽᦒਕ䈍䈤ˈṨ࠭ᮠቡᱟ֯wi=K(d(xi, xq))Ⲵ࠭ᮠKDŽ

8.3 ቶ䜞ࣖᵹഔᖈ

ࡽа㢲᧿䘠Ⲵᴰ䘁䛫ᯩ⌅ਟԕ㻛ⴻ֌൘অаⲴḕ䈒⛩x=xqк䙬䘁ⴞḷ࠭ᮠf(x)DŽተ䜘࣐
ᵳഎᖂᱟ䘉⿽ᯩ⌅Ⲵ᧘ᒯDŽᆳ൘⧟㔅xqⲴተ䜘४ฏ޵Ѫⴞḷ࠭ᮠfᔪ・᰾⺞Ⲵ䙬䘁DŽተ䜘࣐
ᵳഎᖂ֯⭘䱴䘁Ⲵᡆ䐍⿫࣐ᵳⲴ䇝㓳ṧֻᶕᖒᡀ䘉⿽ሩfⲴተ䜘䙬䘁DŽֻྲˈᡁԜਟԕ֯⭘
㓯ᙗ࠭ᮠǃҼ⅑࠭ᮠǃཊቲ⾎㓿㖁㔌ᡆ㘵ަԆ࠭ᮠᖒᔿ൘⧟㔅xqⲴ䛫ฏ޵䙬䘁ⴞḷ࠭ᮠDŽ Āተ
䜘࣐ᵳഎᖂā਽〠ѝˈѻᡰԕਛĀተ䜘āᱟഐѪⴞḷ࠭ᮠⲴ䙬䘁ӵӵṩᦞḕ䈒⛩䱴䘁Ⲵᮠᦞˈ
ѻᡰԕਛĀ࣐ᵳāᱟഐѪ⇿ањ䇝㓳ṧֻⲴ䍑⥞ᱟ⭡ᆳоḕ䈒⛩䰤Ⲵ䐍⿫࣐ᵳⲴˈѻᡰԕਛ
ĀഎᖂāᱟഐѪ㔏䇑ᆖҐ⭼ᒯ⌋֯⭘䘉њᵟ䈝ᶕ㺘⽪䙬䘁ᇎᮠ٬࠭ᮠⲴ䰞仈DŽ
㔉ᇊањᯠⲴḕ䈒ᇎֻxqˈተ䜘࣐ᵳഎᖂⲴа㡜ᯩ⌅ᱟᔪ・ањ䙬䘁 fˆ ˈ֯ fˆ ᤏਸ⧟㔅

xqⲴ䛫ฏ޵Ⲵ䇝㓳ṧֻDŽ❦ਾ⭘䘉њ䙬䘁ᶕ䇑㇇ fˆ (xq)Ⲵ٬ˈҏቡᱟѪḕ䈒ᇎֻՠ䇑Ⲵⴞḷ

٬䗃ࠪDŽ❦ਾ fˆ Ⲵ᧿䘠㻛ࡐ䲔ˈഐѪሩҾ⇿ањ⤜・Ⲵḕ䈒ᇎֻ䜭Պ䇑㇇н਼Ⲵተ䜘䙬䘁DŽ

8.3.1 ቶ䜞ࣖᵹ㓵ᙝഔᖈ

л䶒ˈᡁԜ‫ݸ‬㘳㲁ተ䜘࣐ᵳഎᖂⲴа⿽ᛵߥˈণ֯⭘ྲлᖒᔿⲴ㓯ᙗ࠭ᮠᶕ䙬䘁xq䛫ฏ
Ⲵⴞḷ࠭ᮠf˖

fˆ (x)=w0+w1a1(x)+}+wnan(x)

઼ࡽ䶒аṧˈai(x)㺘⽪ᇎֻxⲴㅜiњ኎ᙗ٬DŽ

എᗶㅜ 4 ㄐѝᡁԜ䇘䇪Ⲵởᓖл䱽ᯩ⌅ˈ൘ᤏਸԕкᖒᔿⲴ㓯ᙗ࠭ᮠࡠ㔉ᇊⲴ䇝㓳䳶ਸ
ᰦˈᆳ㻛⭘ᶕ᢮ࡠ֯䈟ᐞᴰሿॆⲴ㌫ᮠw0}wnDŽ൘䛓аㄐѝᡁԜᝏ‫ޤ‬䏓Ⲵᱟⴞḷ࠭ᮠⲴ‫ޘ‬ተ
䙬䘁DŽᡰԕᖃᰦᡁԜ᧘ሬࠪⲴᵳ٬䘹ᤙᯩ⌅ᱟ֯䇝㓳䳶ਸDкⲴ䈟ᐞᒣᯩ઼ᴰሿॆˈণ˖

1
E{ ¦ ( f ( x)  fˆ ( x)) 2
2 xD
˄8.5˅

ṩᦞ䘉њ䈟ᐞᇊѹˈᡁԜᗇࠪҶԕлởᓖл䱽䇝㓳⌅ࡉ˖

'wj=K ¦
xD
(f(x)- fˆ (x))aj(x) ˄8.6˅

ަѝKᱟањᑨᮠˈ〠ѪᆖҐ䙏⦷DŽ㘼ф䘉њ⌅ࡉᐢ㓿㻛䟽ᯠ㺘⽪ˈ‫؞‬᭩Ҷަѝㅜ 4 ㄐ

ѝⲴ䇠ਧԕ३䝽ᖃࡽⲴ䇠ਧ˄ҏቡᱟˈto f(x)ˈoo fˆ (x)ˈxjo aj(x)˅DŽ

ᡁԜᓄ䈕ྲօ‫؞‬᭩䘉њ䗷〻ᶕ᧘ሬࠪተ䜘䙬䘁઒˛ㆰঅⲴᯩ⌅ᱟ䟽ᯠᇊѹ䈟ᐞ߶ࡉE
ԕ⵰䟽Ҿᤏਸተ䜘䇝㓳ṧֻDŽл䶒㔉ࠪҶй⿽ਟ㜭Ⲵ䈟ᐞ߶ࡉDŽ⌘᜿ᡁԜᢺ䈟ᐞ߉ѪE(xq)ˈ
ⴞⲴᱟѪҶᕪ䈳ⴞࡽⲴ䈟ᐞ㻛ᇊѹѪḕ䈒⛩xqⲴ࠭ᮠDŽ

1. ਚ൘ k њ䘁䛫кⲴ䈟ᐞᒣᯩ઼ᴰሿॆ˖

1
E1 ( xq ) { ¦ ( f ( x)  fˆ ( x)) 2
2 xxqⲴkњ䘁䛫

2. ֯ᮤњ䇝㓳ṧֻ䳶ਸDкⲴ䈟ᐞᒣᯩ઼ᴰሿॆˈնሩ⇿њ䇝㓳ṧֻ࣐ᵳˈ
ᵳ٬Ѫ‫ޣ‬Ҿ⴨䐍xq䐍⿫ⲴḀњ䙂߿࠭ᮠK˖
1
E2 ( xq ) { ¦
2 xD
( f ( x)  fˆ ( x)) 2 K (d ( x q , x))

3. 㔬ਸ 1 ઼ 2˖

1
E3 ( xq ) { ¦ ( f ( x)  fˆ ( x)) 2 K (d ( xq , x))
2 xxqⲴkњ䘁䛫

߶ࡉ 2 ᡆ䇨ᱟᴰԔӪ┑᜿ⲴˈഐѪᆳ‫ݱ‬䇨⇿њ䇝㓳ṧֻ䜭ሩxqⲴ࠶㊫ӗ⭏ᖡ૽DŽ❦㘼䘉
⿽ᯩ⌅ᡰ䴰Ⲵ䇑㇇䟿䲿⵰䇝㓳ṧֻᮠ䟿㓯ᙗ໎䮯DŽ߶ࡉ 3 ᖸྭൠ䘁լҶ߶ࡉ 2 ᒦфާᴹྲл
Ո⛩˖䇑㇇ᔰ䬰⤜・Ҿ䇝㓳ṧֻᙫᮠˈ㘼ӵ‫׍‬䎆Ҿᡰ㘳㲁Ⲵᴰ䘁䛫ᮠkDŽ

ྲ᷌֯⭘к䶒Ⲵ߶ࡉ 3ˈᒦ֯⭘оㅜ 4 ㄐ⴨਼Ⲵ᧘⨶ᯩᔿ䟽ᯠ᧘ሬởᓖл䱽⌅ࡉˈਟԕ


ᗇࡠԕл䇝㓳⌅ࡉ˖

'wi K ¦ K (d ( x , x))( f ( x)  fˆ ( x))a ( x)


xxqⲴkњ䘁䛫
q j ˄8.7˅

////////// wi wi  'wi //////////

⌘᜿䘉њᯠⲴ⌅ࡉ઼‫ޜ‬ᔿ˄8.6˅㔉ࠪⲴ⌅ࡉⲴᐞᔲᱟˈᇎֻxሩᵳ٬ᴤᯠⲴ䍑⥞⧠൘҈
кҶањ䐍⿫᜙㖊亩K(d(xq, x))ˈᒦфӵሩkњᴰ䛫䘁Ⲵ䇝㓳ᇎֻⲴ䈟ᐞ≲઼DŽһᇎкˈྲ᷌
㾱֯ањ㓯ᙗ࠭ᮠᤏਸപᇊⲴ䇝㓳ṧֻ䳶ਸˈ䛓ѸᴹаӋ∄ởᓖл䱽ᴤ儈᭸Ⲵᯩ⌅ˈᆳԜⴤ
᧕≲䀓ᡰ䴰㾱Ⲵ㌫ᮠw0}wnDŽAtkeson et al.˄1997a˅઼Bishop˄1995˅䈳ḕҶࠐњ䘉ṧⲴᯩ
⌅DŽ

8.3.2 ቶ䜞ࣖᵹഔᖈⲺ䈪᱄

к䶒ᡁԜ㘳㲁Ҷ֯⭘ањ㓯ᙗ࠭ᮠ൘ḕ䈒ᇎֻxq䛫ฏ޵䙬䘁fDŽ‫ޣ‬Ҿተ䜘࣐ᵳഎᖂⲴ᮷
⥞ѝˈ൘ሩ䇝㓳ṧֻ䐍⿫࣐ᵳᯩ䶒वਜ਼བྷ䟿Ⲵਟ䘹ᯩ⌅ˈ䘈वਜ਼བྷ䟿Ⲵⴞḷ࠭ᮠተ䜘䙬䘁ᯩ
⌅DŽ൘བྷཊᮠᛵߥлᱟ䙊䗷ањᑨ䟿ǃ㓯ᙗ࠭ᮠᡆҼ⅑࠭ᮠᶕተ䜘䙬䘁ⴞḷ࠭ᮠDŽᴤ༽ᵲⲴ
࠭ᮠᖒᔿнཚᑨ㿱ˈ৏ഐᱟ˄1˅ሩ⇿њḕ䈒ᇎֻ⭘ᴤ༽ᵲⲴ࠭ᮠᶕᤏਸˈަԓԧॱ࠶儈ᰲ˗
˄2˅൘䏣ཏሿⲴᇎֻオ䰤ᆀฏкˈ֯⭘䘉ӋㆰঅⲴ䘁լᐢ㜭⴨ᖃྭൠ⁑ᤏⴞḷ࠭ᮠDŽ

8.4 ᖺੇะ࠳ᮦ

ਖа⿽࠭ᮠ䙬䘁Ⲵᯩ⌅ᱟ֯⭘ᖴੁส࠭ᮠ˄radial basis function˅ˈ䘉⿽ᯩ⌅о䐍⿫࣐ᵳ


എᖂ઼Ӫᐕ⾎㓿㖁㔌䜭ᴹ⵰㍗ᇶ㚄㌫˄Powell 1987˗Broomhead & Lowe 1988˗Moody &
DŽ൘䘉⿽ᯩ⌅ѝˈᖵᆖҐⲴ‫ٷ‬䇮ᱟањԕлᖒᔿⲴ࠭ᮠˈ
Darken 1989˅
k
fˆ ( x) w0  ¦ wu K u (d ( xu , x)) ˄8.8˅
u 1

ަѝ⇿њxuᱟXѝањᇎֻˈṨ࠭ᮠKu(d(xu, x))㻛ᇊѹѪ䲿䐍⿫d(xu, x)Ⲵ໎བྷ㘼߿ሿDŽ䘉

䟼Ⲵkᱟ⭘ᡧᨀ‫Ⲵ׋‬ᑨ䟿ˈ⭘ᶕᤷᇊ㾱वਜ਼ⲴṨ࠭ᮠⲴᮠ䟿DŽቭ㇑ fˆ (x)ᱟሩf(x)Ⲵ‫ޘ‬ተ䙬䘁ˈ

նᶕ㠚⇿њKu(d(xu, x)) 亩Ⲵ䍑⥞㻛ተ䜘ॆࡠ⛩xu䱴䘁Ⲵ४ฏDŽа⿽ᖸᑨ㿱Ⲵ‫⌅ڊ‬ᱟ䘹ᤙ儈ᯟ


࠭ᮠ˄Gaussian function˅
˄㿱㺘 5-4˅֌Ѫ⇿њṨ࠭ᮠKu(d(xu, x))ˈ儈ᯟ࠭ᮠⲴѝᗳ⛩Ѫxuˈ

ᯩᐞᱟ V u DŽ
2

1 2
 d ( xu , x )
2V u2
Ku(d(xu, x)) = e

л䶒ᡁԜᶕ䳶ѝ䇘䇪䘉њᑨ㿱Ⲵ儈ᯟṨ࠭ᮠDŽṩᦞHartman et al.˄1990˅ᡰᤷࠪⲴˈ‫ޜ‬
ᔿ˄8.8˅䘉ṧⲴ࠭ᮠᖒᔿ㜭ཏԕԫ᜿ሿⲴ䈟ᐞ䙬䘁ԫօ࠭ᮠˈਚ㾱ԕк儈ᯟṨⲴᮠ䟿k䏣ཏ
བྷˈᒦфਟԕ࠶࡛ᤷᇊ⇿њṨⲴᇭᓖV2DŽ

‫ޜ‬ᔿ˄8.8˅㔉ࠪⲴ࠭ᮠਟԕ㻛ⴻ֌ᱟ᧿䘠ҶањєቲⲴ㖁㔌ˈㅜаቲ䇑㇇н਼ⲴKu(d(xu,
x))ˈㅜҼቲ䇑㇇ㅜаቲঅ‫ݳ‬٬Ⲵ㓯ᙗ㓴ਸDŽമ 8-2 ⭫ࠪҶањᖴੁส࠭ᮠ㖁㔌ⲴֻᆀDŽ

插图——原书页码:239

മ 8-2 ањᖴੁส࠭ᮠ㖁㔌

⇿њ䳀㯿অ‫ݳ‬ӗ⭏ањ◰ਁ˄activation˅ˈᆳ⭡ԕḀњᇎֻxuѪѝᗳⲴ儈ᯟ࠭ᮠߣᇊDŽᡰԕˈ䲔䶎
x䶐䘁xuˈ੖ࡉᆳⲴ◰ਁ᧕䘁Ҿ 0DŽ䗃ࠪঅ‫ݳ‬ӗ⭏Ⲵ䗃ࠪᱟ䳀㯿অ‫Ⲵਁ◰ݳ‬㓯ᙗ㓴ਸDŽቭ㇑䘉䟼⭫ࠪ
Ⲵ㖁㔌ӵᴹањ䗃ࠪˈնᱟҏਟԕवਜ਼ཊњ䗃ࠪDŽ

㔉ᇊҶⴞḷ࠭ᮠⲴ䇝㓳ṧֻ䳶ਸˈа㡜࠶єњ䱦⇥ᶕ䇝㓳RBF(radial basis function)㖁

㔌DŽ俆‫ߣˈݸ‬ᇊ䳀㯿অ‫Ⲵݳ‬ᮠ䟿kˈᒦ䙊䗷䘹ਆ⭘ᶕᇊѹṨ࠭ᮠKu(d(xu, x))Ⲵxuǃ V u ٬ᇊѹ


2

⇿њ䳀㯿অ‫ݳ‬DŽㅜҼˈ֯⭘ᔿ˄8.5˅㔉ࠪⲴ‫ޘ‬ተ䈟ᐞ߶ࡉᶕ䇝㓳ᵳ٬wuˈ֯㖁㔌ᤏਸ䇝㓳
ᮠᦞ〻ᓖᴰབྷॆDŽഐѪṨ࠭ᮠ൘ㅜҼ䱦⇥ᱟ‫؍‬ᤱнਈⲴˈᡰԕ㓯ᙗᵳ٬wuਟԕ㻛䶎ᑨ儈᭸ൠ
䇝㓳ᗇࡠDŽ

ӪԜᐢ㓿ᨀࠪҶࠐ⿽ᯩ⌅ᶕ䘹ਆ䘲ᖃⲴ䳀㯿অ‫ݳ‬ᡆ㘵䈤Ṩ࠭ᮠⲴᮠ䟿DŽа⿽ᯩ⌅ᱟѪ⇿
ањ䇝㓳ṧֻ<xi, f(xi)>࠶䝽ањ儈ᯟṨ࠭ᮠˈ↔儈ᯟ࠭ᮠⲴѝᗳ⛩㻛䇮ѪxiDŽᡰᴹ儈ᯟ࠭ᮠ
ⲴᇭᓖV2ਟ㻛䍻Ѫ਼ṧⲴ٬DŽ䙊䗷䘉⿽ᯩ⌅ˈRBF㖁㔌ᆖҐⴞḷ࠭ᮠⲴ‫ޘ‬ተ䙬䘁ˈަѝ⇿њ

䇝㓳ṧֻ<xi, f(xi)>䜭ਚ൘xiⲴ䛫ฏ޵ᖡ૽ fˆ Ⲵ٬DŽ䘉ṧ䘹ᤙṨ࠭ᮠⲴањՈ⛩ᱟᆳ‫ݱ‬䇨RBF

㖁㔌㋮⺞ൠᤏਸ䇝㓳ᮠᦞDŽҏቡᱟ䈤ˈሩҾԫ᜿mњ䇝㓳ṧֻ䳶ਸˈѪҶਸᒦmњ儈ᯟṨ࠭

ᮠⲴᵳ٬w0}wmਟԕ㻛䇮㖞Ѫ֯ᗇሩҾ⇿ањ䇝㓳ṧֻ<xi, f(xi)>䜭┑䏣 fˆ (xi)=f(xi)DŽ


ㅜҼ⿽ᯩ⌅ᱟ䘹ਆа㓴ᮠ䟿ቁҾ䇝㓳ṧֻᮠ䟿ⲴṨ࠭ᮠDŽ䘉⿽ᯩ⌅ਟԕ∄ㅜа⿽ᯩ⌅ᴤ
ᴹ᭸ˈ⢩࡛ᱟ൘䇝㓳ṧֻⲴᮠ䟿ᐘབྷⲴᰦ‫ى‬DŽṨ࠭ᮠ㻛࠶ᐳ൘ᮤњᇎֻオ䰤XкˈᆳԜⲴѝ
ᗳѻ䰤ᴹ൷रⲴ䰤䳄DŽᡆ㘵ҏਟԕ䶎൷रൠ࠶ᐳṨ࠭ᮠѝᗳˈ⢩࡛ᱟ൘ᇎֻᵜ䓛൘Xк䶎൷
र࠶ᐳⲴᰦ‫ى‬DŽ൘ਾа⿽ᛵߥлˈਟԕ䲿ᵪ䘹ਆ䇝㓳ṧֻⲴањᆀ䳶֌ѪṨ࠭ᮠⲴѝᗳˈӾ
㘼ሩᇎֻⲴส߶࠶ᐳ䘋㹼䟷ṧDŽᡆ㘵ˈᡁԜਟԕḷ䇶ࠪᇎֻⲴ৏࿻㚊㊫˄prototypical cluster˅ˈ
❦ਾԕ⇿њ㚊㊫Ѫѝᗳ࣐‫ޕ‬ањṨ࠭ᮠDŽ䘉⿽ᯩᔿⲴṨ࠭ᮠᐳ㖞ਟԕ䙊䗷䶎ⴁⶓⲴ㚊㊫㇇⌅
ᶕᇎ⧠ˈަѝᢺ䇝㓳ᇎֻ˄нवਜ਼ⴞḷ٬˅ᤏਸࡠ␧ਸ儈ᯟDŽ6.12.1 㢲䇘䇪ⲴEM㇇⌅ᨀ‫׋‬
Ҷа⿽Ӿkњ儈ᯟ࠭ᮠⲴ␧ਸѝ䘹ᤙ൷٬ˈԕᴰ֣ᤏਸ㿲⍻ࡠᇎֻⲴᯩ⌅DŽ൘EM㇇⌅ѝˈ൷
٬Ⲵ䘹ਆᯩ⌅ᱟ˖ሩ㔉ᇊⲴkњՠ䇑Ⲵ൷٬ˈ֯㿲⍻ࡠᇎֻxiⲴᾲ⦷ᴰབྷॆDŽ⌘᜿൘ᰐⴁⶓ
Ⲵ㚊㊫ᯩ⌅ѝˈᇎֻⲴⴞḷ࠭ᮠ٬f(xi)н৲оṨ࠭ᮠѝᗳⲴ䇑㇇DŽⴞḷ٬Ⲵᜏа֌⭘ᱟߣᇊ
䗃ࠪቲⲴᵳ٬wuDŽ

ᾲ㘼䀰ѻˈ⭘ཊњተ䜘Ṩ࠭ᮠⲴ㓯ᙗ㓴ਸ㺘⽪Ⲵᖴੁส࠭ᮠ㖁㔌ᨀ‫׋‬Ҷа⿽ⴞḷ࠭ᮠⲴ
‫ޘ‬ተ䙬䘁DŽӵᖃ䗃‫ ޕ‬x 㩭‫ޕ‬ḀњṨ࠭ᮠⲴѝᗳ઼ᇭᓖᡰᇊѹⲴ४ฏ޵ᰦˈ䘉њṨ࠭ᮠⲴ٬᡽
ᱟнਟᘭ⮕ⲴDŽഐ↔ˈRBF 㖁㔌ਟԕ㻛ⴻ֌ⴞḷ࠭ᮠⲴཊњተ䜘䙬䘁Ⲵᒣ━㓯ᙗ㓴ਸDŽRBF
㖁㔌Ⲵањ‫ޣ‬䭞Ո⛩ᱟˈо৽ੁՐ᫝㇇⌅䇝㓳Ⲵࡽ侸㖁㔌⴨∄ˈᆳⲴ䇝㓳ᴤ࣐儈᭸DŽ䘉ᱟഐ
Ѫ RBF 㖁㔌Ⲵ䗃‫ޕ‬ቲ઼䗃ࠪቲਟԕ㻛࠶࡛䇝㓳DŽ

8.5 ะӄṾׁⲺ᧞⨼

k-䘁䛫㇇⌅઼ተ䜘࣐ᵳഎᖂ䜭ᱟสҾᇎֻⲴᯩ⌅ˈᆳԜާᴹйњ‫ޣⲴ਼ޡ‬䭞⢩ᙗDŽㅜ 1ˈ
ᆳԜᱟ⎸ᶱᆖҐᯩ⌅ˈ䜭ᢺ൘䇝㓳ᮠᦞкⲴ⌋ॆ᧘䘏㠣䙷ࡠањᯠⲴḕ䈒ᇎֻᰦDŽㅜ 2ˈᆳ
Ԝ䙊䗷࠶᷀⴨լⲴᇎֻᶕ࠶㊫ᯠⲴḕ䈒ᇎֻˈ㘼ᘭ⮕оḕ䈒ᶱަн਼ⲴᇎֻDŽㅜ 3ˈᆳԜᢺ
ᇎֻ㺘⽪Ѫ n 㔤⅗∿オ䰤ѝⲴᇎᮠ⛩DŽสҾṸֻⲴ᧘⨶˄Case-based reasoningˈCBR˅䘉⿽
ᆖҐ㤳රสҾࡽєњ৏ࡉˈնнवᤜㅜ 3 њDŽ൘ CBR ѝˈа㡜֯⭘ᴤѠᇼⲴㅖਧ᧿䘠ᶕ㺘
⽪ᇎֻ˗⴨ᓄൠˈ⭘ᶕỰ㍒ᇎֻⲴᯩ⌅ҏᴤ࣐༽ᵲDŽCBR ᐢ㻛ᓄ⭘Ҿ䀓ߣᖸཊ䰞仈ˈ∄ྲˈ
ṩᦞᮠᦞᓃѝᆈۘⲴԕࡽⲴ䇮䇑മ㓨ˈᶕ䘋㹼ᵪỠ䇮༷Ⲵᙫփ䇮䇑˄Sycara et al. 1992˅
(solidworks, proe ㅹй㔤䖟ԦⲴ䇮䇑৏⨶ԕ৺ᓄ⭘ੇ˛˛˛)˗ṩᦞԕࡽⲴ㻱ߣᶕሩᯠⲴ⌅ᖻ
ṸԦ䘋㹼᧘⨶˄Ashley 1990˅˗䙊䗷ሩԕࡽⲴ⴨լ䰞仈Ⲵ䀓ߣᯩṸⲴ༽⭘ᡆਸᒦˈᶕ䀓ߣ㿴
ࡂ઼䈳ᓖ䰞仈˄Veloso 1992˅DŽ

֌Ѫԕਾ䇘䇪Ⲵส⹰ˈ䇙ᡁԜ㘳㲁สҾṸֻⲴ᧘⨶㌫㔏ⲴањֻᆀDŽCADET㌫㔏
˄Sycara et al. 1992˅䟷⭘สҾṸֻⲴ᧘⨶ᶕ䖵ࣙㆰঅᵪỠ䇮༷˄ֻྲ≤嗉ཤ˅Ⲵᙫփ䇮䇑DŽ
ᆳ֯⭘ањᮠᦞᓃˈަѝवਜ਼བྷ㓖 75 њԕࡽⲴ䇮䇑ᡆ䇮䇑⡷ᯝˈᶕ᧘㦀ㅖਸᯠⲴ䇮䇑㿴Ṭ
Ⲵᙫփ䇮䇑DŽ޵ᆈѝ⇿ањᇎֻᱟ䙊䗷ᆳⲴ㔃ᶴ઼ᇊᙗⲴ࣏㜭ᶕ㺘⽪ⲴDŽ⴨ᓄⲴˈᯠⲴ䇮䇑
䰞仈ᱟ䙊䗷ᡰ㾱≲Ⲵ࣏㜭઼㔃ᶴᶕ㺘⽪ⲴDŽമ 8-3 ⭫ࠪҶ䘉њ䰞仈DŽമⲴкॺ䜘࠶ᱮ⽪Ҷа
њިරⲴᆈۘṸֻˈ㻛〠ѪTර᧕ཤ㇑DŽᆳⲴ࣏㜭㻛㺘⽪Ѫ䗃‫઼ޕ‬䗃ࠪ⛩Ⲵ⍱䟿઼⑙ᓖ䰤Ⲵ
ᇊᙗ‫ޣ‬㌫DŽ൘ਣ‫࣏Ⲵח‬㜭᧿䘠ѝˈḷᴹĀ+āⲴ㇝ཤ㺘᰾㇝ཤཤ䜘Ⲵਈ䟿䲿⵰㇝ཤቮ䜘Ⲵਈ
䟿кॷDŽֻྲˈ䗃ࠪ⍱䟿Q3䲿⵰䗃‫ޕ‬⍱䟿Q1໎䮯DŽ㊫լൠˈ Ā-āḷ䇠㺘᰾㇝ཤཤ䜘Ⲵਈ䟿䲿
⵰㇝ཤቮ䜘Ⲵਈ䟿л䱽DŽ䘉ᑵമⲴлॺ䜘࠶⭫ࠪҶањᯠⲴ䇮䇑䰞仈ˈᆳ䙊䗷ᯠ䇮䇑ѝᡰ㾱
≲Ⲵ࣏㜭ᶕ᧿䘠DŽ䘉њ࣏㜭᧿㔈Ҷа⿽≤嗉ཤⲴ㹼Ѫ⢩ᖱDŽ䘉䟼Qcᤷ䘋‫ޕ‬嗉ཤⲴߧ≤⍱䟿ˈ
Qhᤷ✝≤Ⲵ䗃‫ޕ‬⍱䟿ˈQmᤷ⍱ࠪ嗉ཤⲴঅа␧ਸ⍱䟿DŽ㊫լൠˈTcǃTh઼Tm࠶࡛ᤷ✝≤ǃߧ
≤઼␧ਸ≤⍱Ⲵ⑙ᓖDŽਈ䟿Ct㺘⽪䗃‫ࡠޕ‬嗉ཤⲴ⑙ᓖ᧗ࡦؑਧˈCf㺘⽪ሩ≤⍱Ⲵ᧗ࡦؑਧDŽ
⌘᜿ˈᡰ㾱≲Ⲵ࣏㜭᧿䘠ѝᤷࠪˈ䘉Ӌ᧗ࡦؑਧCt઼Cf⭘ᶕᖡ૽≤⍱Qc઼QhˈӾ㘼䰤᧕ᖡ૽
嗉ཤⲴ䗃ࠪ⍱䟿Qm઼⑙ᓖTmDŽ

插图——原书页码:241

A stored case: T-junction tube- ањᆈۘⲴṸֻ˖T ර᧕ཤ㇑

Structure-㔃ᶴ

Function-࣏㜭

A problem specification: Water faucet- ањ䰞仈Ⲵ㿴Ṭ䈤᰾˖≤嗉ཤ

Structure-㔃ᶴ

Function-࣏㜭

മ 8-3 ањᆈۘⲴṸ઼ֻањᯠ䰞仈

кॺ䜘࠶᧿㔈Ҷ CADET ṸֻᓃѝањިරⲴ䇮䇑⡷ᯝDŽᆳⲴ࣏㜭ᱟ䙊䗷 T ර᧕ཤਈ䟿䰤Ⲵᇊᙗ‫׍‬


䎆‫ޣ‬㌫മ㺘⽪Ⲵ˄൘↓᮷ѝާփ᧿䘠˅DŽлॺ䜘࠶ᱮ⽪ҶањިරⲴ䇮䇑䰞仈DŽ

㔉ᇊᯠ䇮䇑䰞仈Ⲵ࣏㜭䈤᰾ˈCADET ӾᆳⲴṸֻᓃѝᩌ㍒ᆈۘⲴֻˈ֯ᆳⲴ࣏㜭᧿䘠
઼ᯠ䇮䇑䰞仈⴨३䝽DŽྲ᷌ਁ⧠Ҷањ㋮⺞Ⲵ३䝽ˈ㺘᰾ḀњᆈۘṸֻ㋮⺞ᇎ⧠Ҷᡰ㾱≲Ⲵ
࣏㜭ˈ䛓Ѹਟԕ䘄എ䘉њṸֻ֌Ѫᯠ䇮䇑䰞仈Ⲵᔪ䇞ᯩṸDŽྲ᷌⋑ᴹਁ⧠㋮⺞Ⲵ३䝽ˈ
CADET ਟ㜭᢮ࡠ३䝽ᡰ䴰࣏㜭Ⲵн਼ᆀമⲴṸֻDŽֻྲˈ൘മ 8-3 ѝ T ර᧕ཤⲴ࣏㜭३䝽
Ҷ ≤ 嗉 ཤ ࣏ 㜭 മ Ⲵ а њ ᆀ മ DŽ ᴤ а 㡜 ൠ 䇢 ˈ CADET ൘ є њ ࣏ 㜭 മ 䰤 ᩌ ㍒ ਼ ᶴ ᆀ മ
˄isomorphisms subgraph˅
ˈԕਁ⧠ањṸֻⲴḀ䜘࠶ˈ֯ᆳ३䝽䇮䇑㿴Ṭ䈤᰾Ⲵ⴨ᓄ䜘࠶DŽ
↔ཆˈ㌫㔏ਟԕ࣐ᐕ৏࿻Ⲵ࣏㜭䈤᰾മˈӗ⭏ㅹԧⲴᆀമԕ३䝽ᴤཊⲴṸֻDŽᆳ֯⭘‫ޣ‬Ҿ⢙
⨶ᝏᓄⲴа㡜⸕䇶ᶕࡋᔪ䘉ṧⲴ࣐ᐕ䗷Ⲵ࣏㜭മDŽֻྲˈ࡙⭘а⿽䟽߉㿴ࡉਟԕᢺ䘉њᝏᓄ˖


A
o B

䟽߉Ѫ

 
A
o x 
o B

䘉њ䟽߉㿴ࡉਟԕ㻛䀓䟺Ѫ˖ྲ᷌ B 䲿 A кॷˈ䛓Ѹаᇊਟԕ᢮ࡠḀњ xˈ┑䏣 B 䲿 x


кॷ㘼ф x 䲿 A кॷDŽ䘉䟼 x ᱟањ‫〠ޘ‬䟿ॆⲴਈ䟿ˈᆳ൘࣏㜭മо䘉њṸֻᓃ३䝽ᰦ㓖ᶏ
ࡠ⺞ᇊ٬DŽһᇎкˈമ 8-3 ѝⲴ≤嗉ཤⲴ࣏㜭മቡᱟᓄ⭘䘉њ䟽߉㿴ࡉӾ৏ᶕⲴ࣏㜭䈤᰾ѝ
࣐ᐕᗇࡠⲴDŽ

䙊䗷Ự㍒३䝽н਼ᆀമⲴཊњṸֻˈᴹᰦਟԕ᤬᧕ᗇࡠᮤњ䇮䇑DŽа㡜ᶕ䈤ˈӾཊњỰ
㍒ࡠⲴṸֻӗ⭏ᴰ㓸ᯩṸⲴ䗷〻ਟԕᖸ༽ᵲDŽѪҶਸᒦᆈۘṸֻѝⲴỰ㍒ࡠⲴ䜘࠶ˈਟ㜭䴰
㾱Ӿཤ䇮䇑㌫㔏Ⲵ਴њ䜘࠶DŽҏਟ㜭䴰㾱എⓟԕࡽⲴ䇮䇑ᆀⴞḷˈӾ㘼ђᔳࡽ䶒Ự㍒ࡠⲴṸ
ֻDŽCADET ਸᒦ઼㠚䘲ᓄᐢỰ㍒ࡠṸֻᒦᖒᡀᴰ㓸䇮䇑Ⲵ㜭࣋ᖸᴹ䲀ˈᆳѫ㾱‫׍‬䎆⭘ᡧᶕ
‫ڊ‬㠚䘲ᓄ䱦⇥Ⲵ༴⨶DŽ↓ྲ Sycara et al.˄1992˅ᡰ᧿䘠ⲴˈCADET ᱟањ⹄ウ⭘Ⲵ৏ර㌫
㔏ˈ⭘ᶕ᧒㍒สҾṸֻⲴ᧘⨶൘ᙫփ䇮䇑ѝⲴ▌൘֌⭘DŽᆳнާ༷⭘ᶕᢺ䘉Ӌᣭ䊑Ⲵᙫփ䇮
䇑ᨀ⛬ᡀᴰ㓸䇮䇑Ⲵ࠶᷀㇇⌅DŽ

ሩҾCADETⲴ䰞仈Ṷ઼ᷦสҾᇎֻⲴᯩ⌅˄ֻྲk-䘁䛫㇇⌅˅Ⲵа㡜Ṷᷦˈ࠶᷀ᆳԜ
ѻ䰤Ⲵሩᓄѻ༴ᱟᴹ⳺ⲴDŽ൘CADETѝ⇿њᆈۘⲴ䇝㓳ṧֻ᧿㔈Ҷањ࣏㜭മԕ৺ᇎ⧠䈕
࣏㜭Ⲵ㔃ᶴDŽᯠⲴḕ䈒ሩᓄᯠⲴ࣏㜭മDŽഐ↔ˈᡁԜਟԕᢺCADETⲴ䰞仈᱐ሴࡠḷ߶Ⲵᆖ
Ґ䰞仈ᇊѹѝDŽަѝᇎֻオ䰤XᇊѹѪᡰᴹ࣏㜭മⲴオ䰤DŽⴞḷ࠭ᮠf᱐ሴࡠᇎ⧠䘉Ӌ࣏㜭Ⲵ
㔃ᶴDŽ⇿њᆈۘ䇝㓳ṧֻ<x, f(x)>ᱟањᒿ‫᧿ˈڦ‬䘠Ḁњ࣏㜭മx઼ᇎ⧠xⲴ㔃ᶴf(x)DŽ㌫㔏ᗵ
享ᆖҐ䇝㓳Ṹֻˈԕ䗃ࠪ┑䏣࣏㜭മḕ䈒䗃‫ޕ‬xqⲴ㔃ᶴf(xq)DŽ

к䶒‫ޣ‬Ҿ CADET ㌫㔏ㆰ㾱᧿䘠ˈ䈤᰾ҶสҾṸֻⲴ᧘⨶㌫㔏४࡛Ҿ k-䘁䛫䘉ṧⲴᯩ⌅


Ⲵ㤕ᒢа㡜⢩ᖱ˖
x ᇎֻᡆṸֻਟԕ⭘ѠᇼⲴㅖਧ᧿䘠㺘⽪ˈቡ‫ ۿ‬CADET ѝ֯⭘Ⲵ࣏㜭മDŽ䘉ਟ㜭
䴰㾱н਼Ҿ⅗∿䐍⿫Ⲵ⴨լᙗᓖ䟿ˈ∄ྲєњ࣏㜭മⲴᴰབྷਟ‫ޡ‬ӛᆀമⲴབྷሿDŽ
x Ự㍒ࡠⲴཊњṸֻਟԕਸᒦᖒᡀᯠ䰞仈Ⲵ䀓ߣᯩṸDŽ䘉о k-䘁䛫ᯩ⌅⴨լüü
ཊњ⴨լⲴṸֻ⭘ᶕᶴᡀሩᯠḕ䈒ⲴഎㆄDŽ❦㘼ˈਸᒦཊњỰ㍒ࡠⲴṸֻⲴ䗷
〻о k-䘁䛫ᴹᖸབྷн਼ˈᆳ‫׍‬䎆Ҿ⸕䇶᧘⨶㘼нᱟ㔏䇑ᯩ⌅DŽ
x ṸֻỰ㍒ǃสҾ⸕䇶Ⲵ᧘⨶઼䰞仈≲䀓䰤ᱟ㍗ᇶ㙖ਸ൘а䎧ⲴDŽֻྲ CADET
㌫㔏൘ቍ䈅᢮ࡠ३䝽ⲴṸֻ䗷〻ѝˈᆳ֯⭘ᴹ‫ޣ‬⢙⨶ᝏᓄⲴа㡜⸕䇶䟽߉Ҷ࣏
㜭മDŽӪԜᐢ㓿ᔰਁࠪᖸཊަԆⲴ㌫㔏ˈ䘉Ӌ㌫㔏ᴤ࣐ᆼᮤൠᢺสҾṸֻⲴ᧘
⨶䳶ᡀࡠสҾᩌ㍒Ⲵ䰞仈≲䀓㌫㔏ѝDŽANAPRON˄Golding & Rosenbloom 1991˅
઼ Prodigy/Analogy˄Veloso 1992˅ᱟєњֻᆀDŽ

ᾲᤜൠ䇢ˈสҾṸֻⲴ᧘⨶ᱟа⿽สҾᇎֻⲴᆖҐᯩ⌅ˈ൘䘉⿽ᯩ⌅ѝˈᇎֻ˄Ṹֻ˅
ਟԕᱟѠᇼⲴ‫ޣ‬㌫᧿䘠˗㘼ф൘䈕ᯩ⌅ѝˈѪҶ䀓ߣᖃࡽḕ䈒ˈṸֻỰ㍒઼ਸᒦ䗷〻ਟ㜭‫׍‬
䎆Ҿ⸕䇶᧘⨶઼ᩌ㍒ᇶ䳶Ⲵ䰞仈≲䀓ᯩ⌅DŽⴞࡽ‫ޣ‬ҾสҾṸֻⲴ᧘⨶⹄ウⲴањ䈮仈ᱟˈ᭩
䘋㍒ᕅṸֻⲴᯩ⌅DŽ䘉䟼Ⲵѝᗳ䰞仈ᱟਕ⌅⴨լᓖ䟿˄ֻྲˈ࣏㜭മѻ䰤Ⲵᆀമ਼ᶴ˅ӵ㜭
䘁լൠᤷࠪ⢩ᇊṸֻо⢩ᇊ䰞仈Ⲵ⴨‫ޣ‬ᓖDŽᖃ CBR ㌫㔏䈅മ༽⭘Ự㍒ࡠⲴṸֻᰦˈᆳਟ㜭
䙷ࡠਕ⌅⴨լᓖ䟿ѝ⋑ᴹᦅ᥹ࡠⲴ䳮⛩DŽֻྲˈ൘ CADET ѝˈỰ㍒ࡠⲴཊњ䇮䇑⡷ᯝਟ㜭
ᖬ↔нެᇩˈ֯ᗇᆳԜᰐ⌅㻛ਸᒦࡠањ㔏аⲴᴰ㓸䇮䇑ѝDŽа㡜ᖃ䘉⿽ᛵߥਁ⭏ᰦˈCBR
㌫㔏ਟഎⓟᩌ㍒ਖཆⲴṸֻԕ䘲ᓄ⧠ᴹⲴṸֻˈᡆ㘵≲ࣙҾަԆⲴ䰞仈≲䀓ᯩ⌅DŽ䟽㾱Ⲵᱟˈ
ᖃỰ⍻ࡠ䘉ṧⲴ䳮⛩ᰦˈᆳԜҏᨀ‫׋‬Ҷ⭘ᶕ᭩䘋⴨լᙗᓖ䟿˄ᡆㅹԧⲴˈṸֻᓃ㍒ᕅ㔃ᶴ˅
Ⲵ䇝㓳ᮠᦞDŽ⺞࠷ൠ䇢ˈྲ᷌ṩᦞ⴨լᙗᓖ䟿Ự㍒ࡠҶањṸֻˈն൘䘋а↕Ⲵ࠶᷀ѝਁ⧠
䘉њṸֻоᖃࡽⲴ䇮䇑ᱟᰐ‫ˈⲴޣ‬䛓Ѹ䘉њ⴨լᙗᓖ䟿Պ㻛᭩䘋ˈԕ‫ׯ‬ሩҾԕਾⲴ㊫լḕ䈒
ᤂ㔍䘉њṸֻDŽ

8.6 ሯ⎾ᶷᆜҖૂ〥ᶷᆜҖⲺ䇺䇰

൘䘉аㄐѝᡁԜ㘳㲁Ҷй⿽⎸ᶱᆖҐ˄lazy learning˅ᯩ⌅˖k-䘁䛫㇇⌅ǃተ䜘࣐ᵳഎᖂ
઼สҾṸֻⲴ᧘⨶DŽѻᡰԕ〠䘉Ӌᯩ⌅ᱟ⎸ᶱⲴˈᱟഐѪᆳԜᔦ䘏ҶྲօӾ䇝㓳ᮠᦞѝ⌋ॆ
Ⲵߣㆆˈⴤࡠ䙷ࡠањᯠⲴḕ䈒DŽᵜㄐ䇘䇪Ҷа⿽〟ᶱᆖҐᯩ⌅˖ᆖҐᖴੁส࠭ᮠ㖁㔌Ⲵᯩ
⌅DŽѻᡰԕ〠䘉⿽ᯩ⌅ᱟ〟ᶱⲴˈᱟഐѪᆳ൘㿱ࡠᯠⲴḕ䈒ѻࡽቡ‫ྭڊ‬Ҷ⌋ॆⲴᐕ֌üü൘
䇝㓳ᰦᨀӔҶᇊѹަⴞḷ࠭ᮠ䙬䘁Ⲵ㖁㔌㔃ᶴ઼ᵳ٬DŽṩᦞ਼ṧⲴ⨶䀓ˈᵜҖަԆㄐ㢲䇘䇪
ⲴᡰᴹަԆ㇇⌅䜭ᱟ〟ᶱᆖҐ㇇⌅˄ֻྲˈ৽ੁՐ᫝㇇⌅ǃC4.5˅DŽ

൘㇇⌅㜭࣋ᯩ䶒ˈ⎸ᶱᯩ⌅઼〟ᶱᯩ⌅ᴹ᰾ᱮᐞᔲੇ˛ᡁԜ‫ݸ‬४࠶є⿽ᐞᔲ˖䇑㇇ᰦ䰤
Ⲵᐞᔲˈ઼ሩᯠḕ䈒Ⲵ࠶㊫ᐞᔲDŽ൘䇑㇇ᰦ䰤ᯩ䶒⎸ᶱᯩ⌅઼〟ᶱᯩ⌅ᱮ❦ᴹᐞᔲDŽֻྲˈ
⎸ᶱᯩ⌅൘䇝㓳ᰦа㡜䴰㾱䖳ቁⲴ䇑㇇ˈն൘亴⍻ᯠḕ䈒Ⲵⴞḷ٬ᰦ䴰㾱ᴤཊⲴ䇑㇇ᰦ䰤DŽ

ᴤสᵜⲴ䰞仈ᱟˈ൘ᖂ㓣‫ٿ‬㖞ᯩ䶒⎸ᶱ઼〟ᶱᯩ⌅ᱟ੖ᴹᇎ䍘ᙗⲴᐞᔲ઒˛൘䘉ᯩ䶒є
⿽ᯩ⌅Ⲵ‫ޣ‬䭞ᐞᔲᱟ˖
x ⎸ᶱᯩ⌅൘ߣᇊྲօӾ䇝㓳ᮠᦞDѝ⌋ॆᰦ㘳㲁ḕ䈒ᇎֻxqDŽ
x 〟ᶱᯩ⌅н㜭‫ࡠڊ‬䘉а⛩ˈഐѪ൘㿱ࡠḕ䈒ᇎֻxqࡽˈᆳԜᐢ㓿䘹ਆҶሩⴞ
ḷ࠭ᮠⲴ˄‫ޘ‬ተ˅䙬䘁DŽ

䘉њ४࡛Պᖡ૽ᆖҐಘⲴ⌋ॆ㋮ᓖੇ˛ྲ᷌㾱≲⎸ᶱⲴ઼〟ᶱⲴᆖҐಘ䟷⭘਼ањ‫ٷ‬
䇮オ䰤Hˈ䛓ѸㆄṸᱟ㛟ᇊⲴDŽѪҶ䈤᰾䘉а⛩ˈ㘳㲁⭡㓯ᙗ࠭ᮠ㓴ᡀⲴ‫ٷ‬䇮オ䰤DŽࡽ䶒䇘
䇪Ⲵተ䜘࣐ᵳഎᖂ㇇⌅ᱟสҾ䘉ṧⲴ‫ٷ‬䇮オ䰤Ⲵ⎸ᶱᆖҐᯩ⌅DŽሩҾ⇿њᯠḕ䈒xqˈᆳṩᦞ
xq䱴䘁Ⲵ䇝㓳ṧֻ䘹ᤙањᯠⲴ‫ٷ‬䇮Ӿ䇝㓳ᮠᦞѝ⌋ॆDŽ⴨৽ˈањ֯⭘਼ṧⲴ㓯ᙗ࠭ᮠ‫ٷ‬
䇮オ䰤Ⲵ〟ᶱᆖҐಘᗵ享൘㿱ࡠḕ䈒ѻࡽ䘹ᤙሩⴞḷ࠭ᮠⲴ䙬䘁DŽᡰԕ〟ᶱᆖҐಘᗵ享ᨀӔ
অњⲴ㓯ᙗ࠭ᮠ‫ٷ‬䇮ˈԕ㾶ⴆᮤњᇎֻオ䰤઼ᡰᴹᵚᶕⲴḕ䈒DŽ⎸ᶱᆖҐᯩ⌅ᴹ᭸ൠ֯⭘Ҷ
ᴤѠᇼⲴ‫ٷ‬䇮オ䰤ˈഐѪᆳ֯⭘ᖸཊн਼Ⲵተ䜘㓯ᙗ࠭ᮠᶕᖒᡀሩⴞḷ࠭ᮠⲴ䳀ਜ਼Ⲵ‫ޘ‬ተ䙬
䘁DŽ⌘᜿ަԆⲴаӋᆖҐಘ઼‫ٷ‬䇮オ䰤ҏㅖਸ਼ṧⲴᛵߥDŽֻྲ৽ੁՐ᫝㇇⌅Ⲵ⎸ᶱ⡸ᵜˈ
ਟԕሩ⇿њ⤜・Ⲵḕ䈒⛩ᆖҐн਼Ⲵ⾎㓿㖁㔌DŽ䘉оㅜ 4 ㄐ䇘䇪Ⲵ৽ੁՐ᫝㇇⌅Ⲵ〟ᶱ⡸ᵜ
ᖒᡀሩ➗DŽ

к䶒а⇥ⲴṨᗳ㿲⛩ᱟˈ⎸ᶱⲴᆖҐಘਟԕ䙊䗷ᖸཊተ䜘䙬䘁Ⲵ㓴ਸ˄䳀ਜ਼ൠ˅㺘⽪ⴞ
ḷ࠭ᮠˈ❦㘼〟ᶱⲴᆖҐಘᗵ享൘䇝㓳ᰦᨀӔঅњⲴ‫ޘ‬ተ䙬䘁DŽഐ↔〟ᶱᆖҐⲴ઼⎸ᶱᆖҐ
ѻ䰤Ⲵᐞᔲ᜿ણ⵰ሩⴞḷ࠭ᮠⲴ‫ޘ‬ተ䙬䘁઼ተ䜘䙬䘁ⲴᐞᔲDŽ

֯⭘ཊњተ䜘䙬䘁Ⲵ〟ᶱᯩ⌅ˈਟԕӗ⭏о⎸ᶱᯩ⌅Ⲵተ䜘䙬䘁਼ṧⲴ᭸᷌ੇ˛ᖴੁส
࠭ᮠ㖁㔌ਟԕ㻛ⴻ֌ੁ䘉њⴞḷⲴቍ䈅DŽRBF ᆖҐᯩ⌅ᱟ൘䇝㓳ᰦᨀӔⴞḷ࠭ᮠ‫ޘ‬ተ䙬䘁
Ⲵ〟ᶱᯩ⌅DŽ❦㘼ˈањ RBF 㖁㔌ᢺ䘉њ‫ޘ‬ተ࠭ᮠ㺘⽪Ѫཊњተ䜘Ṩ࠭ᮠⲴ㓯ᙗ㓴ਸDŽн
䗷ˈഐѪ RBF ᆖҐᯩ⌅ᗵ享൘⸕䚃ḕ䈒⛩ѻࡽᨀӔ‫ٷ‬䇮ˈᡰԕᆳԜࡋᔪⲴተ䜘䙬䘁н㜭䗮
ࡠ‫⎸ۿ‬ᶱᆖҐᯩ⌅ѝ䛓ṧ⢩࡛䪸ሩḕ䈒⛩DŽԓᴯൠˈRBF 㖁㔌ᱟӾԕ䇝㓳ṧֻѪѝᗳⲴተ
䜘䙬䘁ѝ㻛Ā〟ᶱāᔪ・Ⲵˈᡆ㘵䈤ᱟԕ䇝㓳ṧֻⲴ㚊㊫Ѫѝᗳˈнᱟԕᵚ⸕Ⲵᵚᶕḕ䈒⛩
ѪѝᗳDŽ

ᾲ㘼䀰ѻˈ⎸ᶱᆖҐᯩ⌅ਟԕሩҾ⇿ањḕ䈒ᇎֻ䘹ᤙн਼Ⲵ‫ٷ‬䇮˄ᡆⴞḷ࠭ᮠⲴተ䜘
䙬䘁˅DŽ֯⭘਼ṧ‫ٷ‬䇮オ䰤Ⲵ〟ᶱᯩ⌅ᱟᴤ࣐ਇ䲀ࡦⲴˈഐѪᆳԜᗵ享ᨀӔањ㾶ⴆᮤњᇎ
ֻオ䰤Ⲵঅа‫ٷ‬䇮DŽᖃ❦ˈ〟ᶱⲴᯩ⌅ਟԕ֯⭘ਸᒦҶཊњተ䜘䙬䘁Ⲵ‫ٷ‬䇮オ䰤ˈቡ䊑 RBF
㖁㔌аṧDŽ❦㘼ˈণ֯ᱟ䘉ӋਸᒦⲴተ䜘䙬䘁ˈҏн㜭֯〟ᶱᯩ⌅ᆼ‫ާޘ‬ᴹ⎸ᶱᯩ⌅䛓⿽䪸
ሩᵚ⸕ḕ䈒֌ࠪ‫ٷ‬䇮Ⲵ㜭࣋DŽ
8.7 ቅ㔉ૂ㺛‫ݻ‬䈱⢟

䘉аㄐⲴ㾱⛩वᤜ˖
x สҾᇎֻⲴᆖҐᯩ⌅н਼ҾަԆⲴ࠭ᮠ䙬䘁ᯩ⌅ˈഐѪᆳԜ᧘䘏༴⨶䇝㓳ṧֻˈ
ⴤࡠᗵ享࠶㊫ањᯠḕ䈒ᇎֻᰦDŽഐ↔ˈᆳԜнᗵᖒᡀањ᰾⺞Ⲵ‫ٷ‬䇮ᶕᇊѹ
ᮤњᇎֻオ䰤кⲴᆼᮤⴞḷ࠭ᮠDŽ⴨৽ˈᆳԜਟԕሩ⇿њḕ䈒ᇎֻᖒᡀањн
਼Ⲵⴞḷ࠭ᮠተ䜘䙬䘁DŽ
x สҾᇎֻⲴᯩ⌅ⲴՈ⛩वᤜ˖䙊䗷а㌫ࡇнཚ༽ᵲⲴተ䜘䙬䘁ᶕ⁑ᤏ༽ᵲⴞḷ
࠭ᮠⲴ㜭࣋˗нՊᦏཡ䇝㓳ṧֻѝ㮤ਜ਼Ⲵԫօؑ᚟˄ഐѪһֻᵜ䓛㻛ⴤ᧕ൠᆈ
ۘ䎧ᶕ˅DŽѫ㾱Ⲵᇎ䐥䰞仈वᤜ˖࠶㊫ᯠᇎֻⲴ᭸⦷˄ᡰᴹⲴ༴⨶䜭൘ḕ䈒ᵏ
䘋㹼㘼нᱟһ‫˗˅ྭ༷߶ݸ‬䳮ԕ䘹ᤙ⭘ᶕỰ㍒⴨‫ޣ‬ᇎֻⲴਸ䘲Ⲵ䐍⿫ᓖ䟿˄⢩
࡛ᱟᖃᇎֻᱟ⭘༽ᵲⲴㅖਧ㺘⽪᧿䘠Ⲵᰦ‫˗˅ى‬ᰐ‫ޣ‬⢩ᖱሩ䐍⿫ᓖ䟿Ⲵ䍏֌⭘DŽ
x k-䘁䛫ᱟ⭘ᶕ䙬䘁ᇎᮠ٬ᡆ⿫ᮓ٬ⴞḷ࠭ᮠⲴสҾᇎֻ㇇⌅ˈᆳ‫ٷ‬ᇊᇎֻሩᓄҾ
n 㔤⅗∿オ䰤ѝⲴ⛩DŽањᯠḕ䈒Ⲵⴞḷ࠭ᮠ٬ᱟṩᦞ k њоަᴰ䘁Ⲵ䇝㓳ṧֻ
Ⲵ٬ՠ䇑ᗇࡠⲴDŽ
x ተ䜘࣐ᵳഎᖂ⌅ᱟ k-䘁䛫ᯩ⌅Ⲵ᧘ᒯˈ൘䘉⿽ᯩ⌅ѝˈѪ⇿њḕ䈒ᇎֻᔪ・а
њ᰾⺞Ⲵⴞḷ࠭ᮠⲴተ䜘䙬䘁DŽⴞḷ࠭ᮠⲴተ䜘䙬䘁ਟԕสҾ‫ۿ‬ᑨᮠǃ㓯ᙗ࠭
ᮠᡆҼ⅑࠭ᮠ䘉ṧⲴབྷ䟿Ⲵ࠭ᮠᖒᔿˈҏਟԕสҾオ䰤ተ䜘ॆⲴṨ࠭ᮠDŽ
x ᖴੁส࠭ᮠ˄RBF˅㖁㔌ᱟа㊫⭡オ䰤ተ䜘ॆṨ࠭ᮠᶴᡀⲴӪᐕ⾎㓿㖁㔌DŽᆳਟ
㻛ⴻ֌ᱟสҾᇎֻⲴᯩ⌅˄⇿њṨ࠭ᮠⲴᖡ૽ᱟ㻛ተ䜘ॆⲴ˅઼⾎㓿㖁㔌ᯩ⌅
˄൘䇝㓳ᵏᖒᡀҶሩⴞḷ࠭ᮠⲴ‫ޘ‬ተ䙬䘁ˈ㘼нᱟ൘ḕ䈒ᵏᖒᡀተ䜘䙬䘁˅Ⲵ
␧ਸDŽᖴੁส࠭ᮠ㖁㔌ᐢ㻛ᡀ࣏ൠᓄ⭘ࡠᖸཊ䈮仈ˈ∄ྲ㿶㿹൪Ჟ࠶᷀
˄interpreting visual scenes˅ˈަѝ‫ٷ‬ᇊオ䰤ተ䜘Ⲵᖡ૽ᱟᖸਸ⨶ⲴDŽ
x สҾṸֻⲴ᧘⨶ҏᱟа⿽สҾᇎֻⲴᆖҐᯩ⌅ˈն䘉⿽ᯩ⌅֯⭘༽ᵲⲴ䙫䗁᧿
䘠㘼нᱟ⅗∿オ䰤ѝⲴ⛩ᶕ㺘⽪ᇎֻDŽ㔉ᇊᇎֻⲴㅖਧ᧿䘠ˈӪԜᐢ㓿ᨀࠪҶ
བྷ䟿Ⲵᯩ⌅⭘Ҿᢺ䇝㓳ṧֻ᱐ሴᡀᯠᇎֻⲴⴞḷ࠭ᮠ٬DŽสҾṸֻⲴ᧘⨶ᯩ⌅
ᐢ㓿ᓄ⭘ࡠᖸཊᇎ䱵䰞仈ѝˈ∄ྲ⁑ᤏ⌅ᖻ᧘⨶ˈԕ৺൘༽ᵲⲴ⭏ӗ઼䘀䗃㿴
ࡂ䰞仈ѝᕅሬᩌ㍒DŽ

k-䘁䛫㇇⌅ᱟᵪಘᆖҐѝ㻛࠶᷀ᗇᴰ䘿ᖫⲴ㇇⌅ѻаˈ৏ഐа䜘࠶ᱟ⭡Ҿᆳࠪ⧠Ⲵ䖳
ᰙˈਖཆҏ⭡ҾᆳⲴㆰ᰾ᙗDŽCover & Hart˄1967˅ᨀࠪҶᰙᵏⲴ⨶䇪㔃᷌ˈDuda & Hart
˄1973˅ᨀ‫׋‬ҶањᖸྭⲴᾲ㿲DŽBishop˄1995˅䇘䇪Ҷ k-䘁䛫㇇⌅ԕ৺ᆳоᾲ⦷ᇶᓖՠ䇑
Ⲵ‫ޣ‬㌫DŽAtkeson et al.˄1997˅ሩተ䜘࣐ᵳഎᖂᯩ⌅㔉ࠪҶањ䶎ᑨྭⲴ㓥㿸DŽAtkeson et al.
˄1997b˅䈳ḕҶ䘉Ӌᯩ⌅൘ᵪಘӪ᧗ࡦᯩ䶒Ⲵᓄ⭘DŽ

Bishop˄1995˅ᨀ‫׋‬Ҷањሩᖴੁส࠭ᮠⲴ‫ޘ‬䶒䇘䇪DŽަԆ䇪䘠⭡ Powell˄1987˅઼
Poggio & Girosi˄1990˅㔉ࠪDŽᵜҖⲴ 6.12 ሿ㢲䇘䇪Ҷ EM ㇇⌅઼ᆳ൘䘹ᤙ␧ਸ儈ᯟ൷٬ᯩ
䶒Ⲵᓄ⭘DŽ

Kolodner˄1993˅ᨀ‫׋‬ҶሩสҾṸֻⲴ᧘⨶Ⲵа㡜ӻ㓽DŽԕл᮷⥞㔉ࠪҶަԆⲴаӋ‫ޣ‬
Ҿ䘁ᶕⲴ⹄ウᡀ᷌Ⲵ㓥㿸઼≷䳶˖Aamodt et al.˄1994˅ˈAha et al.˄1991˅ˈHaton et al.˄1995˅ˈ
Riesbeck & Schank˄1989˅
ˈSchank et al.˄1994˅ˈVeloso and Aamodt˄1995˅ˈWatson˄1995˅ˈ
Wess et al.˄1994˅DŽ
Ґ仈

8.1 ሩҾ‫ޜ‬ᔿ˄8.7˅ѝⲴⴞḷ࠭ᮠⲴањ䐍⿫࣐ᵳተ䜘㓯ᙗ䙬䘁ˈ᧘ሬởᓖл䱽⌅ࡉDŽ

8.2 ᙍ㘳ԕлѪ䀓ߣተ䜘࣐ᵳഎᖂѝⲴ䐍⿫ᓖ䟿Ⲵਖа⿽ᯩ⌅DŽྲлᔪ・ањ㲊ᤏⲴ䇝
㓳ṧֻ䳶ਸDc˖ሩҾ৏࿻䇝㓳ᮠᦞ䳶ਸDѝⲴ⇿ањ䇝㓳ṧֻ<x, f(x)>ˈ൘Dcѝࡋᔪࠪаᇊ
ᮠ䟿˄ਟ㜭ᱟ࠶ᮠ˅Ⲵ<x, f(x)>Ⲵᤧ䍍ˈަѝᤧ䍍Ⲵᮠ䟿ᱟK(d(xq, x))DŽ⧠൘䇝㓳ањ㓯ᙗ䙬
䘁ᶕᴰሿॆԕл䈟ᐞ߶ࡉ˖

1
E4 { ¦ ( f ( x)  fˆ ( x)) 2
2 xDc

䘉䟼Ⲵᜣ⌅ᱟሩ䶐䘁ḕ䈒ᇎֻⲴ䇝㓳ṧֻӗ⭏䖳ཊⲴᤧ䍍ˈ䐍⿫䘌Ⲵᤧ䍍䖳ቁDŽ᧘ሬࠪ
䘉њ䈟ᐞ߶ࡉⲴởᓖл䱽⌅ࡉDŽᢺ䘉њ⌅ࡉ㺘⽪ᡀ൘ D ⲴᡀઈкⲴ≲઼ˈ㘼нᱟ൘ DcⲴᡀ
ઈк≲઼ˈᒦᢺᆳ઼‫ޜ‬ᔿ˄8.6˅઼˄8.7˅ѝⲴ⌅ࡉ䘋㹼∄䖳DŽ

8.3 ߣㆆṁᆖҐ㇇⌅ ID3˄㿱ㅜ 3 ㄐ˅ᱟ〟ᶱⲴᆖҐᯩ⌅ˈᨀࠪ䘉⿽㇇⌅Ⲵањ⎸ᶱ⡸


ᵜDŽоᵜᶕⲴ〟ᶱ㇇⌅⴨∄ˈ֐Ⲵ⎸ᶱ㇇⌅ᴹӰѸՈ⛩઼㕪⛩˛

৲㘳᮷⥞
ㅢ9ㄖ  䚍Ֆ㇍⌋

遗传算法提供了一种大致基于模拟进化的学习方法。其中的假设常被描述为
二进制位串,位串的含义依赖于具体的应用。然而,假设也可以被描述为符号表
达式或者甚至是计算机程序。对合适假设的搜索是从若干初始假设的群体
(population)或汇集(collection)开始的。当前群体的成员通过模仿生物进化
的方式来产生下一代群体,比如说随机变异(mutation)和交叉(crossover)。在
每一步,根据给定的适应度(fitness)度量评估当前群体中的假设,而后使用概
率方法选出适应度最高的假设作为产生下一代的种子。遗传算法已被成功地应用
到多种学习任务和最优化问题中。例如,遗传算法已被用于学习机器人控制的规
则集,以及优化人工神经网络的拓扑结构和学习参数。这一章既覆盖了用位串描
述假设的遗传算法(genetic algorithms),也覆盖了用计算机程序描述假设的遗传
编程(genetic programming)。

9.1 ࣞᵰ

䚇Ր㇇⌅˄GA˅ᨀ‫׋‬Ҷа⿽ਇ⭏⢙䘋ॆ੟ਁⲴᆖҐᯩ⌅DŽᆳн޽ᱟӾа㡜ࡠ⢩↺ᡆӾ
ㆰঅࡠ༽ᵲൠᩌ㍒‫ٷ‬䇮ˈ㘼ᱟ䙊䗷ਈᔲ઼䟽㓴ᖃࡽᐢ⸕Ⲵᴰྭ‫ٷ‬䇮ᶕ⭏ᡀਾ㔝Ⲵ‫ٷ‬䇮DŽ൘⇿
а↕ˈ㻛〠Ѫᖃࡽ㗔փ˄population˅Ⲵа㓴‫ٷ‬䇮㻛ᴤᯠˈᯩ⌅ᱟ䙊䗷֯⭘ⴞࡽ䘲ᓄᓖᴰ儈
Ⲵ‫ٷ‬䇮Ⲵਾԓᴯԓ㗔փⲴḀњ䜘࠶DŽ䘉њ䗷〻ᖒᡀҶሩ‫ٷ‬䇮Ⲵ⭏ᡀᒦ⍻䈅˄generate-and-test˅
ḡ⣦ᩌ㍒˄beam-search˅ˈަѝ㤕ᒢњᴰ֣ᖃࡽ‫ٷ‬䇮Ⲵਈփᴰᴹਟ㜭൘ла↕㻛㘳㲁DŽGA
ⲴᲞ৺઼ਁኅᗇ⳺Ҿԕлഐ㍐˖
x ൘⭏⢙㌫㔏ѝ䘋ॆ㻛䇔Ѫᱟа⿽ᡀ࣏Ⲵ㠚䘲ᓄᯩ⌅ˈᒦфާᴹᖸྭⲴ励ἂ
ᙗDŽ
x GA ᩌ㍒Ⲵ‫ٷ‬䇮オ䰤ѝˈ‫ٷ‬䇮Ⲵ਴њ䜘࠶⴨ӂ֌⭘ˈ⇿а䜘࠶ሩᙫⲴ‫ٷ‬䇮䘲
ᓄᓖⲴᖡ૽䳮ԕᔪ⁑DŽ
x 䚇Ր㇇⌅᱃Ҿᒦ㹼ॆˈфਟ䱽վ⭡Ҿ֯⭘䎵ᕪ䇑㇇ᵪ⺜ԦⲴᑖᶕⲴᰲ䍥䍩
⭘DŽ

䘉аㄐ᧿䘠Ҷ䚇Ր㇇⌅ˈѮֻ╄⽪ҶᆳⲴ⭘⌅ˈᒦ࠶᷀Ҷᆳᩌ㍒Ⲵ‫ٷ‬䇮オ䰤Ⲵ⢩ᙗDŽᡁ
Ԝҏ᧿䘠ҶᆳⲴањਈփˈ〠Ѫ䚇Ր㕆〻ˈ൘䘉⿽ᯩ⌅ѝˈᮤњ䇑㇇ᵪ〻ᒿੁ⵰Ḁњ䘲ᓄᓖ
߶ࡉ䘋ॆDŽ䚇Ր㇇⌅઼䚇Ր㕆〻ᱟ䘋ॆ䇑㇇˄evolutionary computation˅亶ฏⲴѝⲴє⿽⍱
㹼ᯩ⌅DŽ൘ᵜㄐⲴᴰਾа㢲ᡁԜሶ᧕䀖аӋ⹄ウ⭏⢙䘋ॆⲴ䈮仈ˈवᤜ劽ᗧ⑙᭸ᓄ˄Baldwin
effect˅ˈᆳ᧿䘠ҶњփⲴᆖҐ㜭࣋оᮤњ㗔փ䘋ॆ䙏ᓖѻ䰤ᴹ䏓Ⲵ⴨ӂ֌⭘DŽ

9.2 䚍Ֆ㇍⌋

GA ⹄ウⲴ䰞仈ᱟᩌ㍒ањ‫ى‬䘹‫ٷ‬䇮Ⲵオ䰤ˈԕ⺞ᇊᴰ֣Ⲵ‫ٷ‬䇮DŽ൘ GA ѝˈĀᴰ֣‫ٷ‬
䇮ā㻛ᇊѹѪᱟ֯Ā䘲ᓄᓖ˄fitness˅āᴰՈⲴ‫ٷ‬䇮ˈ䘲ᓄᓖᱟѪᖃࡽ䰞仈亴‫ݸ‬ᇊѹⲴᮠᆇ
ᓖ䟿DŽֻྲˈྲ᷌ᆖҐԫ࣑ᱟ൘㔉ᇊањᵚ⸕࠭ᮠⲴ䗃‫ޕ‬䗃ࠪ䇝㓳ṧֻਾ䙬䘁䘉њ࠭ᮠˈ䛓
Ѹ䘲ᓄᓖਟ㻛ᇊѹѪ‫ٷ‬䇮൘䇝㓳ᮠᦞкⲴ㋮ᓖDŽྲ᷌ԫ࣑ᱟᆖҐлഭ䱵䊑ỻⲴㆆ⮕ˈ䛓Ѹ䘲
ᓄᓖਟ㻛ᇊѹѪ䈕њփ൘ᖃࡽ㗔փѝоަԆњփሩᔸⲴ㜌⦷DŽ

ቭ㇑䚇Ր㇇⌅Ⲵн਼ᇎ⧠൘㓶㢲кᴹᡰн਼ˈնᆳԜ䜭ާᴹԕлⲴ‫਼ޡ‬㔃ᶴ˖㇇⌅䘝ԓ
ᴤᯠањ‫ٷ‬䇮⊐ˈ䘉њ‫ٷ‬䇮⊐〠Ѫ㗔փDŽ൘⇿а⅑䘝ԓѝˈṩᦞ䘲ᓄᓖ࠭ᮠ䇴ՠ㗔փѝⲴᡰ
ᴹᡀઈDŽ❦ਾӾᖃࡽ㗔փѝ⭘ᾲ⦷ᯩ⌅䘹ਆ䘲ᓄᓖᴰ儈Ⲵњփӗ⭏ᯠⲴаԓDŽ൘䘉Ӌ㻛䘹ѝ
Ⲵњփѝˈа䜘࠶‫؍‬ᤱ৏ṧൠ䘋‫ޕ‬лаԓ㗔փˈަԆⲴ㻛⭘֌ӗ⭏ਾԓњփⲴส⹰ˈަѝᓄ
⭘䊑Ӕ৹઼ਈᔲ䘉ṧⲴ䚇Րᯩ⌅DŽ

㺘 9-1 ᧿䘠Ҷањ䚇Ր㇇⌅৏රDŽ㇇⌅Ⲵ䗃‫ޕ‬वᤜ˖⭘ᶕᧂᒿ‫ى‬䘹‫ٷ‬䇮Ⲵ䘲ᓄᓖ࠭ᮠ˗
ᇊѹ㇇⌅㓸→ᰦ䘲ᓄᓖⲴ䰸٬˗㾱㔤ᤱⲴ㗔փབྷሿ˗઼ߣᇊྲօӗ⭏ਾ㔗㗔փⲴ৲ᮠ˖⇿а
ԓ㗔փѝ㻛␈⊠Ⲵ∄઼ֻਈᔲ⦷DŽ

㺘 9-1 䚇Ր㇇⌅৏ර

㇇⌅ѝ㔤ᤱањवਜ਼pњ‫ٷ‬䇮Ⲵ㗔փDŽ൘⇿а⅑䘝ԓѝˈਾ㔗㗔փPSⲴᖒᡀ䙊䗷є⿽䙄ᖴ˖ṩ
ᦞ‫ٷ‬䇮Ⲵ䘲ᓄᓖ⭘ᾲ⦷ᯩ⌅䘹ᤙњփˈԕ৺࣐‫ޕ‬ᯠ‫ٷ‬䇮DŽᯠ‫ٷ‬䇮䙊䗷є⿽ᯩ⌅ᗇࡠ˖ሩᴰ儈䘲ᓄᓖ
‫ٷ‬䇮ሩᓄ⭘Ӕ৹㇇ᆀ˗ሩ䙊䗷䘹ᤙ઼Ӕ৹ӗ⭏Ⲵᯠаԓ㗔փѝⲴ䜘࠶‫ٷ‬䇮䘋㹼অ⛩ਈᔲDŽ䟽༽䘉њ
䘝ԓ䗷〻ˈⴤࡠਁ⧠䘲ᓄᓖ䏣ཏྭⲴ‫ٷ‬䇮DŽިරⲴӔ৹઼ਈᔲ㇇ᆀᇊѹ൘ਾ䶒Ⲵ㺘ṬѝDŽ

GA(Fitness, Fitness_threshold, p, r, m)
Fitness˖䘲ᓄᓖ䇴࠶࠭ᮠˈѪ㔉ᇊ‫ٷ‬䇮䍻Ҹањ䇴ՠᗇ࠶DŽ
Fitness_threshold˖ᤷᇊ㓸→ࡔᦞⲴ䰸٬DŽ
p˖㗔փѝवਜ਼Ⲵ‫ٷ‬䇮ᮠ䟿DŽ
r˖⇿а↕ѝ䙊䗷Ӕ৹ਆԓ㗔փᡀઈⲴ∄ֻDŽ
m˖ਈᔲ⦷DŽ
x ࡍ࿻ॆ㗔փ˖Pm䲿ᵪӗ⭏Ⲵ p њ‫ٷ‬䇮
x 䇴ՠ˖ሩҾ P ѝⲴ⇿ањ hˈ䇑㇇ Fitness(h)
x ᖃ[ max Fitness(h)]<Fitness_thresholdˈ‫˖ڊ‬
h

ӗ⭏ᯠⲴаԓPS˖
1ˊ 䘹ᤙ˖⭘ᾲ⦷ᯩ⌅䘹ᤙPⲴ(1-r)pњᡀઈ࣐‫ޕ‬PS DŽӾPѝ䘹ᤙ‫ٷ‬䇮hi Ⲵᾲ⦷
Pr(hi)䙊䗷л䶒‫ޜ‬ᔿ䇑㇇˖
Fitness(hi )
Pr(hi )
¦
p
j 1
Fitness(h j )
2ˊ Ӕ৹˖ṩᦞк䶒㔉ࠪⲴPr(hi)ˈӾPѝ᤹ᾲ⦷䘹ᤙr˜p/2 ሩ‫ٷ‬䇮DŽሩҾ⇿аሩ
‫ٷ‬䇮<h1, h2>ᓄ⭘Ӕ৹㇇ᆀӗ⭏єњਾԓDŽᢺᡰᴹⲴਾԓ࣐‫ޕ‬PSDŽ
3ˊ ਈᔲ˖֯⭘൷रⲴᾲ⦷ӾPSѝ䘹ᤙmⲮ࠶∄ⲴᡀઈDŽሩҾ䘹ࠪⲴ⇿њᡀઈˈ
൘ᆳⲴ㺘⽪ѝ䲿ᵪ䘹ᤙањսਆ৽DŽ
4ˊ ᴤᯠ˖PmPSDŽ
5ˊ 䇴ՠ˖ሩҾ P ѝⲴ⇿ањ h 䇑㇇ Fitness(h)
x Ӿ P ѝ䘄എ䘲ᓄᓖᴰ儈Ⲵ‫ٷ‬䇮DŽ

൘䘉њ㇇⌅Ⲵ⇿а⅑䘝ԓѝˈสҾᖃࡽⲴ㗔փӗ⭏ᯠаԓⲴ‫ٷ‬䇮DŽ俆‫ˈݸ‬ӾᖃࡽⲴ㗔փ
ѝ䘹ᤙаᇊᮠ䟿Ⲵ‫ٷ‬䇮वਜ਼൘лаԓѝDŽ䘉Ӌ‫ٷ‬䇮ᱟ⭘ᾲ⦷ᯩ⌅䘹ᤙⲴˈަѝ䘹ᤙ‫ٷ‬䇮hiⲴ
ᾲ⦷ᱟ䙊䗷лᔿ䇑㇇Ⲵ˖

Fitness(hi )
Pr(hi ) ˄9.1˅
¦
p
j 1
Fitness(h j )

ഐ↔ˈањ‫ٷ‬䇮㻛䘹ᤙⲴᾲ⦷оᆳ㠚ᐡⲴ䘲ᓄᓖᡀ↓∄ˈᒦфоᖃࡽ㗔փѝަԆㄎҹ‫ٷ‬
䇮Ⲵ䘲ᓄᓖᡀ৽∄DŽ

൘ᖃࡽԓⲴ䘉Ӌᡀઈᐢ㻛䘹‫ޕ‬лаԓ㗔փਾˈ޽֯⭘а⿽Ӕ৹᫽֌ӗ⭏ަԆⲴᡀઈDŽӔ
৹᫽֌ሶ൘ла㢲㻛ާփᇊѹˈᆳӾᖃࡽԓѝਆєњৼӢ‫ٷ‬䇮ˈᒦ䙊䗷䟽ᯠ㓴ਸৼӢⲴ਴䜘
࠶ӗ⭏єњਾԓ‫ٷ‬䇮DŽৼӢ‫ٷ‬䇮ᱟӾᖃࡽ㗔փѝ᤹ᾲ⦷䘹ࠪⲴˈҏ֯⭘‫ޜ‬ᔿ˄9.1˅Ⲵᾲ⦷
࠭ᮠDŽ൘䙊䗷䘉⿽Ӕ৹᫽֌ӗ⭏ᯠⲴᡀઈਾˈᯠаԓ㗔փᐢ㓿वਜ਼Ҷᡰ䴰ᮠ䟿ⲴᡀઈDŽ᧕л
ᶕˈӾ䘉Ӌᡀઈѝ䲿ᵪ䘹ࠪаᇊ∄ֻ˄m˅ˈᒦ䘋㹼䲿ᵪਈᔲDŽ

ഐ↔ˈ䘉⿽ GA ㇇⌅ᢗ㹼а⿽䲿ᵪⲴǃᒦ㹼ḡ⣦‫ٷ‬䇮ᩌ㍒ˈṩᦞ䘲ᓄᓖ࠭ᮠਁ⧠䖳ྭⲴ
‫ٷ‬䇮DŽ൘л䶒Ⲵሿ㢲ѝᡁԜሶᴤ䈖ቭൠ᧿䘠䘉њ㇇⌅ѝ֯⭘Ⲵ‫ٷ‬䇮㺘⽪઼䚇Ր㇇ᆀDŽ

9.2.1 㺞⽰‫ٽ‬䇴

GA ѝ‫ٷ‬䇮㓿ᑨ㻛㺘⽪ѪҼ䘋ࡦսѢˈ䘉ṧਟԕᖸᯩ‫ׯ‬ൠ⭘ਈᔲ઼Ӕ৹䚇Ր㇇ᆀᶕ᫽
֌DŽ֯⭘䘉ṧⲴսѢ㺘⽪Ⲵ‫ٷ‬䇮ਟ㜭䶎ᑨ༽ᵲDŽֻྲˈif-then 㿴ࡉቡਟԕᖸᇩ᱃ൠ⭘䘉⿽ᯩ
ᔿ㺘⽪ˈ‫⌅ڊ‬ᱟ䘹ᤙ㿴ࡉⲴа⿽㕆⸱ˈަѝѪ⇿њ㿴ࡉⲴࡽԦ઼ਾԦ࠶䝽⢩ᇊⲴᆀѢDŽ
Holland˄1986˅˗Grefenstette˄1988˅
˗DeJong et al.˄1993˅ѝ᧿䘠Ҷ GA ㌫㔏ѝ䘉⿽㿴ࡉ
㺘⽪ⲴֻᆀDŽ

ѪҶ䈤᰾ྲօᢺ if-then 㿴ࡉ㕆⸱ᡀսѢˈ俆‫ݸ‬㘳㲁ᘾṧ֯⭘սѢ᧿䘠অњ኎ᙗⲴ٬㓖


ᶏDŽֻྲ㘳㲁኎ᙗ OutlookˈᆳⲴ٬ਟԕਆԕл 3 њ٬ѝⲴԫањ˖SunnyˈOvercast ᡆ RainDŽ
㺘⽪ Outlook 㓖ᶏⲴањ᰾ᱮⲴᯩ⌅ᱟˈ֯⭘ањ䮯ᓖѪ 3 ⲴսѢˈ⇿սሩᓄањਟ㜭٬DŽ
㤕ḀսѪ 1 㺘⽪䘉њ኎ᙗਟԕਆሩᓄⲴ٬DŽֻྲˈѢ 010 㺘⽪ Outlook ᗵ享ਆㅜҼњ٬Ⲵ㓖
ᶏˈᡆ㘵䈤 Outlook=OvercastDŽ㊫լⲴˈѢ 011 㺘⽪ᴤа㡜Ⲵ㓖ᶏˈOutlook ਟԕਆєњਟ㜭
٬ˈᡆ㘵䈤˄Outlook=Overcast›Rain˅
DŽ⌘᜿ 111 㺘⽪ᴰа㡜Ⲵ㓖ᶏˈ㺘᰾ᡁԜн‫ޣ‬ᗳ䘉њ
኎ᙗਆଚњ٬DŽ

ᴹҶ㺘⽪অњ኎ᙗ㓖ᶏⲴᯩ⌅ˈ䛓Ѹሩཊњ኎ᙗ㓖ᶏⲴਸਆਟԕᖸᇩ᱃ൠ㺘⽪Ѫሩᓄս
ѢⲴ䘎᧕DŽֻྲˈ㘳㲁ㅜҼњ኎ᙗ Windˈᆳਟԕਆєњ٬ Strong ᡆ WeakDŽ䛓Ѹ‫ۿ‬л䶒Ⲵ㿴
ࡉࡽԦ˖

(Outlook=Overcast›Rain)š(Wind=Strong)

ਟ㻛㺘⽪Ѫ䮯ᓖѪ 5 ⲴսѢ˖

Outlook Wind

011 10

㿴ࡉⲴਾԦ˄ֻྲ PlayTennis=yes˅ਟԕ⭘⴨լⲴᯩᔿ㺘⽪DŽҾᱟˈᮤњ㿴ࡉ㺘⽪ਟԕ
䙊䗷ᢺ᧿䘠㿴ࡉࡽԦ઼ਾԦⲴսѢ䘎᧕䎧ᶕDŽֻྲˈл䶒Ⲵ㿴ࡉ

IF Wind=Strong THEN PlayTennis=yes

ሶ㻛㺘⽪ѪԕлⲴսѢ˖

Outlook Wind PlayTennis

111 10 10

ަѝˈࡽйս᧿䘠Ҷሩ Outlook ⲴĀн‫ޣ‬ᗳ˄don’t care˅ā㓖ᶏˈ᧕лᶕєս᧿䘠Ҷሩ


Wind Ⲵ㓖ᶏˈᴰਾєս᧿䘠Ҷ㿴ࡉⲴਾԦ˄䘉䟼‫ٷ‬ᇊ PlayTennis ਟԕਆєњ٬ Yes ᡆ No˅DŽ
⌘᜿ˈ㺘⽪㿴ࡉⲴսѢሩ‫ٷ‬䇮オ䰤ѝⲴ⇿њ኎ᙗᴹањᆀѢˈণ֯䈕኎ᙗн㻛㿴ࡉⲴࡽԦᡰ
㓖ᶏDŽ䘉ṧᗇࡠҶањപᇊ䮯ᓖⲴ㿴ࡉսѢ㺘⽪ˈަѝ൘⢩ᇊս㖞ⲴᆀѢ᧿䘠ሩ⢩ᇊ኎ᙗⲴ
㓖ᶏDŽᴹҶঅњ㿴ࡉⲴ㺘⽪ᯩ⌅ˈᡁԜਟԕㆰঅൠᢺঅњ㿴ࡉⲴսѢ㺘⽪䘎᧕䎧ᶕˈӾ㘼㺘
⽪㿴ࡉ䳶DŽ

൘ѪḀњ‫ٷ‬䇮オ䰤䇮䇑սѢ㕆⸱ᰦˈᴹᗵ㾱䇙⇿њਕ⌅ਸ⌅ⲴսѢ㺘⽪ањᴹ᜿ѹⲴ‫ٷ‬
䇮DŽ∄ྲˈ㤕֯⭘ка⇥Ⲵ㿴ࡉ㕆⸱ᯩᔿˈ䛓ѸսѢ 111 10 11 㺘⽪Ҷањ㿴ࡉˈᆳⲴਾԦ
н㓖ᶏⴞḷ኎ᙗ PlayTennisDŽྲ᷌㾱䚯‫ݽ‬㘳㲁䘉њ‫ٷ‬䇮ˈਟԕ䟷⭘н਼Ⲵ㕆⸱ᯩᔿ˄ֻྲˈ
ӵ࠶䝽ањս㔉ਾԦ PlayTennisˈ㺘⽪ᆳⲴ٬ᱟ Yes ᡆ No˅˗ᡆ᭩ਈ䚇Ր㇇ᆀԕ᰾⺞䚯‫ݽ‬ᔪ
・䘉ṧⲴսѢ˗ᡆᒢ㜶ᢺᖸվⲴ䘲ᓄᓖ䍻㔉䘉ṧⲴѢDŽ

൘аӋ GA ѝˈ‫ٷ‬䇮ᱟ⭘ㅖਧ᧿䘠ᶕ㺘⽪Ⲵˈ㘼нᱟ⭘սѢDŽֻྲˈ൘ 9.5 㢲ѝˈᡁԜ


䇘䇪Ҷањᢺ‫ٷ‬䇮㕆⸱Ѫ䇑㇇ᵪ〻ᒿⲴ䚇Ր㇇⌅DŽ

9.2.2 䚍Ֆ㇍ᆆ

൘ GA ѝ䙊䗷а㌫ࡇ㇇ᆀ˄operators˅ᶕߣᇊਾԓˈ㇇ᆀሩᖃࡽ㗔փѝ䘹ᇊⲴᡀઈ䘋㹼
䟽㓴઼ਈᔲDŽ㺘 9-1 ѝࡇࠪҶ⭘ᶕ᫽֌սѢⲴިර GA ㇇ᆀDŽ䘉Ӌ㇇ᆀᱟ⭏⢙䘋ॆѝⲴ䚇Ր
䗷〻Ⲵ⨶ᜣॆᖒᔿDŽᴰᑨ㿱Ⲵєњ㇇ᆀᱟӔ৹˄crossover˅઼ਈᔲ˄mutation˅DŽ

Ӕ৹㇇ᆀӾєњৼӢѢѝ䙊䗷༽ࡦ䘹ᇊսӗ⭏єњᯠⲴਾԓDŽ⇿њਾԓⲴㅜ i սᱟӾᆳ
ⲴḀњৼӢⲴㅜ i ս༽ࡦᶕⲴDŽ㠣ҾৼӢѝⲴଚањ൘ㅜ i ս䎧֌⭘ˈ䘉ᱟ⭡ਖཆањ〠Ѫ
Ӕ৹᧙⸱˄crossover mask˅ⲴսѢߣᇊⲴDŽл䶒╄⽪ал䘉њ䗷〻ˈ㘳㲁㺘 9-2 ѝᴰк䗩Ⲵ
অ⛩˄single-point˅Ӕ৹㇇ᆀDŽ‫ݸ‬㘳㲁ަѝк䶒ањਾԓDŽ䘉њਾԓӾㅜањৼӢѝਆࡽ 5
սˈަ։Ⲵ 6 սᶕ㠚ㅜҼњৼӢˈഐѪӔ৹᧙⸱ 11111000000 Ѫ⇿њսᤷᇊ䘉Ӌ䘹ᤙDŽㅜҼ
њਾԓ֯⭘਼ṧⲴӔ৹᧙⸱ˈնӔᦒҶৼӢⲴ䀂㢢DŽᡰԕˈᆳवਜ਼Ҷㅜањਾԓ⋑ᴹ⭘䗷Ⲵ
սDŽ൘অ⛩Ӕ৹ѝˈӔ৹᧙⸱ᙫᱟ䘉ṧ㓴ᡀⲴˈᆳԕ䘎㔝Ⲵ n њ 1 ᔰ࿻ˈਾ䶒䐏䲿ᗵ㾱њᮠ
Ⲵ 0 ⴤ㠣㔃ᶏDŽ䘉ṧⲴ㔃᷌ᱟਾԓѝࡽ n սᶕ㠚ㅜањৼӢˈ։лⲴսᶕ㠚ㅜҼњৼӢDŽ⇿
⅑ᓄ⭘অ⛩Ӕ৹㇇ᆀᰦˈӔ৹⛩ n ᱟ䲿ᵪ䘹ਆⲴˈ❦ਾ޽ӗ⭏Ӕ৹᧙⸱ᒦᓄ⭘DŽ

㺘 9-2 䚇Ր㇇⌅ᑨ㿱㇇ᆀ

䘉Ӌ㇇ᆀᖒᡀ⭘սѢ㺘⽪Ⲵਾԓ‫ٷ‬䇮DŽӔ৹㇇ᆀӾєњৼӢѝӗ⭏єњਾԓˈ֯⭘Ӕ৹᧙⸱ᶕ
ߣᇊଚањৼӢ֌⭘Ҿ⴨ᓄⲴսDŽਈᔲӾঅаⲴৼӢѝӗ⭏অаⲴਾԓˈ䙊䗷䲿ᵪ䘹ਆаսᒦਆ৽DŽ
插图——原书页码:254

initial strings –ࡍ࿻Ѣ

Crossover Mask-Ӕ৹᧙⸱

Offspring-ਾԓ

Single-point crossover:-অ⛩Ӕ৹

Two-point crossover:-є⛩Ӕ৹

Uniform crossover-൷रӔ৹

Point mutation:-⛩ਈᔲ

൘є⛩Ӕ৹˄two-point crossover˅ѝˈਾԓⲴӗ⭏䙊䗷ᢺањৼӢѢⲴѝ䰤⡷⇥ᴯᦒㅜ
ҼњৼӢѢⲴѝ䰤⡷⇥DŽᦒਕ䈍ᶕ䇢ˈӔ৹᧙⸱ԕn0њ 0 ᔰ࿻ˈਾ䶒䐏䲿n1њ 1ˈ޽䐏䲿ᗵ
㾱ᮠ䟿Ⲵ 0 㔃ᶏDŽ⇿⅑ᓄ⭘є⛩Ӕ৹㇇ᆀᰦˈ䙊䗷䲿ᵪ䘹ਆєњᮤᮠn0઼n1ᶕӗ⭏᧙⸱DŽֻ
ྲˈ൘㺘 9-2 ᱮ⽪Ⲵֻᆀѝˈᱟ֯⭘n0=2 ઼n1=5 Ⲵ᧙⸱ᶕӗ⭏ਾԓⲴDŽ઼к䶒аṧˈ䙊䗷
䖜ᦒєњৼӢⲴ䀂㢢ᶕӗ⭏䘉єњਾԓDŽ

൷रӔ৹˄uniform crossover˅ਸᒦҶӾєњৼӢԕ൷रᾲ⦷ᣭਆⲴսˈྲ㺘 9-2 ᡰ⽪DŽ


൘䘉⿽ᛵߥлˈӗ⭏ањ䲿ᵪⲴսѢ֌ѪӔ৹᧙⸱ˈ⇿аսⲴ䘹ਆ䜭ᱟ䲿ᵪⲴᒦф⤜・Ҿަ
ԆսDŽ

䲔Ҷ䙊䗷㓴ਸৼӢⲴ਴䜘࠶ӗ⭏ਾԓⲴ䟽㓴㇇ᆀˈਖа⿽㊫රⲴ㇇ᆀӾঅаⲴৼӢӗ⭏
ਾԓDŽ⺞࠷ൠ䇢ˈਈᔲ˄mutation˅㇇ᆀ⭘ҾሩսѢӗ⭏䲿ᵪⲴሿਈॆˈᯩ⌅ᱟ䘹ਆањսˈ
❦ਾਆ৽DŽਈᔲ㓿ᑨᱟ൘ᓄ⭘ҶӔ৹ѻਾ䘋㹼Ⲵˈ‫ۿ‬㺘 9-1 ѝⲴ৏ර㇇⌅䛓ṧDŽ

аӋ GA ㌫㔏ᓄ⭘ҶަԆⲴ㇇ᆀˈ⢩࡛ᱟаӋу䰘䪸ሩ㌫㔏ѝ⢩ᇊ‫ٷ‬䇮㺘⽪Ⲵ㇇ᆀDŽֻ
ྲˈGrefenstette et al.˄1991˅᧿䘠ҶањᆖҐᵪಘӪ᧗ࡦ㿴ࡉ䳶Ⲵ㌫㔏DŽᆳ䲔Ҷ֯⭘ਈᔲ
઼Ӕ৹㇇ᆀˈ䘈֯⭘Ҷањ㇇ᆀԕ֯㿴ࡉ⢩ॆDŽJanikow˄1993˅᧿䘠ҶањᆖҐ㿴ࡉ䳶Ⲵ
㌫㔏ˈަѝ֯⭘Ҷཊ⿽ⴤ᧕⌋ॆ઼⢩ॆ㿴ࡉⲴ㇇ᆀ˄ֻྲⴤ᧕ᢺањ኎ᙗᶑԦᴯᦒѪĀн‫ޣ‬
ᗳā˄don’t care˅˅DŽ

9.2.3 䘸ᓊᓜ࠳ᮦૂ‫ٽ‬䇴䘿᤟

䘲ᓄᓖ࠭ᮠᇊѹҶ‫ى‬䘹‫ٷ‬䇮Ⲵᧂ਽߶ࡉˈᒦфᱟԕᾲ⦷ᯩ⌅䘹ᤙлаԓ㗔փⲴ߶ࡉDŽྲ
᷌ԫ࣑ᱟᆖҐ࠶㊫Ⲵ㿴ࡉˈ䛓Ѹ䘲ᓄᓖ࠭ᮠѝՊᴹа亩⭘ᶕ䇴ԧ⇿њ㿴ࡉሩ䇝㓳ṧֻ䳶ਸⲴ
࠶㊫㋮ᓖDŽ䘲ᓄᓖ࠭ᮠѝҏਟ㜭वਜ਼ަԆⲴ߶ࡉˈֻྲ㿴ࡉⲴ༽ᵲᓖ઼а㡜ᙗ˄generality˅DŽ
ᴤа㡜ൠ䇢ˈᖃսѢ㻛䀓䟺Ѫ༽ᵲⲴ䗷〻ᰦ˄ֻྲˈᖃսѢ㺘⽪а㌫ࡇ㿴ࡉˈ䘉Ӌ㿴ࡉ㾱㻛
䬮᧕൘а䎧᧗ࡦањᵪಘӪ䇮༷˅ˈ䘲ᓄᓖ࠭ᮠਟԕ⍻䟿⭏ᡀⲴ䗷〻ᙫփᙗ㜭㘼нᱟঅњ㿴
ࡉⲴᙗ㜭DŽ
൘㺘 9-1 ѝᱮ⽪ⲴGA৏රѝˈ䘹ᤙḀ‫ٷ‬䇮Ⲵᾲ⦷ᱟ䙊䗷ᆳⲴ䘲ᓄᓖоᖃࡽ㗔փѝަԆ
ᡀઈⲴ䘲ᓄᓖⲴ∄٬ᗇࡠⲴˈྲ‫ޜ‬ᔿ˄9.1˅ᡰ⽪DŽ䘉⿽ᯩ⌅ᴹᰦ㻛〠Ѫ䘲ᓄᓖ∄ֻ䘹ᤙ˄fitness
proportionate selection˅ˈᡆ〠Ѫ䖞ⴈ䍼ķ䘹ᤙ˄roulette wheel selection˅DŽӪԜҏᨀࠪҶަԆ
֯⭘䘲ᓄᓖᶕ䘹ᤙ‫ٷ‬䇮Ⲵᯩ⌅DŽֻྲ䭖ḷ䎋䘹ᤙ˄tournament selection˅ ˈᆳ‫ݸ‬Ӿᖃࡽ㗔փѝ
䲿ᵪ䘹ਆєњ‫ٷ‬䇮ˈ޽᤹➗һ‫ݸ‬ᇊѹⲴᾲ⦷p䘹ᤙ䘲ᓄᓖ䖳儈Ⲵ‫ٷ‬䇮ˈ᤹➗ᾲ⦷ 1-p䘹ᤙ䘲
ᓄᓖ䖳վⲴ‫ٷ‬䇮DŽ䭖ḷ䎋䘹ᤙᑨᑨ∄䘲ᓄᓖ∄ֻ⌅ᗇࡠᴤ࣐ཊṧॆⲴ㗔փ˄Goldberg and Deb
1991˅DŽ൘ਖа⿽㻛〠Ѫᧂ਽䘹ᤙ˄rank selection˅Ⲵᯩ⌅ѝˈᖃࡽ㗔փѝⲴ‫ٷ‬䇮‫᤹ݸ‬䘲ᓄ
ᓖᧂᒿDŽ❦ਾˈ䘹ᤙḀ‫ٷ‬䇮Ⲵᾲ⦷оᆳ൘䘉њᧂᒿࡇ㺘ѝⲴս㖞ᡀ∄ֻˈ㘼нᱟоᆳⲴ䘲ᓄ
ᓖᡀ∄ֻDŽ

9.3 ⽰ׁ

䚇Ր㇇⌅ਟԕ㻛ⴻ֌䙊⭘ⲴᴰՈॆᯩ⌅ˈᆳᩌ㍒ањᐘབྷⲴ‫ى‬䘹ሩ䊑オ䰤ˈṩᦞ䘲ᓄᓖ
࠭ᮠḕ᢮㺘⧠ᴰྭⲴሩ䊑DŽቭ㇑н‫؍‬䇱ਁ⧠ᴰՈⲴሩ䊑ˈն GA 㓿ᑨᡀ࣏ൠਁ⧠ާᴹ䖳儈䘲
ᓄᓖⲴሩ䊑DŽGA ᐢ㓿㻛ᓄ⭘ࡠᵪಘᆖҐԕཆⲴབྷ䟿ᴰՈॆ䰞仈ˈवᤜ‫⭥ۿ‬䐟ᐳ㓯઼ԫ࣑䈳
ᓖ䘉ṧⲴ䰞仈DŽ൘ᵪಘᆖҐ亶ฏˈGA нӵ㻛ᓄ⭘ࡠ࠭ᮠ䙬䘁䰞仈ˈ䘈ᓄ⭘ࡠ‫ۿ‬䘹ਆӪᐕ⾎
㓿㖁㔌Ⲵᤃᢁ㔃ᶴ䘉ṧⲴԫ࣑DŽ

ѪҶ䈤᰾ GA ൘ᾲᘥᆖҐᯩ䶒Ⲵᓄ⭘ˈᡁԜㆰ㾱ᾲ䘠ал DeJong et al.˄1993˅Ⲵ GABIL


㌫㔏DŽGABIL ֯⭘ GA ᶕᆖҐԕભ仈㿴ࡉⲴ᷀ਆ䳶ਸ㺘⽪ⲴᐳቄᾲᘥDŽ൘ሩࠐњᾲᘥᆖҐ
䰞仈Ⲵᇎ傼ѝˈਁ⧠൘⌋ॆ㋮ᓖᯩ䶒 GABIL оަԆⲴᆖҐ㇇⌅བྷփ⴨ᖃˈ䘉䟼ⲴަԆ㇇⌅
वᤜߣㆆṁᆖҐ㇇⌅ C4.5 ઼㿴ࡉᆖҐ㌫㔏 AQ14DŽ䘉њ⹄ウѝⲴᆖҐԫ࣑ᰒᴹӪѪ䇮䇑Ⲵ
⭘ᶕ⹄ウ㌫㔏⌋ॆ㋮ᓖⲴᆖҐԫ࣑ˈ৸ᴹң㞪ⱼ䇺ᯝ䘉ṧⲴ⧠ᇎ䰞仈DŽ

GABIL ֯⭘Ⲵ㇇⌅ቡᱟ㺘 9-1 ѝ᧿䘠Ⲵ㇇⌅DŽ൘ DeJong et al.˄1993˅ᣕ੺Ⲵᇎ傼ѝˈ


ߣᇊ䙊䗷Ӕ৹ᴯᦒ⡦ԓ∄ֻⲴ৲ᮠ r 㻛䇮㖞Ѫ 0.06DŽߣᇊਈᔲ⦷Ⲵ৲ᮠ m 㻛䇮㖞Ѫ 0.001DŽ
䘉ᱟ䘉Ӌ৲ᮠⲴިර䇮㖞DŽ㗔փབྷሿ p Ӿ 100 ࡠ 1000 нㅹˈ㿶⢩ᇊᆖҐԫ࣑㘼ᇊDŽ

GA ൘ GABIL ѝⲴާփᓄ⭘ਟԕ㻛ᾲᤜѪԕлࠐ⛩˖

㺘⽪ ൘GABILѝ⇿њ‫ٷ‬䇮ሩᓄҾањભ仈㿴ࡉⲴ᷀ਆ䳶ˈᒦ᤹➗ 9.2.1 㢲᧿䘠Ⲵᯩ


⌅㕆⸱DŽ⺞࠷ൠ䇢ˈ㿴ࡉࡽԦⲴ‫ٷ‬䇮オ䰤⭡ሩањപᇊⲴ኎ᙗ䳶Ⲵ㓖ᶏⲴਸਆ㓴ᡀˈቡ‫ࡽۿ‬
䶒᧿䘠Ⲵ䛓ṧDŽѪҶ㺘⽪㿴ࡉ䳶ˈঅњ㿴ࡉⲴսѢ㺘⽪㻛䘎᧕䎧ᶕDŽֻྲˈ㘳㲁䘉ṧањ‫ٷ‬
䇮オ䰤ˈަѝ㿴ࡉⲴࡽԦᱟሩєњᐳቄ኎ᙗa1઼a2Ⲵ㓖ᶏⲴਸਆDŽ㿴ࡉⲴਾԦᱟ⭘অњⲴս
᧿䘠Ⲵˈ㺘⽪ⴞḷ኎ᙗcⲴ亴⍻٬DŽҾᱟˈ⭡єњ㿴ࡉ㓴ᡀⲴ‫ٷ‬䇮˖

IF a1=T ša2=F THEN c=T˗IF a2=T THEN c=F

ሶ㻛㺘⽪ѪѢ˖

ķ
䈁⌘˖ 䖞ⴈ䍼ᱟᤷа⿽䍼ঊ㘵ᢃ䍼䖜ⴈк᯻䖜Ⲵሿ⨳ሶ‫→ڌ‬Ҿⴈкଚањ‭޵Ⲵ⑨ᠿˈ䘉䟼Ⲵਜ਼ѹ
ᱟᾲ⦷བྷⲴ‫ٷ‬䇮ঐᦞⴈк䖳བྷⲴᡷ४ˈഐ㘼㻛䘹ѝⲴᵪՊ䖳བྷDŽ
a1 a2 c a1 a2 c
10 01 1 11 10 0
⌘᜿սѢⲴ䮯ᓖ䲿⵰‫ٷ‬䇮ѝ㿴ࡉⲴᮠ䟿໎䮯DŽ⭡ҾսѢ䮯ᓖⲴਟਈᙗˈ䴰㾱ሩӔ৹㇇ᆀ
֌ቁ䇨‫؞‬᭩ˈ䘉ሶ൘л䶒᧿䘠DŽ

䚇Ր㇇ᆀ GABIL֯⭘㺘 9-2 ѝⲴḷ߶ਈᔲ㇇ᆀˈ䲿ᵪ䘹ਆањսˈᒦ⭘ᆳⲴ৽⸱ਆ


ԓ䘉аսDŽGABIL֯⭘ⲴӔ৹㇇ᆀᱟ㺘 9-2 ᧿䘠Ⲵє⛩Ӕ৹㇇ᆀⲴањ⴨ᖃḷ߶ⲴᢙኅDŽ⺞
࠷ൠ䇢ˈѪҶ䘲ᓄ㕆⸱㿴ࡉ䳶ⲴսѢⲴ䮯ᓖਟਈᙗˈᒦф䲀ࡦ㌫㔏ԕ֯Ӕ৹ӵਁ⭏൘սѢⲴ
⴨լ⡷⇥䰤ˈ䟷ਆҶл䶒Ⲵ࣎⌅DŽ俆‫ݸ‬൘ㅜањৼӢѢк䲿ᵪ䘹ਆєњӔ৹⛩ˈᆳԜѻ䰤ࡂ
࠶ࠪҶањսѢ⡷⇥DŽ⭡ҾսѢ㺘⽪Ⲵᱟањ㿴ࡉ䳶ˈᡁԜਟԕḷ䇠ࠪަѝ⇿њ㿴ࡉⲴ䗩⭼DŽ
䘉њսѢ⡷⇥ਟ㜭䐘䎺㤕ᒢњ㿴ࡉ䗩⭼DŽ❦ਾԔd1㺘⽪⡷⇥Ⲵᴰᐖаսࡠᆳᐖ‫ח‬ㅜањ㿴ࡉ
䗩⭼Ⲵ䐍⿫DŽd2㺘⽪⡷⇥Ⲵᴰਣаսࡠᆳᐖ‫ח‬ㅜањ㿴ࡉ䗩⭼Ⲵ䐍⿫DŽ᧕лᶕˈ൘ㅜҼњৼ
Ӣк䲿ᵪ䘹ਆӔ৹⛩ˈਚ㾱䘹ᤙⲴӔ৹⛩ާᴹ਼ṧⲴd1઼d2٬DŽֻྲˈྲ᷌єњৼӢѢᱟ

a1 a2 c a1 a2 c
h1˖ 10 01 1 11 10 0

a1 a2 c a1 a2 c
h2˖ 01 11 0 10 01 0

ᒦфѪㅜањৼӢ䘹ਆӔ৹⛩ս㖞ᱟㅜ 1 ઼ㅜ 8 սˈྲлᡰ⽪˖

a1 a2 c a1 a2 c
h1˖ 1[0 01 1 11 1]0 0

ަѝĀ[ā઼Ā]ā㺘⽪Ӕ৹⛩ˈ䛓Ѹd1=1 ᒦфd2=3DŽᡰԕˈ‫ݱ‬䇨䘹ਆⲴㅜҼњৼӢӔ৹⛩Ⲵ
ս㖞ᴹ<1, 3>ˈ<1, 8>઼<6, 8>DŽྲ᷌ᚠᐗ䘹ਆҶ<1ˈ3>ˈ

a1 a2 c a1 a2 c
h2˖ 0[1 1]1 0 10 01 0

䛓Ѹ㔃᷌⭏ᡀⲴєњਾԓᱟ

a1 a2 c
h3˖ 11 10 0

a1 a2 c a1 a2 c a1 a2 c
h4˖ 00 01 1 11 11 0 10 01 0

ྲ↔ֻᡰ⽪ˈ䘉⿽Ӕ৹ᯩ⌅ѝਾԓਟԕवਜ਼оৼӢн਼ᮠ䟿Ⲵ㿴ࡉˈ਼ᰦ‫؍‬䇱Ҷ᤹䘉⿽ᯩᔿ
ӗ⭏ⲴսѢ㺘⽪㢟ᇊѹⲴ˄well-defined˅㿴ࡉ䳶DŽ

䘲ᓄᓖ࠭ᮠ ⇿њ㿴ࡉ䳶Ⲵ䘲ᓄᓖᱟṩᦞᆳ൘䇝㓳ᮠᦞкⲴ࠶㊫㋮ᓖ䇑㇇ⲴDŽ⺞࠷ൠ䇢ˈ
ᓖ䟿䘲ᓄᓖⲴ࠭ᮠᱟ˖

Fitness(h)=(correct(h))2

ަѝˈcorrect(h)ᱟ‫ٷ‬䇮 h ࠶㊫ᡰᴹ䇝㓳ṧֻⲴ↓⺞⦷DŽ
൘∄䖳 GABIL ઼‫ ۿ‬C4.5 ઼ ID5R 䘉ṧⲴߣㆆṁᆖҐ㇇⌅ԕ৺㿴ࡉᆖҐ㇇⌅ AQ14 Ⲵᇎ
傼ѝˈṩᦞሩн਼ᆖҐԫ࣑Ⲵ⍻䈅ˈDeJong et al.˄1993˅ᣕ੺Ҷ䘉Ӌ㌫㔏ާᴹབྷփ⴨ᖃⲴ
ᙗ㜭DŽֻྲˈሩӪѪ䇮䇑Ⲵ 12 њ䰞仈ˈGABIL 䗮ࡠҶ 92.1%Ⲵᒣ൷⌋ॆ㋮ᓖˈ㘼ަԆ㌫㔏
ⲴⲴᙗ㜭ᱟ൘ 91.2%ࡠ 96.6%ѻ䰤DŽ

9.3.1 ᢟኋ

DeJong et al.˄1993˅ѝҏ᧒㍒Ҷሩ GABIL สᵜ䇮䇑Ⲵєњᴹ䏓ⲴᢙኅDŽ൘а㓴ᇎ傼ѝˈ


ԆԜ⹄ウҶਖཆєњᯠⲴ䚇Ր㇇ᆀˈ䘉єњ㇇ᆀਇࡠҶᖸཊㅖਧᆖҐᯩ⌅ѝᑨ㿱Ⲵ⌋ॆ㇇ᆀ
Ⲵ੟ਁDŽㅜањ㇇ᆀѪ AddAlternativeˈᆳ⌋ॆሩḀњ⢩ᇊ኎ᙗⲴ㓖ᶏˈᯩ⌅ᱟᢺ䘉њ኎ᙗ
ሩᓄⲴᆀѢѝⲴањ 0 ᭩Ѫ 1DŽֻྲˈྲ᷌ањ኎ᙗⲴ㓖ᶏ֯⭘Ѣ 10010 㺘⽪ˈ䛓Ѹ䘉њ㇇
ᆀਟ㜭ᢺᆳ᭩Ѫ 10110DŽ䘉њ㇇ᆀ൘⇿аԓ㗔փѝሩ䘹ᇊⲴᡀઈ᤹➗ 0.01 Ⲵᾲ⦷ᓄ⭘DŽㅜҼ
њ㇇ᆀѪ DropConditionˈᆳ䟷⭘а⿽ᴤ࣐ᶱㄟⲴ⌋ॆ᧚ᯭˈᢺањ⢩ᇊ኎ᙗⲴᡰᴹս䜭ᴯ
ᦒѪ 1DŽ䘉њ㇇ᆀ⴨ᖃҾ䙊䗷ᆼ‫ޘ‬᫔䬰኎ᙗ㓖ᶏᶕ⌋ॆ㿴ࡉˈᆳ᤹➗ᾲ⦷ 0.60 ൘⇿аԓѝᓄ
⭘DŽDeJong et al.˄1993˅ѝᣕ੺Ҷ䘉њ᭩䘋Ⲵ㌫㔏ሩҾк䶒ᡰ䈤ⲴӪѪ䇮䇑ԫ࣑䗮ࡠҶ 95.2%
Ⲵᒣ൷⌋ॆ㋮ᓖˈ⴨∄䖳สᵜⲴ GA Ѫ 92.1%DŽ

൘к䶒Ⲵᇎ傼ѝˈєњ㇇ᆀሩ⇿аԓ㗔փѝⲴ⇿њ‫ٷ‬䇮ᱟԕ਼ṧⲴᾲ⦷ᓄ⭘ⲴDŽ൘ਖа
њᇎ傼ѝˈሩ‫ٷ‬䇮ⲴսѢ㺘⽪䘋㹼Ҷᢙኅˈ֯ަवਜ਼ਖཆєսԕߣᇊᱟ੖ਟԕሩ䈕‫ٷ‬䇮ᓄ⭘
䘉єњ㇇ᆀDŽ൘䘉њᢙኅⲴ㺘⽪ѝˈањިරⲴ㿴ࡉ䳶‫ٷ‬䇮ⲴսѢѪ

a1 a2 c a1 a2 c AA DC
01 11 0 10 01 0 1 0
ަѝᴰਾⲴєњս㺘⽪൘䘉⿽ᛵߥлਟԕሩ䈕Ѣᓄ⭘ AddAlternative ㇇ᆀˈ㘼нਟԕᓄ⭘
DropCondition ㇇ᆀDŽ䘉єњᯠⲴսᇊѹҶ䜘࠶Ⲵ GA ᩌ㍒ㆆ⮕ˈ㘼фᆳԜᵜ䓛ҏ઼ѢѝⲴ
ަԆսа䎧㻛਼ṧⲴӔ৹઼ਈᔲ㇇ᆀ‫؞‬᭩઼䘋ॆDŽDeJong et al.˄1993˅ᣕ੺Ҷ䘉⿽ᯩ⌅Ⲵ
㔃᷌Ո࣓৲ॺ˄ҏቡᱟሩḀӋ䰞仈ᨀ儈Ҷᙗ㜭ˈሩަԆ䰞仈䱽վҶᙗ㜭˅ˈᆳֻ⽪Ҷ GA ൘
৏ࡉкᱟྲօ֯ަ‫ٷ‬䇮Ⲵᩌ㍒ᯩ⌅䘋ॆⲴDŽ

9.4 ‫ٽ‬䇴グ䰪ᩒ㍘

ྲкᡰ⽪ˈGA 䟷⭘а⿽䲿ᵪॆⲴḡ⣦ᩌ㍒ᶕራ᢮ᴹᴰབྷ䘲ᓄᓖⲴ‫ٷ‬䇮DŽ䘉⿽ᩌ㍒оᵜ
Җѝᐢ㘳㲁ⲴަԆᆖҐᯩ⌅Ⲵᩌ㍒ᆼ‫ޘ‬н਼DŽֻྲˈ∄䖳 GA ֯⭘Ⲵᩌ㍒オ䰤઼⾎㓿㖁㔌৽
ੁՐ᫝㇇⌅֯⭘Ⲵᩌ㍒オ䰤˖൘৽ੁՐ᫝㇇⌅ѝˈởᓖл䱽ᩌ㍒Ӿањ‫ٷ‬䇮ᒣ━〫ࣘࡠањ
䶎ᑨ⴨լⲴᯠ‫ٷ‬䇮DŽо↔н਼ˈGA ᩌ㍒Ⲵ〫ࣘਟ㜭䶎ᑨケ❦ˈ֯⭘઼ৼӢṩᵜн਼Ⲵਾԓ
ᴯᦒৼӢ‫ٷ‬䇮DŽ⌘᜿ GA ᩌ㍒ഐ↔нཚਟ㜭‫ۿ‬ởᓖл䱽ᯩ⌅䛓ṧާᴹ䲧‫ޕ‬ተ䜘ᴰሿ٬Ⲵ䰞
仈DŽ

൘аӋ GA ᓄ⭘ѝˈањᇎ䐥кⲴ䳮仈ᱟᤕᥔ˄crowding˅䰞仈DŽᤕᥔᱟ䘉ṧа⿽⧠䊑ˈ
㗔փѝḀањփ䘲ᓄᓖབྷབྷ儈ҾަԆњփˈഐ↔ᆳ䗵䙏㑱⇆ˈԕ㠣Ҿ䘉њњփ઼оᆳ⴨լⲴ
њփঐᦞҶ㗔փⲴ㔍བྷ䜘࠶DŽᤕᥔⲴн㢟ᖡ૽ᱟ䱽վҶ㗔փⲴཊṧᙗ˄diversity˅ˈӾ㘼߿ធ
Ҷ GA Ⲵ䘋а↕䘋ॆDŽӪԜᐢ㓿᧒㍒Ҷ㤕ᒢ䱽վᤕᥔⲴㆆ⮕DŽа⿽ᯩ⌅ᱟ‫؞‬᭩䘹ᤙ࠭ᮠˈ֯
⭘‫ۿ‬䭖ḷ䎋䘹ᤙᡆᧂ਽䘹ᤙ䘉ṧⲴ߶ࡉਆԓ䘲ᓄᓖ∄ֻ䖞ⴈ䍼䘹ᤙDŽањ⴨‫Ⲵޣ‬ㆆ⮕ᱟĀ䘲
ᓄᓖ‫ޡ‬ӛ˄fitness sharing˅
āˈަѝṩᦞ㗔փѝоḀњփ⴨լⲴњփᮠ䟿ˈ߿ሿ䈕њփⲴ䘲ᓄ
ᓖDŽㅜй⿽ᯩ⌅ᱟሩਟ䟽㓴⭏ᡀਾԓⲴњփ⿽㊫䘋㹼䲀ࡦDŽֻྲˈ䙊䗷ਚ‫ݱ‬䇨ᴰ⴨լⲴњփ
䟽㓴ˈਟԕ൘㗔փѝ‫׳‬ᡀ⴨լⲴњփ㚊㊫ˈᡆཊњӊ⿽˄subspecies˅DŽа⿽⴨‫Ⲵޣ‬ᯩ⌅ᱟ᤹
オ䰤࠶ᐳњփˈᒦфӵ‫ݱ‬䇨⴨䛫Ⲵњփ䟽㓴DŽ䘉Ӌᢰᵟᖸཊ䜭ᱟਇࡠҶ⭏⢙䘋ॆⲴ੟⽪DŽ

9.4.1 㗚։䘑ौૂ⁗ᕅ⨼䇰

н࿘ᙍ㘳ањᴹ䏓Ⲵ䰞仈˖ᱟ੖㜭⭘ᮠᆖⲴᯩ⌅࡫⭫ GA ѝ㗔փ䲿ᰦ䰤䘋ॆⲴ䗷〻˛
Holland˄1975˅Ⲵ⁑ᔿ৏⨶˄schema theorem˅ᨀ‫׋‬Ҷа⿽࡫⭫ᯩ⌅DŽᆳสҾ᧿䘠սѢ䳶ਸ
Ⲵ⁑ᔿ˄schemaˈᡆ pattern˅DŽ㋮⺞ൠ䇢ˈањ⁑ᔿᱟ⭡㤕ᒢ 0ǃ1 ઼*㓴ᡀⲴԫ᜿ѢDŽĀ*ā
㺘⽪ањн‫ޣ‬ᗳⲴսDŽֻྲ⁑ᔿ 0*10 㺘⽪ⲴսѢ䳶ਸѝਚवਜ਼ 0010 ઼ 0110DŽ

অњսѢਟԕ㻛ⴻ֌оᆳ३䝽Ⲵ⇿њ⁑ᔿⲴԓ㺘DŽֻྲˈսѢ 0010 ਟԕ㻛䇔Ѫ 24њ⴨


ᔲ⁑ᔿⲴԓ㺘ˈֻྲ 00**ˈ0*10ˈ****ㅹDŽ㊫լൠˈањսѢⲴ㗔փਟԕ㻛ⴻ֌˖սѢᡰ
ԓ㺘Ⲵ⁑ᔿⲴ䳶ਸˈԕ৺о⇿њ⁑ᔿ‫ޣ‬㚄Ⲵњփᮠ䟿DŽ

⁑ᔿ⨶䇪ṩᦞ⇿њ⁑ᔿⲴᇎֻᮠ䟿ᶕ࡫⭫ GA ѝ㗔փⲴ䘋ॆDŽԔ m(s, t)㺘⽪㗔փѝⲴ⁑


ᔿ s ൘ᰦ䰤 t˄ҏቡᱟ൘ㅜ t ԓᵏ䰤˅Ⲵᇎֻᮠ䟿DŽ⁑ᔿ⨶䇪ṩᦞ m(s, t)઼⁑ᔿǃ㗔փ৺ GA
৲ᮠⲴަԆ኎ᙗˈᶕ᧿䘠 m(s, t+1)Ⲵᵏᵋ٬DŽ

GAѝ㗔փⲴ䘋ॆ‫׍‬䎆Ҿࠐњ↕僔ˈণ䘹ᤙ↕ǃ䟽㓴↕઼ਈᔲ↕DŽ‫ݸ‬Ӿਚ㘳㲁䘹ᤙ↕Ⲵ

ᖡ૽ᔰ࿻DŽ֯⭘f(h)㺘⽪սѢњփhⲴ䘲ᓄᓖˈᒦ⭘ f (t)㺘⽪൘ᰦ䰤t㗔փѝᡰᴹњփⲴᒣ൷

䘲ᓄᓖDŽ䇮nѪ㗔փѝњփⲴᙫᮠ䟿DŽ֯⭘hspt㺘⽪њփhᰒᱟ⁑ᔿsⲴањԓ㺘ˈ৸ᱟᰦ
䰤t㗔փⲴањᡀઈDŽᴰਾˈԔ uˆ (s, t)㺘⽪൘ᰦ䰤t㗔փѝ⁑ᔿsⲴᇎֻⲴᒣ൷䘲ᓄᓖDŽ

ᡁԜᝏ‫ޤ‬䏓Ⲵᱟ m(s, t+1)Ⲵᵏᵋ٬ˈ⭘ E[m(s, t+1)]ᶕ㺘⽪DŽਟԕ֯⭘‫ޜ‬ᔿ˄9.1˅ѝ㔉


ࠪⲴᾲ⦷࠶ᐳᶕ䇑㇇ E[m(s, t+1)]ˈᒦ֯⭘ⴞࡽⲴㅖਧᢺᆳ䟽ᯠ㺘⽪ᡀྲлᖒᔿ˖

f ( h)
Pr(h)
¦
n
i 1
f (hi )
f (h)
nf (t )

⧠൘ྲ᷌ṩᦞ䘉њᾲ⦷࠶ᐳ䘹ᤙᯠ㗔փⲴањᡀઈˈ䛓Ѹ䘹ࡠ⁑ᔿ s Ⲵањԓ㺘Ⲵᾲ⦷
ᱟ˖

f ( h)
Pr( h  s ) ¦
hs ˆ pt nf (t )
˄9.2˅
uˆ ( s, t )
m( s, t )
nf (t )

к䶒ⲴㅜҼ↕ṩᦞԕлⲴᇊѹ㘼ᗇ˖
uˆ ( s, t )
¦ hs ˆ pt
f ( h)
m( s , t )

‫ޜ‬ᔿ˄9.2˅㔉ࠪҶ GA 䘹ᤙⲴањ‫ٷ‬䇮ᱟ⁑ᔿ s ⲴᇎֻⲴᾲ⦷DŽᡰԕˈሩҾӗ⭏ᮤњ


ᯠаԓⲴ n ⅑⤜・䘹ᤙ↕ˈᗇࡠⲴ s ⲴᇎֻⲴᵏᵋᮠ䟿ቡᱟ䘉њᾲ⦷Ⲵ n ‫ؽ‬DŽ

uˆ ( s, t )
E[m(s, t+1)]= m(s, t) ˄9.3˅
f (t )

‫ޜ‬ᔿ˄9.3˅㺘᰾ˈ൘ t+1 ԓѝ⁑ᔿ s Ⲵᇎֻᵏᵋᮠ䟿ˈо൘ᰦ䰤 t 䘉њ⁑ᔿⲴᇎֻⲴᒣ

൷䘲ᓄᓖ û (s, t)ᡀ↓∄ˈᒦоᰦ䰤 t ѝ㗔փⲴᡰᴹᡀઈⲴᒣ൷䘲ᓄᓖ f (t)ᡀ৽∄DŽഐ↔ˈᡁ

Ԝਟԕᵏᵋˈ൘ਾ㔗Ⲵ਴ԓѝ儈Ҿᒣ൷䘲ᓄᓖⲴ⁑ᔿࠪ⧠仁⦷Պॷ儈DŽྲ᷌ᡁԜᢺ GA ⴻ֌ˈ
൘ሩњփオ䰤䘋㹼ᱮᔿᩌ㍒Ⲵ਼ᰦˈሩਟ㜭⁑ᔿオ䰤䘋㹼⵰㲊ᤏⲴᒦ㹼ᩌ㍒ˈ䛓Ѹ‫ޜ‬ᔿ˄9.3˅
ᤷࠪ䘲ᓄᓖ儈Ⲵ⁑ᔿⲴᖡ૽࣋Պ䲿⵰ᰦ䰤໎࣐DŽ

❦㘼к䶒Ⲵ࠶᷀ӵ㘳㲁 GA ѝ䘹ᤙ↕Ⲵᖡ૽ˈᡰԕҏᓄ䈕㘳㲁Ӕ৹઼ਈᔲ↕Ⲵᖡ૽DŽ⁑
ᔿ⨶䇪ӵ㘳㲁䘉Ӌ㇇ᆀਟ㜭䙐ᡀⲴ䍏䶒ᖡ૽˄ֻྲˈ䲿ᵪਈᔲਟ㜭䱽վ s Ⲵԓ㺘ᮠ䟿ˈ⤜・
Ҿ uˆ (s,t)˅ˈᒦфӵ㘳㲁অ⛩Ӕ৹ⲴᛵߥDŽᡰԕᆼᮤⲴ⁑ᔿ⨶䇪㔉ࠪҶ⁑ᔿ s Ⲵᵏᵋ仁⦷Ⲵл
⭼ˈྲлᡰ⽪˖

uˆ ( s, t ) § d (s) ·
E[m( s, t  1)] t m( s, t )¨1  pc ¸(1  p m )
o( s )
˄9.4˅
f (t ) © l 1 ¹

䘉䟼ˈpcᱟሩԫ᜿њփᓄ⭘অ⛩Ӕ৹㇇ᆀⲴᾲ⦷ˈpmᱟሩԫ᜿њփⲴԫ᜿ս֯⭘ਈᔲ㇇
ᆀ䘋㹼ਈᔲⲴᾲ⦷DŽo(s)ᱟ⁑ᔿsѝ⺞ᇊս˄defined bits˅Ⲵњᮠˈ0 ઼ 1 ᱟ⺞ᇊⲴսˈ*нᱟDŽ
d(s)ᱟ⁑ᔿsѝᴰᐖ䗩Ⲵ⺞ᇊս઼ᴰਣ䗩Ⲵ⺞ᇊս䰤Ⲵ䐍⿫DŽᴰਾˈlᱟ൘㗔փѝњփսѢ䮯
ᓖDŽ⌘᜿ˈ‫ޜ‬ᔿ˄9.4˅ѝⲴᴰᐖа亩о‫ޜ‬ᔿ˄9.3˅ᱟаṧⲴˈ䘉а亩᧿䘠Ҷ䘹ᤙ↕僔Ⲵᖡ
૽DŽѝ䰤а亩᧿䘠Ҷঅ⛩Ӕ৹㇇ᆀⲴᖡ૽ˈ⢩࡛٬ᗇ⌘᜿Ⲵᱟˈ䘉а亩᧿䘠Ҷԓ㺘sⲴԫ᜿
њփ൘ᓄ⭘ҶӔ৹㇇ᆀਾ䘈㺘⽪sⲴᾲ⦷DŽᴰਣа亩᧿䘠Ҷԓ㺘⁑ᔿsⲴԫ᜿њփ൘ᓄ⭘Ҷਈ
ᔲ㇇ᆀਾ䘈㺘⽪sⲴᾲ⦷DŽঅ⛩Ӕ৹઼ਈᔲⲴᖡ૽䲿⵰⁑ᔿѝ⺞ᇊսⲴᮠ䟿o(s)઼⺞ᇊս䰤Ⲵ
䐍⿫d(s)໎䮯DŽഐ↔ˈਟԕ⁑ᔿ⨶䇪ਟԕ㻛㋇⮕ൠ䀓䟺Ѫ˖ᴤ儈䘲ᓄᓖⲴ⁑ᔿⲴᖡ૽࣋䎻ੁ
໎བྷˈቔަᱟवਜ਼䖳ቁᮠ䟿Ⲵ⺞ᇊս˄ҏቡᱟवਜ਼བྷ䟿Ⲵ*˅Ⲵ⁑ᔿ઼䘉Ӌ⺞ᇊս൘սѢѝ
ᖬ↔䶐䘁Ⲵ⁑ᔿDŽ

ሩ GA ѝⲴ㗔փ䘋ॆ䗷〻ˈ⁑ᔿ⨶䇪ਟ㜭ᱟ㻛ᕅ⭘ᗇᴰᒯ⌋Ⲵ࡫⭫ᯩᔿDŽᆳнᆼ༷Ⲵа
䶒ᱟᰐ⌅㘳㲁Ӕ৹઼ਈᔲⲴ˄བྷᾲⲴ˅↓䶒ᖡ૽DŽᴰ䘁ӪԜᐢ㓿ᨀࠪҶᖸཊᯠⲴ⨶䇪࠶᷀ˈ
वᤜสҾ傜ቄਟཛ䬮⁑ර˄Markov chain model˅઼㔏䇑࣋ᆖ⁑ර˄statistical mechanics
models˅Ⲵ࠶᷀DŽֻྲਟԕ৲㿱 Whitley & Vose˄1995˅઼ Mitchell˄1996˅DŽ

9.5 䚍Ֆ㕌ぁ

䚇Ր㕆〻˄Genetic ProgrammingˈGP˅ᱟ䘋ॆ䇑㇇Ⲵа⿽ᖒᔿˈަѝ䘋ॆ㗔փѝⲴњ
փᱟ䇑㇇ᵪ〻ᒿ㘼нᱟսѢDŽKoza˄1992˅᧿䘠ҶสᵜⲴ䚇Ր㕆〻ᯩ⌅ᒦф㔉ࠪҶᖸཊㆰ
অⲴਟԕ㻛 GP ᡀ࣏ᆖҐⲴ〻ᒿDŽ

9.5.1 ぁᓅ㺞⽰

GP ᫽֌Ⲵ〻ᒿа㡜㻛㺘⽪Ѫ〻ᒿⲴ䀓᷀˄parse˅ṁDŽ⇿њ࠭ᮠ䈳⭘㻛㺘⽪ѪṁⲴањ

㢲⛩ˈ࠭ᮠⲴ৲ᮠ䙊䗷ᆳⲴᆀ㔃⛩㔉ࠪDŽֻྲˈമ 9-1 ⭫ࠪҶ࠭ᮠ sin(x)+ x  y Ⲵṁ㺘⽪DŽ


2

ѪҶᓄ⭘䚇Ր㕆〻ࡠḀњ⢩ᇊⲴ亶ฏˈ⭘ᡧᗵ享ᇊѹᖵ㘳㲁Ⲵ৏ᆀ࠭ᮠ˄primitive functions˅
˄ֻྲˈsinˈcosˈᔰᯩˈ+ˈ-ˈᤷᮠ˅ˈԕ৺ㄟ⛩˄terminals˅
˄ֻྲ xǃy ԕ৺ᑨᮠ˅DŽ᧕л
ᶕˈ䚇Ր㕆〻㇇⌅֯⭘䘋ॆᩌ㍒ˈᶕ᧒㍒֯⭘䘉Ӌ৏ᆀ᧿䘠Ⲵ〻ᒿⲴᐘབྷオ䰤DŽ

о൘䚇Ր㇇⌅ѝаṧˈ৏රⲴ䚇Ր㕆〻㇇⌅㔤ᣔ⭡ཊњњփ˄൘䘉䟼ᱟ〻ᒿṁ˅㓴ᡀⲴ
㗔փDŽ൘⇿а↕䘝ԓѝˈᆳ֯⭘䘹ᤙǃӔ৹઼ਈᔲӗ⭏ᯠаԓњփDŽ㗔փѝḀњփ〻ᒿⲴ䘲
ᓄᓖа㡜䙊䗷൘䇝㓳ᮠᦞкᢗ㹼䘉њ〻ᒿᶕߣᇊDŽӔ৹᫽֌ᱟ䘉ṧ䘋㹼Ⲵ˖൘ањৼӢ〻ᒿ
ѝ䲿ᵪ䘹ᤙањᆀṁˈ❦ਾ⭘ਖањৼӢⲴᆀṁᴯԓ䘉њᆀṁDŽമ 9-2 ╄⽪ҶањިරⲴӔ
৹᫽֌DŽ

插图——原书页码:262

മ 9-1 䚇Ր㕆〻ѝⲴ〻ᒿṁ㺘⽪

ԫ᜿〻ᒿਟԕ㺘⽪ѪᆳԜⲴ䀓᷀ṁDŽ

插图——原书页码:263

മ 9-2 ሩєњৼӢ〻ᒿṁ䘋㹼Ӕ৹᫽֌

ৼӢ〻ᒿṁᱮ⽪൘кᯩˈᆙᆀṁ൘лᯩDŽӔ৹⛩˄к䗩࣐㋇ᱮ⽪Ⲵ㢲⛩˅ᱟ䲿ᵪ䘹ਆⲴDŽ❦ਾԕ䘉
ӋӔ৹⛩ѪṩⲴᆀṁӂᦒԕӗ⭏ᆙᆀṁDŽ

Koza˄1992˅᧿䘠Ҷᓄ⭘ GP ࡠཊњԫ࣑Ⲵᇎ傼DŽ൘ԆⲴᇎ傼ѝˈṩᦞ䘲ᓄᓖᾲ⦷䘹ᤙ
ᖃࡽ㗔փⲴ 10%н࣐᭩ਈⲴ‫ࡠ⮉؍‬лаԓDŽ޽ṩᦞ䘲ᓄᓖᾲ⦷Ӿᖃࡽ㗔փѝ䘹ᤙ〻ᒿሩˈ
ᓄ⭘Ӕ৹᫽֌ӗ⭏ᯠаԓⲴަ։䜘࠶DŽ൘䘉њᇎ傼㌫ࡇѝ⋑ᴹ֯⭘ਈᔲ㇇ᆀDŽ

9.5.2 ⽰ׁ

Koza˄1992˅㔉ࠪⲴањ⽪ֻᱟᆖҐањ㇇⌅ᶕึ⸼മ 9-3 ᡰ⽪ⲴᆇඇDŽ䘉њԫ࣑ᱟᔰ


ਁањ䙊⭘Ⲵ㇇⌅ᶕᢺᆇඇึਐᡀঅњḸ˄stack˅ˈ᤬ࠪঅ䇽Āuniversalāˈᰐ䇪䘉Ӌᆇඇࡍ
࿻Ⲵ㔃ᶴྲօDŽਟᢗ㹼Ⲵࣘ֌ᱟ⇿⅑ਚ‫ݱ‬䇨〫ࣘањᆇඇDŽ⺞࠷ൠ䇢ˈ൘Ḹѝᴰк䶒Ⲵᆇඇ
ਟԕ㻛〫ࡠṼ䶒кˈᡆ㘵Ṽ䶒кⲴᆇඇਟԕ㻛〫ࣘࡠḸ亦DŽ
插图——原书页码:264

മ 9-3 ањᆇඇึਐ䰞仈

䘉њ䚇Ր㕆〻Ⲵԫ࣑ᱟਁ⧠ањ〻ᒿˈਟԕᢺᴹԫ᜿ࡍ࿻㔃ᶴⲴᆇඇਈᦒᡀањḸ᤬ࠪঅ䇽
ĀuniversalāDŽᒦᨀ‫׋‬Ҷ 166 ⿽ࡍ࿻㔃ᶴᶕ䇴ՠ‫ى‬䘹〻ᒿⲴ䘲ᓄᓖ˄᪈㠚 Koza 1992˅DŽ

൘བྷཊᮠ GP ᓄ⭘ѝˈ䰞仈㺘⽪ᯩ⌅Ⲵ䘹ᤙሩҾ亪࡙ൠ䀓ߣ䰞仈䎧⵰䶎ᑨ䟽㾱Ⲵ֌⭘DŽ
൘ Koza Ⲵ䇮䇑ѝˈ⭘ԕ㓴ᡀ〻ᒿⲴ৏ᆀ࠭ᮠवਜ਼л䶒Ⲵйњㄟ⛩৲ᮠ˖
x CS˄current stack˅˖ᖃࡽḸˈᤷḸ亦ᆇඇⲴ਽ᆇˈᡆ⋑ᴹᖃࡽḸᰦѪ FDŽ
x TB˄top correct bloack˅˖ᴰк↓⺞ᆇඇˈᤷ䈕ᆇඇ઼ᆳԕлᆇඇ൷Ѫ↓⺞
亪ᒿⲴᆇඇDŽ
x NN˄next necessary˅˖лањᡰ䴰ᆇඇˈᤷѪҶ᤬ᡀঅ䇽ĀuniversalāˈḸ
޵㍗䛫 TB ѻкⲴᡰ䴰ᆇඇⲴ਽ᆇˈᡆ㘵ᖃн޽䴰㾱ᆇඇᰦѪ FDŽ

ਟԕⴻࠪˈ䘹ᤙ䘉ṧⲴㄟ⛩৲ᮠሩҾ᧿䘠↔ԫ࣑Ⲵᆇඇ᫽㓥〻ᒿᨀ‫׋‬Ҷа⿽㠚❦Ⲵ㺘
⽪DŽ⴨৽ˈ䇮ᜣྲ᷌ᢺ⇿њᆇඇⲴ xǃy ඀ḷᇊѹѪㄟ⛩৲ᮠˈ䛓Ѹ㾱ᇎ⧠䘉њԫ࣑⴨ሩ㾱
ഠ䳮ᗇཊDŽ

䲔Ҷ䘉Ӌㄟ⛩৲ᮠˈ䘉њᓄ⭘ѝⲴ〻ᒿ䈝䀰䘈वᤜл䶒Ⲵ৏ᆀ࠭ᮠ˖
x ˄MS x˅˄move to stack˅˖〫ࣘࡠḸDŽྲ᷌ᆀඇ x ൘Ṽ䶒кˈ䘉њ᫽֌ᢺ
x 〫ࣘࡠḸ亦ᒦф䘄എ TDŽ੖ࡉˈᆳӰѸҏн‫ڊ‬ᒦф䘄എ FDŽ
x ˄MT x˅˄move to table˅˖〫ࣘࡠṼ䶒DŽྲ᷌ᆇඇ x ᱟ൘ḸѝḀњս㖞ˈ
䘉њ᫽֌ᢺḸ亦Ⲵᆇඇ〫ࣘࡠṼ䶒ᒦф䘄എ TDŽ੖ࡉ䘄എ FDŽ
x ˄EQ x y˅˄equal˅˖⴨ㅹˈྲ᷌ x ㅹҾ y 䘄എ Tˈ੖ࡉ䘄എ FDŽ
x ˄NOT x˅˖ྲ᷌ x=F 䘄എ Tˈྲ᷌ x=T 䘄എ FDŽ
x ˄DU x y˅˄do until˅˖৽༽ᢗ㹼㺘䗮ᔿ x ⴤࡠ㺘䗮ᔿ y 䘄എ TDŽ

ѪҶ䇴ՠԫ᜿㔉ᇊ〻ᒿⲴ䘲ᓄᓖˈKoza ᨀ‫׋‬Ҷ 166 њ䇝㓳䰞仈ˈ㺘⽪Ҷᖸཊ⿽н਼Ⲵ


ࡍ࿻ᆇඇ㔃ᶴˈ䰞仈Ⲵ䳮ᓖ਴ᔲDŽԫ᜿㔉ᇊ〻ᒿⲴ䘲ᓄᓖቡᱟᆳ䀓ߣҶⲴ䇝㓳䰞仈Ⲵᮠ䟿DŽ
㗔փ㻛ࡍ࿻ॆѪ 300 њ䲿ᵪ〻ᒿⲴ䳶ਸDŽ㓿䗷Ҷ 10 ԓਾˈ㌫㔏ਁ⧠Ҷл䶒Ⲵ〻ᒿ䀓ߣҶᡰ
ᴹ 166 њ䰞仈DŽ

˄EQ˄DU˄MT CS˅˄NOT CS˅˅˄DU˄MS NN˅˄NOT NN˅˅˅

⌘᜿䘉њ〻ᒿवਜ਼Ҷєњ DU˄ҏቡᱟĀDo Untilā˅䈝ਕⲴᒿࡇDŽㅜањ DU 䈝ਕᗚ⧟


ൠᢺᖃࡽⲴḸ亦ᆇඇ〫ࣘࡠṼ䶒ⴤࡠᢺḸ〫オDŽ❦ਾˈㅜҼњĀDo Untilā䈝ਕᗚ⧟ൠᢺл
ањᡰ䴰ᆇඇӾṼ䶒〫ࣘࡠḸ亦DŽ䘉䟼ᴰཆቲⲴ EQ 㺘䗮ᔿ䎧ࡠⲴ֌⭘ᱟᨀ‫׋‬ањਸ⌅Ⲵਕ
⌅ᶕᧂࡇ䘉єњĀDo Untilāᗚ⧟DŽ

ཊቁᴹӋԔӪ᛺ཷˈӵӵ㓿䗷Ҷࠐԓˈ䘉њ GP ቡਁ⧠Ҷ㜭䀓ߣᡰᴹ 166 њ䇝㓳䰞仈Ⲵ


〻ᒿDŽ㌫㔏Ⲵ䘉њ㜭࣋ᖸབྷ〻ᓖк‫׍‬䎆Ҿᨀ‫Ⲵ׋‬สᵜ৲ᮠ઼৏ᆀ࠭ᮠˈԕ৺⭘ᶕ䇴ՠ䘲ᓄᓖ
Ⲵ䇝㓳ṧֻ䳶ਸDŽ

9.5.3 䚍Ֆ㕌ぁ䈪᱄

↓ྲк䶒Ⲵֻᆀᡰ╄⽪Ⲵˈ䚇Ր㕆〻ᢺ䚇Ր㇇⌅ᢙኅࡠሩᆼᮤⲴ䇑㇇ᵪ〻ᒿⲴ䘋ॆDŽቭ
㇑ᆳᗵ享㾱ᩌ㍒ᐘབྷⲴ‫ٷ‬䇮オ䰤ˈնᐢ㓿䇱ᇎ൘⴨ᖃᮠ䟿Ⲵᓄ⭘ѝ䚇Ր㕆〻ӗ⭏ҶԔӪ⵰䘧
Ⲵ㔃᷌DŽO’Reilly and Oppacher˄1994˅∄䖳Ҷ GP ㇇⌅઼ަԆᩌ㍒䇑㇇ᵪ〻ᒿオ䰤Ⲵ㇇⌅ˈ
ֻྲ⡜ኡ⌅˄hill climbing˅઼⁑ᤏ䘰⚛⌅˄simulated annealing˅DŽ

ᖃ❦к䶒Ⲵ GP ㇇⌅ֻᆀᱟ⴨ᖃㆰঅⲴˈKoza et al.˄1996˅ᾲᤜҶ GP ㇇⌅൘аӋᴤ༽


ᵲⲴԫ࣑ѝⲴᓄ⭘ˈֻྲ䇮䇑⭥ᆀ└⌒⭥䐟઼࠶㊫㳻ⲭ䍘࠶ᆀ⡷⇥DŽ└⌒⭥䐟䇮䇑䰞仈ᨀ‫׋‬
Ҷањ⴨ᖃ༽ᵲⲴ䰞仈DŽ䘉䟼ˈ〻ᒿⲴ䘋ॆᱟӾㆰঅⲴപᇊ⿽ᆀ⭥䐟䖜ਈѪᴰ㓸Ⲵ⭥䐟䇮䇑DŽ
GP ㇇⌅ѝ㓴ᔪ〻ᒿⲴ৏ᆀ࠭ᮠ䙊䗷ᨂ‫ޕ‬ᡆࡐ䲔⭥䐟䴦Ԧ઼ሬ㓯䘎᧕ᶕ㕆䗁䘉њ⿽ᆀ⭥䐟DŽ
⇿њ〻ᒿⲴ䘲ᓄᓖᱟ䘉ṧ䇑㇇Ⲵ˖‫⁑ݸ‬ᤏ䘉њ⭥䐟Ⲵ䗃ࠪ˄֯⭘ SPICE ⭥䐟ԯⵏಘ˅ˈ❦ਾ
ⴻ䘉њ⭥䐟оᵏᵋⲴ䇮䇑Ⲵ䘲ᓄᓖⲴᐞ䐍DŽ㋮⺞ൠ䇢ˈ䘲ᓄᓖ࠶٬ᱟሩҾ 101 њн਼Ⲵ䗃‫ޕ‬
仁⦷ˈ䇑㇇ᇎ䱵⭥䐟䗃઼ࠪᵏᵋ⭥䐟䗃ࠪ䰤䈟ᐞ䟿Ⲵ઼DŽ൘䘉њֻᆀѝˈ㔤ᣔⲴ㗔փབྷሿᱟ
640,000ˈ䘹ᤙӗ⭏ 10%Ⲵਾԓ㗔փˈӔ৹ӗ⭏ 89%ˈਈᔲӗ⭏ 1%DŽ㌫㔏ᱟ൘аਠ 64 㢲⛩
Ⲵᒦ㹼༴⨶ᵪкᢗ㹼ⲴDŽ൘ᴰࡍⲴ䲿ᵪӗ⭏Ⲵ㗔փѝˈ⭥䐟ᱟྲ↔Ⲵнਸ⨶ԕ㠣Ҿ 98%Ⲵ
⭥䐟㹼Ѫᰐ⌅㻛 SPICE ԯⵏಘԯⵏDŽ൘ㅜаԓѻਾᰐ⌅ԯⵏⲴ⭥䐟ⲴⲮ࠶∄л䱽ࡠ 84.9%ˈ
ㅜҼԓਾл䱽ࡠ 75.0%ˈ޽л䱽ࡠਾᶕ਴ԓѝᒣ൷ 9.6%DŽ൘ࡍ࿻㗔փѝᴰྭ⭥䐟Ⲵ䘲ᓄᓖ
࠶٬ᱟ 159ˈо↔⴨∄ˈ20 ԓਾ࠶٬ᱟ 39ˈ137 ԓਾ࠶٬ᱟ 0.8DŽ137 ԓਾⲴᴰ֣⭥䐟䗮ࡠ
Ⲵᙗ㜭о㾱≲Ⲵ䶎ᑨ⴨䘁DŽ

൘བྷཊᮠᛵߥлˈ㺘⽪ᯩ⌅Ⲵ䘹ᤙ઼䘲ᓄᓖ࠭ᮠⲴ䘹ᤙሩ䚇Ր㕆〻Ⲵᙗ㜭ᱟ㠣‫ޣ‬䟽㾱
ⲴDŽ⭡Ҿ䘉њ৏ഐˈⴞࡽ⹄ウⲴањ⍫䏳亶ฏᱟ㠚ࣘਁ⧠઼ਸᒦᆀ〻ᒿˈ᭩ழᴰࡍⲴ৏ᆀ࠭
ᮠ䳶ਸˈӾ㘼‫ݱ‬䇨㌫㔏ࣘᘱൠ᭩ਈ⭘ԕᶴᔪњփⲴ৏ᆀDŽֻྲਟԕ৲㿱 Koza˄1994˅DŽ

9.6 䘑ौૂᆜҖ⁗ශ

൘ᖸཊ㠚❦㌫㔏ѝˈ⭏⢙њփ൘ᆳԜа⭏ᖃѝ䜭൘ᆖҐྲօᴤྭൠ䘲ᓄ⧟ຳDŽ਼ᰦˈ⭏
⢙઼⽮Պ䗷〻‫ݱ‬䇨ᆳԜⲴ⢙⿽൘ањवਜ਼ᖸཊԓⲴᰦᵏ޵䘲ᓄ⧟ຳDŽ‫ޣ‬Ҿ䘋ॆ㌫㔏Ⲵањᴹ
䏓䰞仈ᱟ˖Āঅањփ⭏ભᵏ䰤ⲴᆖҐˈоᮤњ⢙⿽䖳䮯ᰦᵏ޵⭡䘋ॆ‫׳‬ᡀⲴᆖҐˈᆳԜⲴ
‫ޣ‬㌫ᱟӰѸ˛ā

9.6.1 ᣿傢‫ށ‬䘑ौ

、ᆖᇦ᣹傜‫˄ݻ‬Lamarck˅൘ॱҍц㓚ᵛᨀࠪˈཊԓⲴ䘋ॆⴤ᧕ਇࡠҶњ࡛⭏⢙փ൘ᆳ
Ԝ⭏ભᵏ䰤Ⲵ㓿傼Ⲵᖡ૽DŽ⺞࠷ൠ䇢ˈԆᨀࠪњ࡛⭏⢙փⲴ㓿傼ⴤ᧕ᖡ૽ަਾԓⲴ䚇Ր㔃ᶴ˖
ྲ᷌ањњփ൘⭏ભᵏ޵ᆖՊҶ䚯ᔰḀ⿽ᴹ∂伏⢙ˈᆳ‫ׯ‬㜭ᢺ䘉⿽⢩ᖱ䚇Ր㔉ᆳⲴਾԓDŽ䘉
ᱟањᖸ੨ᕅӪⲴ⥌ᜣˈഐѪ∄䎧ᘭ⮕њփ㓿傼ⲴĀ⭏ᡀᒦ⍻䈅˄generate-and-test˅ā䗷〻
˄ྲGA઼GPѝ䛓ṧ˅ˈᆳਟ㜭㧧ᗇᴤ儈᭸Ⲵ䘋ॆ䗷〻DŽቭ㇑䘉њ⨶䇪ᖸᴹ੨ᕅ࣋ˈնⴞࡽ
Ⲵ、ᆖ䇱ᦞо᣹傜‫⁑ݻ‬රᖫᓅߢケDŽⴞࡽ㻛᧕ਇⲴ㿲⛩ᱟˈњփⲴ䚇Ր㔃ᶴһᇎкнਇᆳⲴ
ৼӢⲴ⭏ᆈ㓿傼Ⲵᖡ૽DŽቭ㇑䘉ᱟ᰾ᱮⲴ⭏⢙ᆖкⲴһᇎˈն䘁ᶕⲴ䇑㇇ᵪ⹄ウᐢ㓿㺘᰾ˈ
᣹傜‫ݻ‬䗷〻ᴹᰦਟԕᨀ儈䇑㇇ᵪ䚇Ր㇇⌅Ⲵ᭸⦷˄৲㿱Grefenstette 1991˗Ackley & Littman
DŽ
1994˗Hart & Belew 1995˅

9.6.2 勃ᗭ⑟᭾ᓊ

ቭ㇑᣹傜‫ݻ‬䘋ॆ⁑ර⋑ᴹ㻛⭏⢙䘋ॆ䗷〻ᡰ᧕ਇˈӪԜᐢ㓿ᨀࠪҶަԆⲴᵪࡦˈ䙊䗷䘉
ӋᵪࡦњփᆖҐਟԕ᭩ਈ䘋ॆ䘋〻DŽަѝа⿽㻛〠Ѫ劽ᗧ⑙᭸ᓄ˄Baldwin effect˅ ˈᱟṩᦞ
俆‫ݸ‬ᨀࠪ䘉⿽ᙍᜣⲴ J. M. Baldwin˄1896˅Ⲵ֌㘵਽ᆇભ਽ⲴDŽ劽ᗧ⑙᭸ᓄสҾԕл⧠䊑˖
x ྲ᷌ањ⢙⿽൘ањਈॆⲴ⧟ຳѝ䘋ॆˈ䛓Ѹ䘋ॆⲴ঻࣋Պ᭟ᤱᴹᆖҐ㜭࣋
ⲴњփDŽֻྲˈྲ᷌൘䘋ॆ⧟ຳѝࠪ⧠ҶањᯠⲴᦅ伏㘵ˈ䛓Ѹ㜭ᆖՊ䚯ᔰ
ᦅ伏㘵ⲴњփˈՊ∄н㜭ᆖՊ↔㜭࣋Ⲵњփᴤᡀ࣏DŽ൘᭸᷌кˈ䘉⿽ᆖҐⲴ
㜭࣋ਟԕ֯њփ൘ަ⭏ભᵏ䰤ᢗ㹼а⿽ሿⲴተ䜘ᩌ㍒ˈԕᴰབྷॆᆳⲴ䘲ᓄ
ᓖDŽ⴨৽ˈнᆖҐⲴњփⲴ䘲ᓄᓖᆼ‫ޘ‬ਆߣҾᆳⲴ䚇Ր㔃ᶴˈՊ༴Ҿ⴨ሩⲴ
࣓࣯DŽ
x 䛓Ӌ㜭ཏᆖҐᖸཊ⢩ᙗ˄trait˅ⲴњփˈՊ䖳ቁൠ‫׍‬䎆Ҿ䚇Րԓ⸱ᶕ⺜ᙗൠ
㿴ᇊަ⢩ᙗDŽ㔃᷌ˈ䘉Ӌњփਟԕ‫׍‬䎆њփᆖҐ‫ݻ‬ᴽ䚇Րԓ⸱ѝⲴĀђཡⲴā
ᡆĀᒦ䶎ᴰՈⲴā⢩ᙗˈӾ㘼᭟ᤱᴤ࣐ཊṧॆⲴสഐ⊐˄gene pool˅DŽ᧕л
ᶕˈ䘉њᴤ࣐ཊṧॆⲴสഐ⊐ਟԕ‫׳‬䘋䘲ᓄᙗᴤᘛ䙏ൠ䘋ॆDŽഐ↔ˈњփⲴ
ᆖҐ㜭࣋ާᴹ䰤᧕࣐䙏ᮤњ㗔փ䘋ॆ䘲ᓄⲴ֌⭘DŽ

ֻྲˈ䇮ᜣḀњ⢙⿽Ⲵ⧟ຳѝਁ⭏ҶḀњᯠⲴਈॆˈ∄ྲࠪ⧠ањᯠⲴᦅ伏㘵DŽ䘉ṧⲴ
ਈॆՊᴹ࡙Ҿ㜭ᆖՊ䚯ᔰᦅ伏㘵ⲴњփDŽ䲿⵰㗔փѝ㠚ᡁᨀ儈ⲴњփⲴ∄ֻⲴ໎䮯ˈ㗔փՊ
᭟ᤱᴤ࣐ཊṧॆⲴสഐ⊐ˈ‫ݱ‬䇨䘋ॆ䗷〻˄ণ֯ᱟ䶎᣹傜‫Ⲵݻ‬Ā⭏ᡀᒦ⍻䈅ā䗷〻˅䘲ᓄᗇ
ᴤᘛDŽ᧕лᶕˈ䘉⿽࣐䙏Ⲵ䘲ᓄਟԕ֯ḷ߶Ⲵ䘋ॆ䗷〻ᴤᘛൠ䘋ॆࠪа⿽䚇Ր⢩ᖱ˄䶎ᆖࡠ
Ⲵ⢩ᖱ˅ᶕ䚯ᔰᦅ伏㘵˄ֻྲˈа⿽ሩᦅ伏㘵Ⲵᵜ㜭᜗ᙅ˅DŽഐ↔劽ᗧ⑙᭸ᓄᨀ‫׋‬Ҷа⿽䰤
᧕Ⲵᵪࡦˈ֯њփⲴᆖҐਟԕ↓䶒ᖡ૽䘋ॆ䙏ᓖDŽ䙊䗷ᨀ儈⢙⿽Ⲵ⭏ᆈ઼࣋䚇Րཊṧᙗˈњ
փᆖҐՊ࣐ᘛ䘋ॆ䘋〻ˈӾ㘼໎࣐䘉њ⢙⿽䘋ॆࠪᴤྭൠ䘲ᓄᯠ⧟ຳⲴ䚇Ր⢩ᙗⲴᵪՊDŽ

ӪԜаⴤࣚ࣋ᔰਁ⹄ウ劽ᗧ⑙᭸ᓄⲴ䇑㇇⁑රDŽֻྲˈHinton & Nowlan˄1987˅ሩа


њㆰঅ⾎㓿㖁㔌Ⲵ㗔փ䘋㹼Ҷ䈅傼ˈ൘ањ㖁㔌њփⲴĀ⭏ભᵏā 䰤ˈᆳⲴаӋᵳ٬ᱟപ
ᇊⲴˈ㘼ަԆⲴᵳᱟਟԕ㻛䇝㓳ⲴDŽ䘉њњփⲴ䚇Ր㔃ᶴߣᇊҶଚӋᵳ٬ᱟਟԕ㻛䇝㓳Ⲵˈ
䛓ӋᱟപᇊⲴDŽ൘ᇎ傼ѝˈᖃн‫ݱ‬䇨њփᆖҐᰦˈ㗔փн㜭䲿⵰ᇎ䐥ᨀ儈ᆳⲴ䘲ᓄᓖDŽ❦㘼ˈ
ᖃ‫ݱ‬䇨њփᆖҐᰦˈ㗔փ䗵䙏ൠᨀ儈ᆳⲴ䘲ᓄᓖDŽ൘㗔փ䘋ॆࡍᵏⲴ਴ԓѝˈާᴹᖸཊਟ䇝
㓳ᵳ٬Ⲵњփঐᦞ䖳བྷⲴ∄ֻDŽն䲿⵰䘋ॆⲴ䘋㹼ˈ㗔փੁ⵰䚇Ր㔉ᇊᵳ٬઼䖳ቁ‫׍‬䎆њփ
ᆖҐᵳ٬Ⲵᯩੁ䘋ॆˈ↓⺞Ⲵപᇊᵳ٬Ⲵᮠ䟿䎻Ҿ໎䮯DŽBelew˄1990˅ ˈHarvey˄1993˅઼
French & Messinger˄1994˅ᣕ੺Ҷሩ劽ᗧ⑙᭸ᓄⲴަԆ䇑㇇ᙗ⹄ウDŽMitchell˄1996˅ѝᴹ
ањ‫ޣ‬Ҿ䘉њѫ仈Ⲵ㋮ᖙ㔬䘠DŽlj䚇Ր䇑㇇NJ˄Evolutionary Computation˅ᵲᘇⲴаᵏ⢩࠺
˄Turney et al. 1997˅वਜ਼Ҷࠐㇷᴹ‫ޣ‬劽ᗧ⑙᭸ᓄⲴ᮷ㄐDŽ

9.7 ᒬ㺂䚍Ֆ㇍⌋

GA ᖸ㠚❦ൠ䘲ਸᒦ㹼ᇎ⧠ˈ㘼фᐢ㓿᧒㍒ࠪҶᖸཊᒦ㹼ॆⲴᯩ⌅DŽ㋇㋂ᓖ˄coarse grain˅
ᒦ㹼ᯩ⌅ᢺ㗔փ㓶࠶ᡀ⴨ሩ⤜・Ⲵњփ㗔ˈ〠Ѫ㊫኎˄deme˅DŽ❦ਾѪ⇿њ㊫኎࠶䝽㔉ањ
н਼Ⲵ䇑㇇㢲⛩ˈ൘⇿њ㢲⛩䘋㹼ḷ߶Ⲵ GA ᩌ㍒DŽ㊫኎ѻ䰤Ⲵ䙊઼ؑӔ৹ਁ⭏Ⲵ仁⦷о㊫
኎޵⴨∄䖳վDŽ㊫኎ѻ䰤ⲴӔᦒ䙊䗷䗱〫˄migration˅ᶕ䘋㹼ˈҏቡᱟḀӋњփӾањ㊫኎
༽ࡦᡆӔᦒࡠަԆⲴ㊫኎DŽ䘉њ䗷〻⁑ᤏҶԕлⲴ⭏⢙䘋ॆᯩᔿˈণ㠚❦⭼ѝᔲփਇ㋮ਟ㜭
ਁ⭏൘࠶⿫Ⲵ⢙⿽ᆀ㗔փѻ䰤DŽ䘉⿽ᯩ⌅Ⲵањྭ༴ᱟᆳ߿ቁҶ䶎ᒦ㹼 GA 㓿ᑨ⻠ࡠⲴᤕᥔ
䰞仈ˈ൘䶎ᒦ㹼㇇⌅ѝˈ⭡Ҿ䗷ᰙࠪ⧠᭟䝽ᮤњ㗔փⲴสഐරˈ֯㌫㔏䲧‫ޕ‬ተ䜘ᴰՈDŽTanese
˄1989˅઼ Cohoon et al.˄1987˅᧿䘠Ҷ㋇㋂ᓖᒦ㹼 GA ㇇⌅ⲴֻᆀDŽ

⴨ሩҾ㋇㋂ᓖᒦ㹼ᇎ⧠ˈ㓶㋂ᓖ˄fine-grained˅ᇎ⧠а㡜㔉㗔փѝⲴ⇿њњփ࠶䝽ањ
༴⨶ಘDŽ❦ਾ⴨䛫Ⲵњփ䰤ਁ⭏䟽㓴DŽӪԜᐢ㓿ᨀࠪҶࠐњ⴨䛫⁑රˈӾᒣ䶒㖁Ṭࡠ䎵⧟㔃
ᶴDŽSpiessens & Manderick˄1991˅᧿䘠Ҷ䘉ṧⲴ㌫㔏ⲴᇎֻDŽStender˄1993˅ѝਟԕᗇࡠ
‫ޣ‬Ҿᒦ㹼 GA ㇇⌅Ⲵ䇪᮷䳶DŽ

9.8 ቅ㔉ૂ㺛‫ݻ‬䈱⢟

䘉аㄐⲴ㾱⛩वᤜ˖
x 䚇Ր㇇⌅˄GA˅䘋㹼а⿽䲿ᵪॆⲴᒦ㹼⡜ኡᩌ㍒ˈᶕਁ⧠֯亴‫ݸ‬ᇊѹⲴ䘲
ᓄᓖ࠭ᮠᴰՈⲴ‫ٷ‬䇮DŽ
x GA ᡰ䟷ਆⲴᩌ㍒ᱟสҾሩ⭏⢙䘋ॆⲴ⁑ᤏDŽGA 㔤ᣔањ⭡ㄎҹ‫ٷ‬䇮㓴ᡀ
Ⲵཊṧॆ㗔փDŽ൘⇿а⅑䘝ԓѝˈ䘹ࠪ㗔փѝ䘲ᓄᓖᴰ儈Ⲵᡀઈᶕӗ⭏ਾԓˈ
ᴯԓ㗔փѝ䘲ᓄᓖᴰᐞⲴᡀઈDŽ‫ٷ‬䇮ᑨ㻛㕆⸱ᡀսѢˈਟԕ䙊䗷Ӕ৹㇇ᆀ㓴
ਸˈսѢкҏਟ㜭ਁ⭏䲿ᵪⲴਈᔲDŽ
x GA 䱀᰾ҶྲօᢺᆖҐ䗷〻ⴻᡀᴰՈॆ䗷〻Ⲵањ⢩ֻDŽާփᶕ䈤ˈᆖҐԫ
࣑ቡᱟṩᦞ亴‫ݸ‬ᇊѹⲴ䘲ᓄᓖ࠭ᮠਁ⧠ᴰՈⲴ‫ٷ‬䇮DŽ䘉㺘᰾ަԆⲴᴰՈॆᢰ
ᵟˈֻྲ⁑ᤏ䘰⚛⌅ˈҏਟԕᓄ⭘ࡠᵪಘᆖҐ䰞仈DŽ
x GA ᐢ㓿㻛Პ䙽ᓄ⭘ࡠᵪಘᆖҐཆⲴᴰՈॆ䰞仈ѝˈֻྲ䇮䇑Ոॆ䰞仈DŽᖃ
ᢺ GA ᓄ⭘ࡠᆖҐԫ࣑ᰦˈᆳ⢩࡛䘲ਸ‫ٷ‬䇮ᖸ༽ᵲⲴԫ࣑˄ֻྲˈ‫ٷ‬䇮ᱟᵪ
ಘӪ᧗ࡦⲴ㿴ࡉ䳶ᡆ䇑㇇ᵪ〻ᒿ˅઼ᴰՈॆⲴⴞḷᱟ‫ٷ‬䇮Ⲵ䰤᧕࠭ᮠⲴԫ࣑
˄ֻྲˈ㾱≲ᗇࡠⲴ㿴ࡉ䳶ਟԕᡀ࣏ൠ᧗ࡦањᵪಘӪ˅DŽ
x 䚇Ր㕆〻ᱟ䚇Ր㇇⌅Ⲵањਈփˈ൘䚇Ր㕆〻ѝˈ㻛᫽֌Ⲵ‫ٷ‬䇮ᱟ䇑㇇ᵪ〻
ᒿ㘼нᱟսѢDŽӔ৹઼ਈᔲ᫽֌㻛᧘ᒯԕᓄ⭘Ҿ〻ᒿ㘼нᱟսѢDŽӪԜᐢ㓿
╄⽪Ҷ䚇Ր㕆〻ᆖҐ䪸ሩḀӋԫ࣑Ⲵ〻ᒿˈ∄ྲ⁑ᤏᵪಘӪ᧗ࡦ˄Koza
1992˅઼䇶࡛㿶㿹൪Ჟ˄visual scenes˅ѝⲴ⢙փ˄Teller and Veloso 1994˅DŽ

൘䇑㇇ᵪ、ᆖⲴᰙᵏˈӪԜቡᔰ࿻᧒㍒สҾ䘋ॆⲴ䇑㇇ᯩ⌅˄ֻྲ Box 1957 ઼ Bledsoe


1961˅DŽ60 ᒤԓᨀࠪҶࠐњн਼Ⲵ䘋ॆᯩ⌅ˈਾᶕ৸㻛䘋а↕⹄ウDŽRechenberg˄1965ˈ1973˅
ᔰਁⲴ䘋ॆㆆ⮕⭘ᶕՈॆᐕ〻䇮䇑ѝⲴᮠᆇ৲ᮠˈSchwefel˄1975ˈ1977ˈ1995˅઼ަԆа
ӋӪ㔗㔝⹄ウҶ䘉⿽ㆆ⮕DŽFolgel & Owens & Walsh˄1966˅ᔰਁҶ䘋ॆ㕆〻ˈ֌Ѫ䘋ॆᴹ
䲀⣦ᘱᵪⲴа⿽ᯩ⌅ˈབྷ䟿Ⲵ⹄ウ㘵㔗㔝᧒㍒Ҷ䘉⿽ᯩ⌅˄ֻྲ Fogel & Atmar 1993˅DŽ
Holland˄1962ˈ1975˅ᨀࠪⲴ䚇Ր㇇⌅वਜ਼Ҷ㔤ᣔњփⲴ㓴ᡀབྷ㗔փⲴᾲᘥˈᒦфᕪ䈳൘
䘉ṧⲴ㌫㔏ѝӔ৹ᱟањ‫ޣ‬䭞Ⲵ᫽֌DŽKoza˄1992˅ӻ㓽Ҷ䚇Ր㕆〻ˈᢺ䚇Ր㇇⌅Ⲵᩌ㍒
ㆆ⮕ᓄ⭘ࡠ⭡䇑㇇ᵪ〻ᒿ㓴ᡀⲴ‫ٷ‬䇮ѝDŽ䲿⵰䇑㇇ᵪ⺜Ԧнᯝൠਈᗇᴤᘛ઼ᴤ‫ׯ‬ᇌˈሩ䘋ॆ
ᯩ⌅Ⲵ‫ޤ‬䏓ҏнᯝ໎䮯DŽ

֯⭘ GA ᆖҐ㿴ࡉ䳶Ⲵа⿽ᯩ⌅ᱟ⭡ K. DeJong ઼ԆⲴᆖ⭏൘ Pittsburgh བྷᆖᔰਁⲴ˄৲


㿱 Smith 1980˅DŽ൘䘉⿽ᯩ⌅ѝˈ⇿њ㿴ࡉ䳶ᱟㄎҹ‫ٷ‬䇮㓴ᡀⲴ㗔փⲴањᡀઈˈቡ‫ۿ‬ᵜㄐ
䇘䇪Ⲵ GABIL ㌫㔏ѝⲴаṧDŽHolland ઼ԆⲴᆖ⭏˄Holland 1986˅൘ Michigan བྷᆖᔰਁҶ
а⿽н਼Ⲵᯩ⌅ˈަѝ⇿њ㿴ࡉᱟ㗔փⲴањᡀઈˈ㘼㗔փᵜ䓛ᱟањ㿴ࡉ䳶DŽWright˄1977˅
Ӿ⭏⢙ᆖ䀂ᓖ࠶᷀Ҷਈᔲǃ㑱⇆ǃӔ৹㑱⇆઼䘋ॆ䘹ᤙⲴ֌⭘DŽ

Mitchell˄1996˅઼ Goldberg˄1989˅ᱟ䇘䇪䚇Ր㇇⌅䘉аѫ仈ⲴєᵜᮉᶀDŽForrest˄1993˅
ᾲᤜҶ GA ѝⲴᢰᵟ䰞仈ˈGoldberg˄1994˅ᾲᤜҶᴰ䘁Ⲵࠐњᓄ⭘DŽKoza˄1992˅‫ޣ‬Ҿ䚇
Ր㕆〻Ⲵу㪇ᱟሩ䚇Ր㇇⌅ᢙኅࡠ᫽֌䇑㇇ᵪ〻ᒿⲴḷ߶৲㘳DŽਁ㺘ᯠᡀ᷌Ⲵѫ㾱Պ䇞ᱟ䚇
Ր㇇⌅ഭ䱵Պ䇞˄ICGA˅DŽަԆ⴨‫Ⲵޣ‬Պ䇞वᤜ㠚䘲ᓄ㹼ѪԯⵏՊ䇞˄CSAB˅ˈӪᐕ⾎㓿
㖁㔌઼䚇Ր㇇⌅ഭ䱵Պ䇞˄ICANNGA˅ˈԕ৺ IEEE 䘋ॆ䇑㇇ഭ䱵Պ䇞˄ICEC˅DŽⴞࡽҏᴹ
䚇Ր㕆〻ᯩ䶒ⲴᒤՊ˄Koza et al. 1996b˅DŽlj䘋ॆ䇑㇇ᵲᘇNJ˄Evolutionary Computation
Journal˅ᱟ䘉њ亶ฏᴰᯠ⹄ウᡀ᷌ⲴањᶕⓀDŽ ljᵪಘᆖҐNJ
˄Machine Learning˅ᵲᘇⲴа
Ӌ⢩࠺ҏᱟ䪸ሩ GA ⲴDŽ
Ґ仈

9.1 Ѫㅜ 3 ㄐѝ᧿䘠Ⲵ PlayTennis 䰞仈䇮䇑ањ䚇Ր㇇⌅ˈᆖҐਸਆⲴ࠶㊫㿴ࡉDŽ㋮⺞


ൠ᧿䘠ࠪަѝሩ‫ٷ‬䇮ⲴսѢ㕆⸱઼а㓴Ӕ৹㇇ᆀDŽ

9.2 ᇎ⧠㓳Ґ 9.1 ѝⲴㆰঅ GADŽ⭘н਼Ⲵ㗔փབྷሿ pǃ⇿аԓѝ㻛␈⊠Ⲵ∄ֻ r ઼ਈᔲ


⦷ m 䘋㹼䈅傼DŽ

9.3 ᢺ GP ਁ⧠Ⲵ〻ᒿ˄൘ㅜ 9.5.2 㢲ѝ᧿䘠˅䟽ᯠ㺘⽪ѪṁDŽ❦ਾሶṁⲴєњᤧ䍍֌Ѫ


єњৼӢˈ൘ަкᓄ⭘ GP ⲴӔ৹㇇ᆀDŽ䈤᰾ަѝӔ৹㇇ᆀⲴ᫽֌䗷〻DŽ

9.4 㘳㲁ᢺ GA ᓄ⭘ࡠሩӪᐕ⾎㓿㖁㔌˄⢩࡛ᱟо৽ੁՐ᫝㇇⌅䇝㓳Ⲵ㖁㔌а㠤Ⲵࡽ侸


㖁㔌ˈ㿱ㅜ 4 ㄐ˅ራ᢮а㓴ਸ䘲Ⲵᵳ٬DŽ㘳㲁ањ 3u2u1 Ⲵ࠶ቲࡽ侸㖁㔌DŽ᧿䘠а⿽ᢺ㖁
㔌ᵳ٬㕆⸱ᡀսѢⲴᯩ⌅ˈᒦ᧿䘠а྇䘲ᖃⲴӔ৹㇇ᆀDŽᨀ⽪˖н㾱൘սѢк‫ݱ‬䇨ᡰᴹਟ㜭
ⲴӔ৹᫽֌DŽᤷࠪ൘䇝㓳㖁㔌ᵳ٬ᯩ䶒ˈ֯⭘ GA о৽ੁՐ᫝㇇⌅⴨∄ⲴањՈ⛩઼ањ㕪
⛩DŽ

৲㘳᮷⥞
ㅢ10ㄖ ᆜҖ㿺ࡏ䳼ਾ

ᇍᄺдࠄⱘ‫؛‬䆒ˈ᳔‫݋‬᳝㸼ᕕ࡯ⱘ੠᳔㛑ЎҎ㉏᠔⧚㾷ⱘ㸼⼎ᮍ⊩ПϔЎ if-then 㾘߭
ⱘ䲚ড়DŽᴀゴ᥶㋶њ㢹ᑆ㛑ᄺд䖭ḋⱘ㾘߭䲚ড়ⱘㅫ⊩DŽ݊Ё᳔䞡㽕ⱘϔ⾡ᰃᄺдࣙ৿ব䞣
ⱘ㾘߭䲚ড়ˈ៪⿄Ўϔ䰊 Horn ᄤহ䲚ড়DŽ⬅Ѣϔ䰊 Horn ᄤহ䲚ড়ৃ㹿㾷䞞Ў䘏䕥㓪⿟䇁
㿔 Prolog Ёⱘ⿟ᑣˈᄺдⱘ䖛⿟㒣ᐌ㹿⿄Ўᔦ㒇䘏䕥㓪⿟˄ILP˅DŽᴀゴ㗗ᆳњ໮⾡ᄺд㾘
߭䲚ড়ⱘ䗨ᕘˈ݊Ёϔ⾡䗨ᕘ෎Ѣᴎ఼ᅮ⧚䆕ᯢ఼Ёⓨ㒢᪡԰ⱘ䗚䕀DŽ

10.1 ԁ㔃

೼䆌໮ᚙ‫މ‬ϟˈ᳝ᖙ㽕ᄺдϔϾⳂᷛߑ᭄ˈᅗ㸼⼎Ў݅ৠᅮН䆹ߑ᭄ⱘ㢹ᑆ if-then 㾘
߭ⱘ䲚ড়DŽབ㄀ 3 ゴ᠔⼎ˈᄺд㾘߭䲚ড়ⱘϔ⾡ࡲ⊩ᰃ佪‫ܜ‬ᄺдࠄ‫އ‬ㄪᷥˈ✊ৢᇚℸᷥ䕀ᤶ
Ўϔㄝᬜⱘ㾘߭䲚ড়DŽ঺ϔ⾡ᮍ⊩ᰃ೼㄀ 9 ゴҟ㒡ⱘ䘫Ӵㅫ⊩ˈᅗ⫼ԡІ㓪ⷕ↣Ͼ㾘߭䲚ড়ˈ
✊ৢ⫼䘫Ӵ᧰㋶ㅫᄤᴹ᥶㋶ᭈϾ‫؛‬䆒ぎ䯈DŽᴀゴ៥Ӏ䅼䆎ϔᮣϡৠⱘㅫ⊩ˈᅗⳈ᥹ᄺд㾘߭
䲚ড়ˈ䖭ᮣㅫ⊩Ϣࠡ䴶ⱘㅫ⊩Ⳍ↨᳝ϸ⚍݇䬂ⱘϡৠDŽ佪‫ˈܜ‬ᅗӀৃᄺдࣙ৿ব䞣ⱘϔ䰊㾘
߭䲚ড়ˈ䖭ϔ⚍ᕜ䞡㽕ˈ಴Ўϔ䰊ᄤহⱘ㸼⼎㛑࡯↨ੑ乬㾘߭㽕ᔎᕫ໮DŽ㄀Ѡˈ䖭䞠䅼䆎ⱘ
ㅫ⊩Փ⫼ᑣ߫㽚Ⲫㅫ⊩ˈϔ⃵ᄺдϔϾ㾘߭ˈҹ䗦๲ഄᮍᓣᔶ៤᳔㒜ⱘ㾘߭䲚ড়DŽ

԰Ўϔ䰊㾘߭䲚ড়ⱘ՟ᄤˈ㗗㰥ҹϟϸϾ㾘߭ˈᅗӀ݅ৠᦣ䗄њⳂᷛὖᗉ AncestorDŽ䖭
䞠៥ӀՓ⫼䇧䆡 Parent(x,y)ᴹ㸼⼎ y ᰃ x ⱘ⠊҆៪↡҆ˈ㗠䇧䆡 Ancestor(x,y)㸼⼎ y ᰃ x ⱘ
ӏᛣҷⱘ⼪‫ܜ‬DŽ

IF Parent(x,y) THEN Ancestor(x,y)

IF Parent(x,z)ġAncestor(z,y) THEN Ancestor(x,y)

⊼ᛣҹϞϸϾ㾘߭ᕜ㋻‫ޥ‬ഄᦣ䗄њϔϾ䗦ᔦߑ᭄ˈᅗᕜ䲒⫼‫އ‬ㄪᷥ៪݊Ҫⱘੑ乬ⱘᮍ⊩
ᴹ㸼⼎DŽЎ䇈ᯢϔ䰊㾘߭ⱘᔎ໻ⱘ㸼⼎㛑࡯ˈৃҹ㗗㰥䗮⫼ⱘ㓪⿟䇁㿔 PrologDŽ೼ Prolog
Ёˈ⿟ᑣᰃϔ䰊㾘߭ⱘ䲚ড়ˈབϞ᠔⼎ⱘ䙷ḋ˄䖭⾡ᔶᓣⱘ㾘߭г㹿⿄Ў Horn ᄤহ˅DŽᅲ
䰙Ϟˈབᵰ⿡⿡ׂᬍϞ䴶ϸϾ㾘߭ⱘ䇁⊩ˈህৃҹᕫࠄϔϾড়⊩ⱘ Prolog ⿟ᑣˈᅗ⫼ᴹ䅵
ㅫ Ancestor ݇㋏DŽ಴ℸˈϔϾৃҹᄺд䖭⾡㾘߭䲚ড়ⱘ䗮⫼ㅫ⊩ˈৃ㹿ⳟ԰ᰃҢḋ՟Ё㞾
ࡼ᥼ᇐߎ Prolog ⿟ᑣⱘㅫ⊩DŽᴀゴҟ㒡њ೼㒭ᅮ䗖ᔧⱘ䆁㒗՟䲚ড়ᯊˈ㛑໳ᄺд䖭⾡㾘߭
ⱘᄺдㅫ⊩DŽ

ᅲ䏉Ё෎Ѣϔ䰊㸼⼎ⱘᄺд㋏㒳Ꮖ៤ࡳഄᑨ⫼Ѣ৘⾡䯂乬ˈབ೼䋼䈅ҾЁᄺдાϔϾ࣪
ᄺ㥃ક㛑㉬ড়⹢⠛ BuchananLindsay ˈᄺдાϔϾ࣪ᄺѮ㒧ᵘӮѻ⫳䇅ᇐ᳝
ᴎԧさবⱘᬒᇘᗻ⠽䋼˄ϔϾ݇Ѣ㟈Ⱐ⠽䋼ⱘሲᗻ˅˄Srinivasanetal˅ˈҹঞᄺд᳝
䰤ऩ‫ܗ‬㔥ҹߚᵤ⠽⧚㒧ᵘЁⱘᑨ࡯˄Dolsak Muggleton˅DŽ೼↣Ͼᑨ⫼Ёˈ‫؛‬䆒ⱘ㸼
⼎ᖙ乏ࣙ৿݇㋏ᮁ㿔ˈᅗৃ⬅ϔ䰊㸼⼎ᴹㅔऩഄ㸼䖒ˈैᕜ䲒⫼ੑ乬㸼⼎ᴹᦣ䗄DŽ

೼ᴀゴЁˈ៥Ӏ‫ܜ‬ҟ㒡㛑໳ᄺдੑ乬㾘߭䲚ⱘㅫ⊩ˈेϡ৿ব䞣ⱘ㾘߭DŽ೼䖭⾡ḚᶊЁˈ
᧰ᇏ‫؛‬䆒ぎ䯈ҹᄺдࠄᵤপ㾘߭䲚ড়ⱘㅫ⊩↨䕗ᯧѢ⧚㾷DŽ✊ৢˈ៥Ӏ㗗㰥њᇚ䖭ѯㅫ⊩ᠽ
ሩࠄϔ䰊㾘߭DŽ᥹ϟᴹ䅼䆎њᔦ㒇䘏䕥ⱘϸ⾡䗮⫼䗨ᕘˈҹঞᔦ㒇੠ⓨ㒢᥼⧚ⱘ෎ᴀ݇㋏DŽ
10.2 ᓅࡍ㾼ⴌ㇍⌋

䖭䞠㗗㰥ⱘϔᮣㅫ⊩ˈ݊ᄺд㾘߭䲚ⱘㄪ⬹Ў˖ᄺдϔϾ㾘߭ˈ⿏এᅗ㽚Ⲫⱘ᭄᥂ˈ‫ݡ‬
䞡໡䖭ϔ䖛⿟DŽ䖭ḋⱘㅫ⊩㹿⿄Ўᑣ߫㽚Ⲫ˄sequentialcovering˅ㅫ⊩DŽᛇ䈵៥ӀᏆ᳝њ
ϔϾᄤ⿟ᑣ learnoneruleˈᅗⱘ䕧ܹЎϔ㒘ℷ՟੠ড՟ˈ✊ৢ䕧ߎऩϾ㾘߭ˈᅗ㛑໳㽚Ⲫ
䆌໮ℷ՟ˈᑊϨ㽚Ⲫᕜᇥⱘড՟DŽ៥Ӏ㽕∖䖭ϔ䕧ߎⱘ㾘᳝߭䕗催ⱘ㊒⹂ᑺˈԚϡᖙ᳝䕗催
ⱘ㽚ⲪᑺDŽ䕗催ⱘ㊒⹂ᑺ䇈ᯢᅗ᠔‫ⱘߎخ‬乘⌟ᑨЎℷ⹂ⱘDŽৃ᥹ফ䕗Ԣⱘ㽚Ⲫᑺˈ㸼⼎ᅗϡ
ᖙᇍ↣Ͼ䆁㒗ḋ՟䛑԰ߎ乘⌟DŽ

᳝њ䖭ḋϔϾᄺдऩϾ㾘߭ⱘ learnonerule ᄤ⿟ᑣˈ㽕ᄺд㾘߭䲚ˈϔϾᯢᰒⱘᮍ⊩


ᰃ೼᠔᳝ৃ⫼䆁㒗ḋ՟Ϟᠻ㸠 learnoneruleˈ‫⿏ݡ‬এ⬅݊ᄺࠄⱘ㾘߭㽚Ⲫⱘℷ՟ˈ‫ݡ‬೼࠽
ԭⱘ䆁㒗ḋ՟Ϟᠻ㸠ᅗҹᄺд㄀ѠϾ㾘߭DŽ䆹䖛⿟ৃ䞡໡㢹ᑆ⃵ˈⳈࠄ᳔ৢᄺдࠄᵤপ㾘߭
䲚ˈᅗӀ݅ৠ㽚Ⲫℷ՟ˈ㽚Ⲫ⿟ᑺ䖒ࠄ᠔Ꮰᳯⱘ↨՟DŽㅫ⊩㹿⿄Ўᑣ߫㽚Ⲫㅫ⊩ᰃ಴Ўᅗᣝ
⃵ᑣᄺдࠄϔ㒘㾘߭ˈᅗӀ݅ৠ㽚Ⲫњܼ䚼ℷ՟DŽ᳔㒜ⱘ㾘߭䲚ৃ㹿ᥦᑣˈ䖭ḋߚ㉏ᮄᅲ՟
ᯊৃ‫ܜ‬ᑨ⫼㊒ᑺ᳔催ⱘ㾘߭DŽᑣ߫㽚Ⲫㅫ⊩ⱘϔϾॳൟ೼㸼  Ё䰜䗄DŽ

ᑣ߫㽚Ⲫㅫ⊩ᰃᑓ⊯Փ⫼ⱘᄺдᵤপ㾘߭䲚ㅫ⊩ⱘ݊ЁПϔDŽᅗᇚᄺдᵤপ㾘߭䲚ⱘ䯂
乬࣪ㅔЎϔ㋏߫᳈ㅔऩⱘ䯂乬ˈ↣Ͼᄤ䯂乬া䳔ᄺࠄऩϾড়প㾘߭DŽ⬅Ѣᅗᠻ㸠ⱘᰃϔ⾡䋾
ှ᧰㋶ˈᔶ៤ᑣ߫࣪ⱘ㾘߭Ϩ≵᳝ಲ⒃ˈ᠔ҹᅗϡ㛑ֱ䆕ᡒࠄ㛑㽚Ⲫḋ՟ⱘ᳔ᇣⱘ៪᳔Շⱘ
㾘߭DŽ

བԩ䆒䅵 learnonerule ⿟ᑣҹ䖒ࠄᑣ߫㽚Ⲫㅫ⊩ⱘ㽕∖˛៥Ӏ䳔㽕ϔϾㅫ⊩㛑໳ᔶ៤


᳝䕗催㊒ᑺⱘ㾘߭ˈԚϡᖙ㽚Ⲫ᠔᳝ⱘℷ՟DŽ೼ᴀ㡖Ёሩ⼎њ৘⾡ㅫ⊩ˈᑊᦣ䗄њᅗӀ೼ᄺ
ᴃⷨおϞᏆ᥶㋶ⱘЏ㽕Ꮒ߿DŽᴀ㡖া㗗㰥ੑ乬㾘߭DŽৢ䴶ⱘ㡖Ёᇚᡞ䖭ѯㅫ⊩ᠽሩࠄϔ䰊
HornᄤহDŽ

㸼 10-1 ᄺдᵤপⱘ㾘߭䲚ⱘᑣ߫㽚Ⲫㅫ⊩DŽ

learn-one-rule ᖙ乏䖨ಲऩϾⱘ㛑㽚Ⲫᶤѯ Examples ⱘ㾘߭DŽperformance ᰃ⫼᠋ᦤկⱘᄤ⿟ᑣˈ


ҹ䆘Ԅ㾘߭ⱘ䋼䞣DŽᔧㅫ⊩‫ݡ‬гϡ㛑ᄺдࠄϔϾᗻ㛑䍙䖛㒭ᅮ䯜ؐ Threshold ⱘ㾘߭ᯊˈ䆹ㅫ⊩㒜
ℶDŽ

Sequential-covering(Target_attribute, Attributes, Examples, Threshold)


 Learned_rulesĕ{}
 Ruleĕlearn-one-rule(Target_attribute, Attributes, Examples)
 ᔧ performance(Rule, Examples) > Thresholdˈ‫˖خ‬
 Learned_rulesĕLearned_rules + Rule
 ExamplesĕExamples-{㹿 Rule ℷ⹂ߚ㉏ⱘḋ՟}
 Ruleĕlearn-one-rule(Target_attribute, Attributes, Examples)
 Learned_rulesĕᣝ✻೼ Examples Ϟⱘ performance ᥦᑣⱘ Learned_rules
 䖨ಲ Learned_rules

10.2.1 ж㡢ࡦ⢯⇀ḧ⣬ᩒ㍘

ᅲ⦄ learnonerule ⱘϔϾ᳝ᬜ䗨ᕘᰃᇚ‫؛‬䆒ぎ䯈᧰㋶䖛⿟䆒䅵ЎϢ ID ㅫ⊩ЁⳌԐⱘ


ᮍᓣˈԚ೼↣ϔℹা⊓ⴔ᳔᳝Ꮰᳯⱘߚᬃ৥ϟDŽབ೒  ᠔⼎ⱘ᧰㋶ᷥˈ᧰㋶ᓔྟѢ᳔ϔ
㠀ⱘ㾘߭ࠡӊ˄े㛑ऍ䜡᠔᳝ᅲ՟ⱘぎ⌟䆩˅ˈ✊ৢ䋾ှഄࡴܹ䙷ѯ೼䆁㒗ḋ՟Ϟᗻ㛑ᬍ䖯
᳔໻ⱘሲᗻ⌟䆩DŽϔᮺ䆹⌟䆩㹿ࡴܹˈ䆹䖛⿟䞡໡ˈ䋾ှഄࡴܹ㄀ѠϾሲᗻ⌟䆩ˈձℸ㉏᥼DŽ
བ ID 䙷ḋˈ䆹䖛⿟䗮䖛䋾ှഄ๲ࡴᮄⱘሲᗻ⌟䆩ᴹ㦋ᕫ‫؛‬䆒ˈⳈࠄ䆹‫؛‬䆒ⱘᗻ㛑ࠄ䖒ϔ
ৃ᥹ফⱘ⿟ᑺDŽϢ ID ϡৠⱘᰃˈℸ learnonerule ⱘᅲ⦄೼↣ϔℹ⊓ⴔऩϾߚᬃˉˉेѻ
⫳᳔Շᗻ㛑ⱘሲᗻؐᇍˈ㗠ϡᰃ⫼๲䭓ᄤᷥⱘࡲ⊩㽚Ⲫ᠔䗝ሲᗻⱘ᠔᳝ৃ㛑ؐDŽ

䖭⾡ᅲ⦄ learnonerule ⱘ䗨ᕘᠻ㸠ⱘᰃᇍৃ㛑ᄬ೼ⱘ㾘߭ⱘϔ㠀ࠄ⡍⅞᧰㋶ˈҹᕫࠄ


ϔϾ᳝䕗催㊒ᑺԚϡϔᅮᅠܼ㽚Ⲫ᭄᥂ⱘ㾘߭DŽབ೼‫އ‬ㄪᷥᄺдЁ䙷ḋˈ᳝䆌໮ᮍ⊩ৃҹᅮ
Н䗝ᢽĀ᳔Շāߚᬃⱘᑺ䞣ᷛ‫ޚ‬DŽϢ೼ ID Ё㉏Ԑˈ៥ӀৃᅮН᳔ՇߚᬃЎᅗ㽚Ⲫⱘḋ՟
᳔᳝Ԣⱘ➉˄ಲᖚᓣ ˅DŽ

插图——原书页码:277

೒ 10-1 Learn-one-rule Ңϔ㠀ࠄ⡍⅞䖛⿟Ёⱘ㾘߭ࠡӊ᧰㋶

೼↣ϔℹˈ᳔Շ㾘߭ⱘࠡӊ㹿ҹ৘⾡ৃ㛑ᮍᓣ⡍࣪DŽ㾘߭ৢӊᰃ⬅⒵䎇ࠡӊⱘḋ՟᠔‫އ‬ᅮⱘDŽ
䆹೒ᰒ⼎ⱘᰃᆑᑺЎ 1 ⱘ᷅⢊᧰㋶DŽ

Ϟ䴶᥼㤤ⱘϔ㠀ࠄ⡍⅞᧰㋶ᰃϔ⾡ϡᏺಲ⒃ⱘ䋾ှ⏅ᑺӬ‫᧰ܜ‬㋶DŽབ݊Ҫ䋾ှ᧰㋶ϔ
ḋˈᅗ᠔ᏺᴹⱘॅ䰽ᰃ↣ϔℹৃ㛑԰ߎњ⃵Ӭⱘ䗝ᢽDŽЎ‫ޣ‬ᇣ䖭⾡亢䰽ˈৃᇚℸㅫ⊩ᠽሩЎ
ϔ⾡᷅⢊᧰㋶˄beamsearch˅ˈे↣ϔℹㅫ⊩ֱ⬭ k Ͼ᳔Շ‫׭‬䗝ⱘ߫㸼ˈ೼↣ϔ᧰㋶ℹᇍ䖭
k Ͼ᳔Շ‫׭‬䗝⫳៤ߚᬃ˄⡍࣪˅ˈᑊϨ㒧ᵰ䲚‫ݡ‬㹿ࠞ‫ޣ‬㟇 k Ͼ᳔ৃ㛑៤ਬDŽ᷅⢊᧰㋶䎳䏾ᔧ
᳔ࠡ催ߚؐ‫؛‬䆒ⱘ᳔᳝Ꮰᳯⱘ᳓ҷ㗙ˈҹՓ↣ϔℹЁᅗӀⱘ᠔᳝ৢ㒻䛑㹿㗗㰥ࠄDŽ䆹ϔ㠀ࠄ
⡍⅞᷅⢊᧰㋶⫼Ѣ CN ⿟ᑣˈᅗ⬅ Clark Niblett˄˅ᦤߎDŽ䆹ㅫ⊩೼㸼  Ёᦣ䗄DŽ

㸼 10-2 learn-one-rule ⱘϔ⾡ᅲ⦄ᰃϔ㠀ࠄ⡍⅞᷅⢊᧰㋶DŽ

ᔧࠡ‫؛‬䆒ⱘ䖍㓬㸼⼎Ўব䞣 Candidate_hypothesesDŽ䆹ㅫ⊩Ϣ Clark & Niblett˄1989˅ᦣ䗄ⱘ


CN2 ⿟ᑣⳌ㉏ԐDŽ

Learn-one-rule(Target_attribute, Attributes, Examples, k)


䖨ಲϔϾ㽚Ⲫ㢹ᑆḋ՟ⱘ㾘߭DŽᅲᮑϔ㠀ࠄ⡍⅞䋾ှ᷅⢊᧰㋶ҹᕫࠄ᳔Շ㾘߭ˈ⬅ performance ᑺ䞣ᴹᓩᇐDŽ
 ߱ྟ࣪ Best_hypothesis Ў᳔ϔ㠀ⱘ‫؛‬䆒‡
 ߱ྟ࣪ Candidate_hypotheses Ў䲚ড়{Best_hypothesis}
 ᔧ Candidate_hypotheses ϡぎˈ‫خ‬ҹϟ᪡԰˖
1.⫳៤㋻䚏᳈⡍⅞ⱘ‫׭‬䗝‫؛‬䆒
 All_constraintsĕ᠔᳝ᔶᓣЎ(a=v)ⱘ㑺ᴳ䲚ড়ˈ݊Ё a Ў Attributes ⱘ៤ਬˈ㗠 v Ўߎ⦄೼
ᔧࠡ Examples 䲚ড়Ёⱘ a ؐ
 New_candidate_hypotheseĕ
ᇍ Candidate_hypotheses Ё↣Ͼ hˈ
ᇍ All_constraints Ё↣Ͼ c
 䗮䖛ࡴܹ㑺ᴳ c ߯ᓎϔϾ h ⱘ⡍࣪ᓣ
 Ң New_candidate_hypothese Ё⿏এӏᛣ䞡໡ⱘǃϡϔ㟈ⱘ៪䴲ᵕ໻⡍⅞࣪ⱘ‫؛‬䆒
2.᳈ᮄ Best_hypothesis
 ᇍ New_candidate_hypotheses Ё᠔᳝ h ‫خ‬ҹϟ᪡԰˖
 བᵰ(performance(h, Examples, Target_attribute)
> performance(Best_hypothesis, Examples, Target_attribute))
߭ Best_hypothesisĕh
3.᳈ᮄ Candidate_hypotheses
 Candidate_hypothesesĕNew_candidate_hypotheses Ё k Ͼ᳔Շ៤ਬˈᣝ✻ performance ᑺ䞣
 䖨ಲϔϾབϟᔶᓣⱘ㾘߭˖
Āབᵰ Best_hypothesisˈ߭ predictionā
݊Ё prediction Ў೼Ϣ Best_hypothesis ऍ䜡ⱘ Examples Ё᳔乥㐕ⱘ Target_attribute ؐ

performance(h, Examples, Target_attribute)


 h_examplesĕϢ h ऍ䜡ⱘ Examples ᄤ䲚
 䖨ಲ-Entropy(h_examples)ˈ݊Ё Entropy ᰃ݇Ѣ Target_attribute ⱘ➉

ϟ䴶ᰃᇍ㸼  Ёⱘ learnonerule ㅫ⊩ⱘϔѯ䇈ᯢDŽ佪‫⊼ˈܜ‬ᛣ೼ㅫ⊩Џᕾ⦃Ё㗗㰥


ⱘ↣Ͼ‫؛‬䆒ᰃሲᗻؐ㑺ᴳⱘড়পDŽ↣Ͼড়প‫؛‬䆒ᇍᑨѢᕙᄺд㾘߭ⱘ‫׭‬䗝ࠡӊ䲚ড়ˈᅗ⬅
݊㽚Ⲫⱘḋ՟ⱘ➉ᴹ䆘ԄDŽ᧰㋶䖛⿟ϡᮁ⡍࣪‫׭‬䗝‫؛‬䆒ˈⳈࠄࠄ䖒ϔϾᵕ໻⡍⅞‫؛‬䆒ˈᅗࣙ
৿᠔᳝ৃ⫼ⱘሲᗻDŽ⬅䆹ㅫ⊩䕧ߎⱘ㾘߭Ў᧰㋶䖛⿟Ё䘛ࠄⱘᗻ㛑᳔Շ˄performance ᳔໻˅
ⱘ㾘߭ˉˉϡϔᅮᰃ᧰㋶᳔㒜ѻ⫳ⱘ‫؛‬䆒DŽ㾘߭ⱘৢӊ䕧ߎা೼ㅫ⊩ⱘ᳔ৢϔℹѻ⫳ˈ೼݊
ࠡӊ˄㸼⼎Ўব䞣 BestBhypothesis˅⹂ᅮПৢˈㅫ⊩ᵘ䗴ߎⱘ㾘߭ৢӊ⫼Ѣ乘⌟೼㾘߭ࠡӊ
᠔㛑㽚Ⲫⱘḋ՟Ё᳔ᐌ㾕ⱘⳂᷛሲᗻؐDŽ᳔ৢˈ䖬ᑨ⊼ᛣሑㅵՓ⫼њ᷅⢊᧰㋶ҹ‫ޣ‬ᇣ亢䰽ˈ
䋾ှ᧰㋶ҡৃ㛑ѻ⫳⃵Ӭⱘ㾘߭DŽ✊㗠ˈेՓ䖭ḋˈᑣ߫㽚Ⲫㅫ⊩ҡ㛑ᄺࠄϔ㒘㾘߭ˈᅗӀ
݅ৠ㽚Ⲫ䆁㒗ḋ՟ˈ಴Ўᅗᇍ࠽ԭⱘ᳾㽚Ⲫḋ՟䞡໡䇗⫼њ learnoneruleDŽ

10.2.2 ࠖ〃਎ශ

ᑣ߫㽚Ⲫㅫ⊩ҹঞ learnonerule ㅫ⊩ৃᄺд ifthen 㾘߭䲚ҹ㽚Ⲫ䆁㒗ḋ՟DŽ䆹䗨ᕘ᳝


䆌໮বൟDŽ↨བˈᶤѯᚙ‫މ‬ϟৃ㛑Ꮰᳯ⿟ᑣাᄺд㽚Ⲫℷ՟ⱘ㾘߭ˈᑊϨᇍ䆹㾘߭≵᳝㽚Ⲫ
ⱘᅲ՟Ā咬䅸āഄ䌟ќ݊ড՟ߚ㉏DŽ↨བˈ䖭⾡ᮍ⊩䗖⫼ѢᄺдⳂᷛὖᗉĀৃ㛑ᗔ᳝ঠ㚲㚢
ⱘᄩཛāDŽ೼䖭⾡ᚙ‫މ‬ϟˈℷ՟೼ᭈϾ㕸ԧЁ᠔ऴ↨՟ᕜᇣˈ᠔ҹ㾘߭䲚བᵰাᷛᅮℷ՟ⱘ
㉏߿ˈ㗠ᇍ᠔᳝݊Ҫḋ՟咬䅸ߚ㉏Ўড՟ˈ㾘߭䲚Ӯ᳈Ўㅔ⋕ᯧពDŽ䖭ϔᮍ⊩ᇍᑨѢ Prolog
ЁⱘĀ༅䋹৺ᅮāㄪ⬹ˈ݊Ёϡ㛑䆕ᯢЎⳳⱘ㸼䖒ᓣ䛑咬䅸Ў‫؛‬DŽЎњᄺд䖭ḋⱘা乘⌟ऩ
ϾⳂᷛؐⱘ㾘߭ˈ䳔㽕ׂᬍ learnonerule ㅫ⊩ҹ᥹ফ䰘ࡴⱘ䕧ܹব䞣ˈᣛᅮᛳ݈䍷ⱘⳂᷛ
ؐDŽϔ㠀ࠄ⡍⅞᷅⢊᧰㋶བҹࠡϔḋ໘⧚ˈা㽕ׂᬍ䆘Ԅ‫؛‬䆒ⱘ performance ᄤ⿟ᑣDŽ⊼ᛣ
performance ᅮНЎ䋳➉Ꮖϡ‫ݡ‬䗖⫼Ѣℸᮄⱘ䆒ᅮˈ಴Ўᅗᡞଃ⣀㽚Ⲫড՟ⱘ‫؛‬䆒䌟ќњ᳔
໻ߚؐˈϢଃ⣀㽚Ⲫℷ՟ⱘ‫؛‬䆒ϔḋDŽ䖭⾡ᚙ‫މ‬ϟՓ⫼䆹‫؛‬䆒㽚Ⲫℷ՟↨՟ⱘᑺ䞣ᷛ‫߭ޚ‬᳈
Ў䗖ড়DŽ

ㅫ⊩ⱘ঺ϔবൟᰃϔᮣ⿄Ў AQ ⱘㅫ⊩˄MichalskMichalskietal˅ˈᅗ
↨Ϟ䴶䅼䆎᠔෎Ѣⱘ CN ㅫ⊩᳈ᮽDŽབ CN ϔḋˈAQ ᄺдᵤপ㾘߭䲚ˈҹ㽚ⲪⳂᷛߑ᭄DŽ
✊㗠ˈAQ ϢϞ䴶㒭ߎⱘㅫ⊩᳝ҹϟϡৠ˖佪‫ ܜ‬AQ ⱘ㽚Ⲫㅫ⊩Ϣᑣ߫㽚Ⲫㅫ⊩ϡৠˈ಴Ў
ᅗᯢ⹂ഄᇏᡒ㽚Ⲫϔ⡍ᅮⳂᷛؐⱘ㾘߭ˈ✊ৢᇍ↣ϾⳂᷛؐᄺдϔᵤপ㾘߭䲚DŽ㄀ѠˈAQ
ㅫ⊩ᄺдऩϾ㾘߭ⱘᮍ⊩гϡৠѢ learnoneruleDŽᔧᅗᇍ↣Ͼ㾘߭ᠻ㸠ϔ㠀ࠄ⡍⅞᷅⢊᧰
㋶ᯊˈᅗೈ㒩ऩϾℷ՟ᴹ䖯㸠᧰㋶DŽ⹂ߛഄ䇈ˈᅗ೼᧰㋶Ёা㗗㰥㹿䆹ℷ՟⒵䎇ⱘሲᗻˈҹ
ᕫࠄ䗤⏤⡍⅞ⱘ‫؛‬䆒DŽ↣⃵ᄺϔϾᮄ㾘߭ᯊˈᅗҢ䙷ѯ᳾㽚Ⲫⱘḋ՟Ёг䗝ᢽϔϾᮄⱘℷ՟ˈ
԰Ў⾡ᄤҹᣛᓩᮄᵤপ乍ⱘ᧰㋶DŽ

10.3 ᆜҖ㿺ࡏ䳼φቅ㔉

Ϟ䴶䅼䆎ⱘᑣ߫㽚Ⲫㅫ⊩੠㄀  ゴЁⱘ‫އ‬ㄪᷥᄺдㅫ⊩ᦤկњ޴⾡ᄺд㾘߭䲚ⱘᮍ⊩DŽ
ᴀ㡖㗗㰥䖭ѯ㾘߭ᄺдㅫ⊩䆒䅵Ёⱘ݇䬂ᗱᛇDŽ

佪‫ˈܜ‬ᑣ߫㽚Ⲫㅫ⊩↣⃵ᄺдϔϾ㾘߭ˈ⿏এ㽚Ⲫⱘḋ՟✊ৢ೼࠽ԭḋ՟Ϟ䞡໡䖭ϔ䖛
⿟DŽⳌডˈབ ID 䙷ḋⱘ‫އ‬ㄪᷥㅫ⊩Փ⫼ऩϾ᧰㋶䖛⿟ᴹ᧰㋶ৃ᥹ফ‫އ‬ㄪᷥˈ↣ℹᑊ㸠ᄺ
дᭈϾᵤপ乍ⱘ䲚ড়DŽ಴ℸˈ៥Ӏгৃᇚ ID 䖭ḋⱘㅫ⊩⿄Ўᑊ㸠㽚Ⲫㅫ⊩ˈᇍᑨѢ CN
䖭ḋⱘᑣ߫㽚Ⲫㅫ⊩DŽાϔ⾡ㅫ⊩↨䕗ད˛ㄨḜ݇䬂೼Ѣ᧰㋶Ё᳔෎ᴀℹ偸П䯈ⱘᏂ߿DŽ
ID ೼↣ϔ᧰㋶ℹЁḍ᥂ᅗᇍ᭄᥂ѻ⫳ⱘߦߚ䗝ᢽϡৠⱘሲᗻDŽⳌডˈCN 䗝ᢽⱘᰃϡৠⱘ
ሲᗻؐᇍˈᮍ⊩ᰃ䗮䖛↨䕗ᅗӀ㽚Ⲫⱘ᭄᥂ᄤ䲚DŽ㽕ⳟߎ䖭⾡Ꮒ߿ⱘᛣН᠔೼ˈ䳔㽕↨䕗
ϸ⾡ㅫ⊩ЎᄺдࠄⳌৠⱘ㾘߭䲚ড়᠔԰ߎⱘϡৠ䗝ᢽⱘ⃵᭄DŽЎњᄺдࠄ n Ͼ㾘߭ⱘ䲚ড়ˈ
↣Ͼ㾘߭ࠡӊࣙড় k Ͼሲᗻؐ⌟䆩ˈᑣ߫㽚Ⲫㅫ⊩䳔㽕ᠻ㸠 ngk ⃵෎ᴀ᧰㋶ℹˈЎ↣Ͼ㾘
߭ⱘ↣Ͼࠡӊ‫خ‬⣀ゟⱘ䗝ᢽˈ㗠ᑊ㸠㽚Ⲫㅫ⊩ⱘ⣀ゟ䗝ᢽ⃵᭄䖰䖰ᇥѢℸˈ಴Ў೼‫އ‬ㄪᷥЁ
↣Ͼ‫އ‬ㄪ㒧⚍ⱘ䗝ᢽ䛑ᇍᑨњϢ䆹㒧⚍Ⳍ݇㘨ⱘ໮Ͼ㾘߭ⱘࠡӊ䗝ᢽDŽᤶ㿔Пˈབᵰ‫އ‬ㄪ㒧
⚍⌟䆩ϔϾ᳝ m ⾡ৃ㛑ؐⱘሲᗻˈ↣⃵‫އ‬ㄪ㒧⚍ⱘ䗝ᢽ䛑ᇍᑨњᇍ m ϾⳌᑨⱘ㾘߭Ё↣Ͼ
㾘߭ⱘࠡӊ䗝ᢽ˄㾕д乬 ˅DŽ䖭ḋˈᑣ߫㽚Ⲫㅫ⊩˄བ CN˅԰ߎⱘ⣀ゟ䗝ᢽ⃵᭄催Ѣ
ID 䖭ḋⱘᑊ㸠㽚Ⲫㅫ⊩DŽԚાϔ⾡ㅫ⊩᳈དⱘ䯂乬ձ✊ᄬ೼DŽ݊㾷ㄨձ䌪Ѣ᳝໮ᇥ䆁㒗᭄
᥂ᰃৃ⫼ⱘDŽབᵰ᭄᥂䴲ᐌЄᆠˈ䙷Мᅗৃҹᬃᣕᑣ߫㽚Ⲫㅫ⊩᠔㽕∖ⱘ䕗໻᭄䞣ⱘ⣀ゟ䗝
ᢽDŽ✊㗠㢹᭄᥂䕗㔎УˈᇍѢϡৠ㾘߭ࠡӊⱘ‫އ‬ㄪĀ݅ѿā߭᳈᳝ᬜDŽ঺ϔ㗗㰥೼Ѣ⡍ᅮⱘ
ӏࡵЁᰃ৺Ꮰᳯϡৠⱘ㾘߭⌟䆩ⳌৠⱘሲᗻDŽ೼ᑊ㸠㽚Ⲫ‫އ‬ㄪᷥᄺдㅫ⊩ЁӮߎ⦄䖭ḋⱘᚙ
‫މ‬DŽ೼ᑣ߫㽚Ⲫㅫ⊩Ё߭ϡᄬ೼DŽ

ϡৠᮍ⊩ⱘ㄀ѠϾⳌᓖП໘೼Ѣ learnonerule ᧰㋶ⱘᮍ৥DŽ೼Ϟ䴶ᦣ䗄ⱘㅫ⊩Ёˈ᧰


㋶ᰃҢϔ㠀ࠄ⡍⅞ⱘDŽ݊ҪᏆ䅼䆎ⱘㅫ⊩˄བ㄀  ゴЁⱘ FindS˅ᰃҢ⡍⅞ࠄϔ㠀ⱘDŽ೼
ℸᚙ‫މ‬ϟˈҢϔ㠀ࠄ⡍⅞᧰㋶ⱘϔϾӬ⚍೼Ѣা᳝ϔϾᵕ໻ϔ㠀‫؛‬䆒ৃ԰Ў᧰㋶䍋ྟ⚍ˈ㗠
೼໮᭄‫؛‬䆒ぎ䯈Ё᳝ᕜ໮⡍⅞‫؛‬䆒˄བᇍ↣Ͼᅲ՟᳝ϔ‫؛‬䆒˅DŽ಴Ў᳝䆌໮ᵕ໻⡍⅞‫؛‬䆒ˈ
ህϡ㛑⹂ⶹ䗝ᢽાϔϾ԰Ў᧰㋶ⱘᓔྟ⚍DŽᠻ㸠Ң⡍⅞ࠄϔ㠀᧰㋶ⱘϔϾ⿄Ў Golem
Muggleton Feng ⱘ⿟ᑣ㾷‫އ‬ℸ䯂乬ⱘᮍ⊩ᰃ䱣ᴎ䗝ᢽ໮Ͼℷ՟ˈҹℸЎ߱ྟᴹ䖯
㸠᧰㋶DŽ೼໮Ͼ䱣ᴎ䗝ᢽЁⱘ᳔Շ‫؛‬䆒԰Ў᳔ৢ㒧ᵰDŽ

㄀ϝϾ㽕㗗㰥ⱘᰃ learnonerule ᰃЎϔϾ⫳៤‫⌟ݡ‬䆩˄generatethentest˅᧰㋶ˈ㣗ೈ


Ў᠔᳝ড়⊩ⱘ‫؛‬䆒ˈབ៥Ӏ᥼㤤ⱘᅲ⦄Ё䙷ḋ˗䖬ᰃϔϾḋ՟偅ࡼ˄exampledriven˅᧰㋶ˈ
ҹՓ䆁㒗ḋ՟Ͼԧ㑺ᴳ‫؛‬䆒ⱘ⫳៤DŽḋ՟偅ࡼ᧰㋶ㅫ⊩ࣙᣀ㄀  ゴⱘ FindSǃ‫׭‬䗝⍜䰸ǃ
AQ ㅫ⊩ˈҹঞᴀゴৢ䴶㽕䅼䆎ⱘ Cigol ㅫ⊩DŽ೼䖭ѯㅫ⊩Ёˈᇍ‫؛‬䆒ⱘ⫳៤៪ׂℷᰃ⬅ऩ
⣀ⱘ䆁㒗ḋ՟偅ࡼⱘˈ㗠Ϩ㒧ᵰᰃϔϾᏆׂℷⱘ‫؛‬䆒ˈՓᇍℸऩϾḋ՟ⱘᗻ㛑ᕫࠄᬍ୘DŽ䖭
ϡৠѢ㸼  Ё learnonerule ㅫ⊩ⱘ⫳៤‫⌟ݡ‬䆩᧰㋶ˈ݊Ёৢ㓁ⱘ‫؛‬䆒ⱘ⫳៤া෎Ѣ‫؛‬䆒
㸼⼎ⱘ䇁⊩DŽ೼䖭ѯ‫׭‬䗝‫؛‬䆒⫳៤Пৢ‫ߚݡ‬ᵤ䆁㒗᭄᥂ˈ✊ৢ෎Ѣ䖭ѯ‫؛‬䆒೼ܼ䚼ḋ՟Ϟⱘ
ᗻ㛑ᴹ䖯㸠䗝ᢽDŽ⫳៤‫⌟ݡ‬䆩ⱘϔϾ䞡㽕Ӭ⚍ᰃ᧰㋶Ё↣ϔℹⱘ䗝ᢽ䛑෎Ѣ೼䆌໮ḋ՟Ϟⱘ
‫؛‬䆒ᗻ㛑ˈ಴ℸాໄ᭄᥂ⱘᕅડ㹿᳔ᇣ࣪DŽⳌডˈḋ՟偅ࡼㅫ⊩෎ѢऩϾⱘḋ՟ᬍ䖯‫؛‬䆒ˈ
ᅗ᳈ᆍᯧ㹿ϔѯాໄ䆁㒗ḋ՟ᕅડˈ಴ℸᇍ䆁㒗᭄᥂ЁᏂ䫭ⱘ剕Ầᗻ䕗ᏂDŽ
㄀ಯϾ㽕㗗㰥ⱘᰃᰃ৺䳔㽕ᇍ㾘߭䖯㸠ৢׂ࠾ҹঞᗢḋׂ࠾DŽབ೼‫އ‬ㄪᷥᄺдЁϔḋˈ
learnonerule г᳝ৃ㛑ᔶ៤೼䆁㒗᭄᥂Ϟᗻ㛑ᕜདˈԚ೼ҹৢⱘ᭄᥂ЁᕜᏂⱘ㾘߭DŽ㾷‫އ‬
ⱘࡲ⊩гᰃ೼ᕫࠄ↣Ͼ㾘߭ৢ䖯㸠ৢׂ࠾DŽ⹂ߛഄ䆆ˈৃҹ⿏এᶤѯࠡӊˈা㽕䖭ᇐ㟈ϡৠ
Ѣ䆁㒗ḋ՟ⱘ⫼Ѣׂ࠾ⱘϔϾḋ՟䲚ড়Ϟⱘᗻ㛑ᦤ催ˈᇍѢৢׂ࠾᳈䆺㒚ⱘ䅼䆎㾕㄀
 㡖DŽ

᳔ৢ㽕㗗㰥ⱘᰃ೼ learnonerule ᯊᣛᓩ᧰㋶ᮍ৥ⱘ㾘߭ᗻ㛑˄performance˅ⱘᅮНDŽ


Ꮖ᳝њ৘⾡ϡৠⱘ䆘Ӌߑ᭄ˈᶤѯᐌ⫼ⱘ䆘Ԅߑ᭄ࣙᣀ˖
x Ⳍᇍ乥⥛˄Relative frequency˅DŽҸnҷ㸼㾘߭᠔ऍ䜡ⱘḋ՟᭄ⳂˈҸncҷ㸼݊Ё
ᅗ㛑ℷ⹂ߚ㉏ⱘ᭄ⳂDŽ㾘߭ᗻ㛑ⱘⳌᇍ乥⥛Ԅ䅵Ў˖
nc
n
Ⳍᇍ乥⥛㹿⫼Ѣ೼ AQ ⿟ᑣЁ䆘Ԅ㾘߭DŽ
x ㊒ᑺⱘm-Ԅ䅵˄m-estimate of accuracy˅DŽ䆹㊒ᑺԄ䅵‫أ‬৥Ѣ㾘߭᠔ᳳᳯⱘ咬䅸
㊒ᑺDŽᅗ೼᭄᥂↨䕗㔎УˈᑊϨ㾘߭ᖙ乏೼ᕜᇥⱘḋ՟Ϟ䆘Ԅᯊᐌ⫼DŽҸnc੠n
བϞᅮНˈᑊҸpЎҢᭈϾ᭄᥂䲚Ё䱣ᴎᢑপⱘḋ՟Ϣ䆹㾘߭䌟ќⱘߚ㉏Ⳍৠⱘ
‫ܜ‬偠ὖ⥛˄՟བˈབᵰ 100 Ͼḋ՟Ё᳝ 12 ϾϢ䆹㾘߭ⱘ乘⌟ؐⳌৠˈ䙷Мp=0.12˅DŽ
᳔ৢˈҸmЎᴗ䞡ˈ៪⿄ᇍℸ‫ܜ‬偠ὖ⥛p䖯㸠ࡴᴗⱘㄝᬜḋ՟᭄ⳂDŽᇍ㾘߭㊒ᑺ
ⱘm-Ԅ䅵Ў˖
nc  mp
nm
⊼ᛣབᵰ m 㹿䆒Ў 0ˈ߭ m Ԅ䅵বЎϞ䴶ⱘⳌᇍ乥⥛Ԅ䅵DŽᔧ m Ϟछᯊˈ䳔㽕
᳈໮ⱘḋ՟ᴹ‫ܟ‬᳡䖭Ͼ乘‫؛ܜ‬ᅮⱘ㊒ᑺ pDŽm-Ԅ䅵ᑺ䞣⬅ Cestnik & Bratko
˄1991˅ᦤߎˈᅗᏆ⫼Ѣᶤѯ⠜ᴀⱘ CN2 ㅫ⊩DŽᅗг⫼Ѣ㄀ 6.9.1 㡖䅼䆎ⱘᴈ
㋴䋱৊ᮃߚ㉏఼DŽ
x ➉(entropy)DŽ䖭ᰃ೼㸼 10-2 ЁՓ⫼ⱘ performance ᄤ⿟ᑣЁՓ⫼ⱘᑺ䞣DŽҸ S Ў
ऍ䜡㾘߭ࠡӊⱘḋ՟䲚ড়DŽ➉㸵䞣ⱘᰃ䆹ḋ՟䲚ড়ЁⳂᷛߑ᭄ⱘഛϔᗻDŽ䖭䞠
Փ⫼➉ⱘ䋳ؐˈҹՓ䕗Շⱘ㾘߭ᢹ᳝䕗催ⱘߚؐ˖
c
 Entropy ( S ) ¦p
i 1
i log 2 pi

݊ЁcЎⳂᷛߑ᭄ৃপⱘϡৠ᭄ؐ䞣ˈpiЎSЁⳂᷛߑ᭄প㄀iϾؐⱘḋ՟᠔ऴ↨
՟DŽϢ㒳䅵ᛣН⌟䆩Ⳍ㒧ড়ˈ➉ᑺ䞣⫼ѢCN2 ㅫ⊩˄Clark & Niblett 1989˅ˈᅗ
гᰃ䆌໮‫އ‬ㄪᷥᄺдㅫ⊩Ёֵᙃ๲Ⲟᑺ䞣ⱘ෎⸔DŽ

10.4 ᆜҖж䱬㿺ࡏ

ࠡ䴶䅼䆎ⱘㅫ⊩䩜ᇍᄺдੑ乬㾘߭䲚˄े᮴ব䞣ⱘ㾘߭˅DŽᴀ㡖Ёᇚ㗗㰥ᏺ᳝ব䞣ⱘ㾘
߭ˈ⹂ߛഄ䆆Ўϔ䰊 Horn ᄤহDŽП᠔ҹ㗗㰥䖭ḋⱘ㾘߭ˈᰃ಴ЎᅗӀ↨ੑ乬㾘߭᳈᳝㸼ᕕ
㛑࡯DŽᇍѢϔ䰊↉㾘߭ⱘᔦ㒇ᄺд䗮ᐌ㹿⿄Ўᔦ㒇䘏䕥㓪⿟˄InductiveLogicProgrammingˈ
ㅔ‫ ݭ‬ILP˅ˈ಴Ў䖭ϔ䖛⿟ৃⳟ԰Ңḋ՟Ё㞾ࡼ᥼䆎ߎ Prolog ⿟ᑣDŽProlog ᰃϔϾ䗮⫼ⱘǃ
೒♉ㄝӋⱘ㓪⿟䇁㿔ˈ݊Ё⿟ᑣ㹿㸼⼎Ўϔ㒘 Horn ᄤহDŽ

10.4.1 ж䱬 Horn ᆆਛ

Ў䇈ᯢϔ䰊㸼⼎↨ੑ乬˄᮴ব䞣˅㸼⼎ⱘӬ䍞П໘ˈ㗗㰥ϔϾᄺдӏࡵˈⳂᷛὖᗉᕜㅔ
ऩˈЎ Daughter xy ˈᅮН೼᠔᳝ⱘҎ x ੠ y ϞDŽDanghter xy ⱘؐ೼ x ᰃ y ⱘཇ‫ܓ‬ᯊЎ
ⳳˈ৺߭Ў‫؛‬DŽ‫؛‬ᅮ↣ϾҎ㹿ᦣ䗄Ўሲᗻ NameMotherFatherMale ੠ FemaleDŽ಴ℸ↣
Ͼ䆁㒗ḋ՟ᇚࣙ৿ҹ䖭ѯሲᗻ䖯㸠ⱘᦣ䗄ⱘϸϾҎˈҹঞⳂᷛሲᗻ Daughter ⱘؐDŽ՟བˈ
ϟ䴶ЎϔϾℷ՟ˈ݊Ё Sharon Ў Bob ⱘཇ‫ܓ‬DŽ

Name Sharon Mother Louise Father Bob


Male False Female True
Name Bob  Mother Nora  Father Victor
Male True  Female False Daughter True!

݊Ё↣ϾሲᗻৡϞⱘϟᷛᰃЎњऎߚ䖭ϸϾҎDŽ⦄೼ˈབᵰ᧰䲚䆌໮䖭ḋⱘⳂᷛὖᗉ
Daughterⱘ䆁㒗ḋ՟ˈᑊᇚᅗӀᦤկ㒭ϔϾੑ乬㾘߭ᄺд఼ˈབCN ੠Cˈ㒧ᵰᇚЎϔ
㒘䴲ᐌ⡍⅞ⱘ㾘߭བ˖

IF  Father Bob ġ Name Bob ġ Female True 


THEN Daughter True

㱑✊䖭Ͼ㾘߭ᰃℷ⹂ⱘˈԚᅗ䖛Ѣ⡍⅞њˈ಴ℸᅗᇍҞৢⱘߚ㉏޴Т↿᮴⫼໘DŽ䯂乬೼
Ѣˈੑ乬㸼⼎ᮍ⊩ϡ㛑໳ᦣ䗄ሲᗻؐП䯈ᅲ䋼݇㋏DŽϢℸϡৠˈՓ⫼ϔ䰊㸼⼎ⱘ⿟ᑣᇚᄺࠄ
ϟ䴶ⱘϔ㠀㾘߭˖

IF  Father yx ġFemale y THENDaughter xy 

݊Ё x ੠ y Ўব䞣ˈᅗӀৃᣛҷӏᛣҎDŽ

ϔ䰊 Horn ᄤহ䖬ৃᣛᅮࠡӊЁⱘব䞣ϡߎ⦄೼ৢӊЁⱘ㾘߭DŽ՟བᇍ GrandDaughter


ⱘ㾘߭Ў˖

IF  Father yz ġMother zy ġFemale y 


THEN GrandDaughter xy 

⊼ᛣ䆹㾘߭Ёⱘব䞣 zˈᅗᣛҷ y ⱘ⠊҆ˈ೼㾘߭ৢӊЁ≵᳝ߎ⦄DŽᔧϔϾব䞣া೼ࠡ


ӊЁߎ⦄ᯊˈ‫؛‬ᅮᅗᰃ㹿ᄬ೼䞣࣪˄existentiallyquantified˅ⱘˈेা㽕ᄬ೼䆹ব䞣ⱘϔϾ
㑺ᴳ㛑⒵䎇ᇍᑨⱘ᭛ᄫˈ䙷М㾘߭ࠡӊህ⒵䎇DŽ

䖬ৃ㛑೼㾘߭ⱘৢӊ੠ࠡӊЁՓ⫼Ⳍৠⱘ䇧䆡ˈᦣ䗄䗦ᔦⱘ㾘߭DŽབ೼ᴀゴᓔ༈ⱘϸϾ
㾘߭ᦤկњὖᗉ Ancestor xy ⱘ䗦ᔦᅮНDŽҹϟᇚᦣ䗄ⱘ ILP ᄺдᮍ⊩Ꮖৃҹᄺд޴⾡ㅔ
ऩⱘ䗦ᔦߑ᭄ˈࣙᣀབϞ䴶ⱘ Ancestor ߑ᭄ҹঞ݊Ҫϔѯߑ᭄ˈབᇍ߫㸼Ё‫ܗ‬㋴䖯㸠ᥦᑣ˗
Ң߫㸼Ё⿏এϔ⡍ᅮ‫ܗ‬㋴˗ᣐ᥹ϸϾ߫㸼DŽ

10.4.2 ᵥ䈣

೼㒻㓁ҟ㒡ᄺд Horn ᄤহ䲚ⱘㅫ⊩Пࠡˈ‫ܜ‬ҟ㒡ϔѯᔶᓣ䘏䕥Ёⱘ෎ᴀᴃ䇁DŽ᠔᳝ⱘ


㸼䖒ᓣ⬅ᐌ䞣˄བ BobLouise˅ǃব䞣˄བ xy˅
ǃ䇧䆡ヺো˄བ MarriedGreaterBThan˅
ҹঞߑ᭄ヺো˄བ age˅㒘៤DŽ䇧䆡੠ߑ᭄ⱘऎ߿೼Ѣ䇧䆡া㛑পؐⳳ៪‫ˈ؛‬㗠ߑ᭄ⱘপؐ
ৃЎӏᛣᐌ䞣DŽ䖭䞠Փ⫼ᇣ‫ݭ‬ヺো㸼⼎ߑ᭄ˈ໻‫ݭ‬ヺো㸼⼎䇧䆡DŽ

ᇍѢ䖭ѯヺোˈৃབϟᵘ䗴㸼䖒ᓣ˖乍˄term˅ᰃӏᛣᐌ䞣ǃӏᛣব䞣ǃ៪ᑨ⫼ࠄӏᛣ
乍Ϟⱘӏᛣߑ᭄˄՟བ˖Bobxage Bob ㄝ˅DŽϔϾ᭛ᄫ˄literal˅ᰃᑨ⫼ࠄ乍Ϟⱘӏᛣ䇧
䆡៪݊৺ᅮDŽབ Married BobLouise  ™GreaterBThan age Sue  ㄝDŽབᵰϔ᭛ᄫࣙ৿
ϔ৺ᅮヺো˄™˅ˈᇚ݊⿄Ў䋳᭛ᄫ˄negativeliteral˅ˈ৺߭Ўℷ᭛ᄫ˄positiveliteral˅DŽ

ϔϾᄤহ˄clause˅ᰃ໮Ͼ᭛ᄫⱘӏᛣᵤপˈ݊Ё᠔᳝ⱘব䞣‫؛‬ᅮЎܼ⿄䞣࣪ⱘDŽHorn
ᄤহ˄Hornclause˅Ўࣙ৿㟇໮ϔϾℷ᭛ᄫⱘᄤহˈ՟བ˖

H › ™L1 ›  ™Ln 

݊ Ё H Ў ᭛ ᄫ ˈ 㗠 ™L1  ™Ln Ў 䋳 ᭛ ᄫ DŽ ⬅ Ѣ ㄝ ᓣ ( B › ™A) ( B m A) ੠


™( A š B ) (™A › ™B ) ˈϞ䴶ⱘ Horn ᄤহৃ㹿‫ݭ‬Ўབϟᔶᓣ˖

H m ( L1 š  Ln ) 

ᅗϢ៥Ӏࠡ䴶ⱘ㾘߭ㄝӋˈᣝ✻ ifthen ⱘ‫⊩ݭ‬བϟ˖

IF L1 š  š Ln , THEN H 

᮴⊩‫⊩ݭ‬བԩˈHorn ᄤহⱘࠡӊ L1 š  š Ln 㹿⿄Ўᄤহԧ˄body˅៪㗙ᄤহ‫ܜ‬㸠䆡


˄antecedents˅DŽ᭛ᄫ H ৢӊ⿄Ўᄤহ༈˄head˅៪ᄤহ᥼䆎˄consequent˅DŽЎখ㗗ᮍ֓ˈ
䖭ѯᅮНҹঞᴀゴৢᇚҟ㒡ⱘὖᗉ೼㸼  Ё߫ߎDŽ

㸼 10-3 ϔ䰊䘏䕥Ёⱘ෎ᴀᅮН

 ↣Ͼড়ᓣ݀ᓣ⬅ᐌ䞣˄constantˈབ Maryǃ23ǃ៪ Joe˅ǃব䞣˄variableˈབ x˅ǃ䇧䆡˄predicateˈ


བ೼ Female(Mary)Ёⱘ Female˅੠ߑ᭄˄functionˈབ ageˈ೼ age(Mary)˅ᵘ៤DŽ
 乍˄term˅Ўӏᛣᐌ䞣ǃӏᛣব䞣ǃ៪ӏᛣᑨ⫼ࠄ乍䲚ড়Ϟⱘߑ᭄DŽ՟བ Mary, x, age(Mary), age(x)DŽ
 ᭛ ᄫ ˄ literal ˅ ᰃ ᑨ ⫼ ࠄ 乍 䲚 ড় Ϟ ⱘ ӏ ᛣ 䇧 䆡 ៪ ݊ ৺ ᅮ DŽ ՟ བ Female(Mary), ™Female(x),
Greater_than(age(Mary), 20)DŽ
 ෎ᴀ᭛ᄫ˄ground literal˅ᰃϡࣙ৿ӏԩব䞣ⱘ᭛ᄫ˄བ™Female(Joe)˅DŽ
 䋳᭛ᄫ˄negative literal˅ᰃࣙ৿৺ᅮ䇧䆡ⱘ᭛ᄫ˄བ™Female(Joe)˅DŽ
 ℷ᭛ᄫ˄positive literal˅ᰃϡࣙ৿৺ᅮヺোⱘ᭛ᄫ˄བ Female(Joe)˅DŽ
 ᄤহ˄clause˅ᰃ໮Ͼ᭛ᄫⱘᵤপᓣˈM1Ģ…Mnˈ݊Ёⱘ᠔᳝ব䞣ᰃܼ⿄䞣࣪ⱘDŽ
 Horn ᄤহᰃϔϾབϟᔶᓣⱘ㸼䖒ᓣ˖

H m ( L1 š  Ln )
݊ Ё H LĂLn Ў ℷ ᭛ ᄫ DŽ H 㹿 ⿄ Ў Horn ᄤ হ ⱘ ༈ head ៪ ᥼ 䆎 ˄ consequent ˅ DŽ ᭛ ᄫ ড় প ᓣ
L1 š L2 š  š Ln 㹿⿄ЎHornᄤহⱘԧ˄body˅៪㗙‫ܜ‬㸠䆡˄antecedents˅DŽ
 ᇍӏᛣ᭛ᄫ A ੠ Bˈ㸼䖒ᓣ(AĕB)ㄝӋѢ(AĢ™B)ˈ㗠㸼䖒ᓣ™ (AġB)ㄝӋѢ(™AĢ™B)DŽ಴ℸˈϔϾ
Horn ᄤহৃ㹿ㄝᬜഄ‫ݭ‬԰ϟ䴶ⱘᵤপᓣ˖

H › ™L1 ›  › ™Ln
 㕂ᤶ˄substitution˅ᰃϔϾᇚᶤѯব䞣᳓ᤶЎᶤѯ乍ⱘߑ᭄DŽ՟བ㕂ᤶ{x/3, y/z}ᡞব䞣 x ᳓ᤶЎ乍 3
ᑊϨᡞব䞣 y ᳓ᤶЎ乍 zDŽ㒭ᅮϔϾ㕂ᤶ©੠ϔ᭛ᄫ Lˈ៥ӀՓ⫼ L©ҷ㸼ᑨ⫼㕂ᤶ©ࠄ L ᕫࠄⱘ㒧ᵰDŽ
 ϸϾ᭛ᄫL1੠L2ⱘড়ϔ㕂ᤶ˄unifying substitution˅ЎϔϾ㕂ᤶ©ˈՓᕫL1©=L2©DŽ
10.5 ᆜҖж䱬㿺ࡏ䳼φFOIL

᳝䆌໮ㅫ⊩Ꮖ㹿ᦤߎ⫼Ѣᄺдϔ䰊㾘߭៪ Horn ᄤহDŽᴀ㡖Ёᇚҟ㒡 FOIL ⿟ᑣ˄Quinlan


˅ˈᅗՓ⫼ⱘᮍ⊩䴲ᐌ㉏ԐѢࠡ䴶ҟ㒡ⱘᑣ߫㽚Ⲫ੠ learnonerule ㅫ⊩DŽᅲ䰙ϞˈFOIL
ᰃ䖭ѯ䕗ᮽⱘㅫ⊩೼ϔ䰊㸼⼎Ϟⱘ㞾✊ᠽሩDŽᔶᓣ࣪ഄ䆆ˈ⬅ FOIL ᄺдⱘ‫؛‬䆒Ўϔ䰊㾘߭
䲚ˈ݊Ёⱘ㾘߭㉏ԐѢ Horn ᄤহˈԚ᳝ϸϾϡৠ˖佪‫ ⬅ܜ‬FOIL ᄺдⱘ㾘߭↨ϔ㠀ⱘ Horn
ᄤহ᳈ফ䰤ˈ಴Ў᭛ᄫϡ‫ܕ‬䆌ࣙ৿ߑ᭄ヺো˄䖭‫ޣ‬ᇣњ‫؛‬䆒ぎ䯈᧰㋶ⱘ໡ᴖᑺ˅DŽ݊⃵ˈFOIL
㾘߭↨ Horn ᄤহ᳈᳝㸼ᕕ࡯ˈ಴Ў㾘߭ԧЁⱘ᭛ᄫгৃЎ䋳᭛ᄫDŽFOIL Ꮖ㹿ᑨ⫼Ѣ໮⾡䯂
乬乚ඳDŽ՟བˈᅗᏆ⫼Ѣᄺдᖿ䗳ᥦᑣㅫ⊩ Quicksort ⱘ䗦ᔦᅮНˈҹঞᄺдҢড়⊩ẟⲬ⢊
ᗕЁऎߚߎ䴲⊩⢊ᗕDŽ

FOIL ㅫ⊩೼㸼  Ё߫ߎDŽ⊼ᛣ໪ሖᕾ⦃ᇍᑨѢࠡ䴶ᦣ䗄ⱘᑣ߫㽚Ⲫㅫ⊩DŽᅗ↣⃵ᄺ


дϔϾᮄ㾘߭ˈ✊ৢᇚℸ㾘߭㽚Ⲫⱘℷ՟⿏এˈ✊ৢᄺдϟϔ㾘߭DŽㅫ⊩ⱘ‫ݙ‬ሖᕾ⦃ᰃࠡ䴶
ⱘ learnonerule ⱘ঺ϔ⾡ᔶᓣˈᅗᏆ㹿ᠽሩҹ䗖ড়໘⧚ϔ䰊㾘߭DŽ䖬㽕⊼ᛣ FOIL ੠ࠡ䴶
ㅫ⊩ⱘϔѯᖂᇣⱘϡৠDŽ⹂ߛഄ䆆ˈFOIL া᧰ᇏ䙷ѯ乘⌟Ⳃᷛ᭛ᄫԩᯊЎ True ⱘ㾘߭ˈ㗠
ࠡ䴶ⱘㅫ⊩᮶᧰ᇏ乘⌟ԩᯊЎ True ⱘ㾘߭ˈг᧰ᇏ乘⌟ԩᯊЎ False ⱘ㾘߭DŽFOIL 䖬ᑨ⫼
њϔϾㅔऩⱘ⠀ቅ᧰㋶ˈ㗠ϡᰃ᷅⢊᧰㋶˄ेᅗᠻ㸠ⱘ᧰㋶ㄝӋѢᆑᑺЎ  ⱘ᷅⢊᧰㋶˅DŽ

㸼 10-4 ෎ᴀⱘ FOIL ㅫ⊩DŽ

݊Ё㒭ߎњ⫳៤‫׭‬䗝᭛ᄫ Candidate-literal ⱘᮍ⊩੠ FOIL ๲Ⲟ Foil_Gain ⱘᅮНDŽ䆹෎ᴀㅫ


⊩ৃ⿡‫ׂخ‬ᬍҹ᳈དഄ໘⧚᳝ాໄ᭄᥂ˈབ᭛Ё᠔ᦣ䗄ⱘDŽ

FOIL(Target_predicate, Predicates, Examples)


 PosĕExamples Ё Target_predicate Ў True ⱘ៤ਬ
 NegĕExamples Ё Target_predicate Ў False ⱘ៤ਬ
 Learned_rulesĕ{}
 ᔧ Pos ϡぎˈ‫خ‬ҹϟ᪡԰
ᄺдϔϾᮄ㾘߭ NewRule
 NewRuleĕ≵᳝ࠡӊⱘ䇧䆡 Target_predicate 㾘߭
 NewRuleNegĕNeg
 ᔧ NewRuleNeg ϡぎˈ‫خ‬ҹϟ᪡԰
๲ࡴϔϾᮄ᭛ᄫҹ⡍࣪ NewRule
 Candidate_literalsĕᇍ NewRule ⫳៤‫׭‬䗝ᮄ᭛ᄫˈ෎Ѣ Predicates
 Best_literalĕ arg max Foil _ Gain( L, NewRule)
LCandidate _ literals

 ᡞ Best_literal ࡴܹࠄ NewRule ⱘࠡӊ


 NewRuleNegĕNewRuleNeg Ё⒵䎇 NewRule ࠡӊⱘᄤ䲚
 Learned_rulesĕLearned_rules+NewRule
 PosĕPos-{㹿 NewRule 㽚Ⲫⱘ Pos ៤ਬ}
 䖨ಲ Learned_rules

Ў⧚㾷⬅ FOIL ᠻ㸠ⱘ‫؛‬䆒ぎ䯈᧰㋶ˈ᳔དᇚ݊ⳟ԰ᰃሖ⃵࣪ⱘDŽFOIL ໪ሖᕾ⦃Ё↣


⃵ᇚࡴܹϔϾᮄⱘ㾘߭ࠄ݊ᵤপᓣ‫؛‬䆒 LearnedBrules ЁএDŽ↣Ͼᮄ㾘߭ⱘᬜᵰᰃ䗮䖛ࡴܹ
ϔϾᵤপ乍⊯࣪ᔧࠡⱘᵤপ‫؛‬䆒˄े๲ࡴ݊ߚ㉏Ўℷ՟ⱘᅲ՟᭄˅DŽ೼䖭ϔሖ⃵Ϟⳟˈ䖭ᰃ
ϔϾ‫؛‬䆒ぎ䯈Ёⱘ⡍⅞ࠄϔ㠀ⱘ᧰㋶䖛⿟ˈᅗᓔྟѢ᳔⡍⅞ⱘぎᵤপᓣˈ೼‫؛‬䆒䎇໳ϔ㠀ҹ
㟇㽚Ⲫ᠔᳝ℷ՟ᯊ㒜ℶDŽFOIL ⱘ‫ݙ‬ሖᕾ⦃ᠻ㸠ⱘᰃϔ䕗㒚㉦ᑺⱘ᧰㋶ˈҹ⹂ᅮ↣Ͼᮄ㾘߭
ⱘ⹂ߛᅮНDŽ䆹‫ݙ‬ሖᕾ⦃೼঺ϔ‫؛‬䆒ぎ䯈Ё᧰㋶ˈᅗࣙ৿᭛ᄫⱘড়পˈҹᡒࠄϔϾড়পᓣᔶ
៤ᮄ㾘߭ⱘࠡӊDŽ೼䖭Ͼ‫؛‬䆒ぎ䯈Ёˈᅗᠻ㸠ⱘᰃϔ㠀ࠄ⡍⅞ⱘ⠀ቅ᧰㋶ˈᓔྟѢ᳔ϔ㠀ⱘ
ࠡӊ˄ぎࠡӊ˅ˈ✊ৢ๲ࡴ᭛ᄫҹՓ㾘߭⡍࣪Ⳉࠄ݊䙓ᓔ᠔᳝ⱘড՟DŽ

೼ FOIL ੠ࠡ䴶ⱘᑣ߫㽚Ⲫ੠ learnonerule ㅫ⊩П䯈᳝ϸϾ᳔ᅲ䋼ⱘϡৠˈᅗᴹ⑤Ѣ


ℸㅫ⊩ᇍϔ䰊㾘߭໘⧚ⱘ䳔∖DŽ䖭ѯϡৠ೼Ѣ˖

ˊ೼ᄺд↣Ͼᮄ㾘߭ⱘϔ㠀ࠄ⡍⅞᧰㋶ЁˈFOIL Փ⫼њϡৠⱘ㒚㡖ℹ偸ᴹ⫳៤㾘߭ⱘ
‫׭‬䗝⡍࣪ᓣDŽ䖭ϔϡৠᰃЎњ໘⧚㾘߭ࠡӊЁ৿᳝ⱘব䞣DŽ

ˊFOIL Փ⫼ⱘᗻ㛑ᑺ䞣 FoilBGain ϡৠѢ㸼  Ёⱘ➉ᑺ䞣DŽ䖭ᰃЎњऎߚ㾘߭ব


䞣ⱘϡৠ㑺ᴳˈҹঞ⬅Ѣ FOIL া᧰ᇏ㽚Ⲫℷ՟ⱘ㾘߭DŽ

ϟ䴶ϸ㡖ᇚ᳈䆺㒚ഄ㗗㰥䖭ϸϾϡৠП໘DŽ

10.5.1 FOIL ѣⲺُ䘿⢯ौᕅ⭕ᡆ

Ўњ⫳៤ᔧࠡ㾘߭ⱘ‫׭‬䗝⡍࣪ᓣˈFOIL ⫳៤᭄Ͼϡৠⱘᮄ᭛ᄫˈ↣Ͼৃ㹿ऩ⣀ഄࡴࠄ
㾘߭ࠡӊЁDŽ᳈㊒⹂ഄ䆆ˈ‫؛‬ᅮᔧࠡ㾘߭Ў˖

P xxĂxk ĕLĂLn

݊ЁLĂLnЎᔧࠡ㾘߭ࠡӊЁⱘ᭛ᄫˈ㗠P xxĂxk Ў㾘߭༈˄៪ৢӊ˅DŽFOIL⫳


៤䆹㾘߭ⱘ‫׭‬䗝⡍࣪ᓣⱘᮍ⊩ᰃ㗗㰥ヺড়ϟ߫ᔶᓣⱘᮄ᭛ᄫLn˖
x Q(v1,…,vr)ˈ݊ЁQЎ೼PredicatesЁߎ⦄ⱘӏᛣ䇧䆡ৡˈᑊϨvi᮶ৃЎᮄব䞣ˈ
гৃЎᏆ೼㾘߭Ё᳝ⱘব䞣DŽviЁ㟇ᇥϔϾᖙ乏ᰃᔧࠡ㾘߭ЁᏆ᳝ⱘব䞣DŽ
x Equal(xj, xk)ˈ݊Ёxj੠xkЎ㾘߭ЁᏆ᳝ⱘব䞣DŽ
x Ϟ䗄ϸ⾡᭛ᄫⱘ৺ᅮDŽ

Ў䇈ᯢ䖭ϔ⚍ˈ㗗㰥ᕙᄺдⱘ㾘߭ᰃ乘⌟Ⳃᷛ᭛ᄫ GrandDanghter xy ˈ݊Ёᦣ䗄ḋ


՟ⱘ݊Ҫ䇧䆡ࣙᣀ Father ੠ FemaleDŽFOIL Ёⱘϔ㠀ࠄ⡍⅞᧰㋶ᓔྟѢ᳔ϔ㠀ⱘ㾘߭˖

GrandDaughter xy ĕ

ᅗᮁ㿔ᇍӏᛣ x ੠ yˈGrandDaughter 䛑ЎⳳDŽЎ⡍࣪䖭ϔ߱ྟ㾘߭ˈϞ䴶ⱘ䖛⿟⫳៤


ϟ ߫ ᭛ ᄫ ԰ Ў ᇚ ⏏ ࡴ ࠄ 㾘 ߭ ࠡ ӊ Ё ⱘ ‫ ׭‬䗝 ᭛ ᄫ ˖ Equal xy  Female x  Female y 
Father xy Father yx Father xz Father zx Father yz Father zy ˈҹঞ䖭
ѯ᭛ᄫⱘ৺ᅮ˄՟བ˖™Equal xy ˅ DŽ⊼ᛣ䖭䞠 z ᰃϔᮄব䞣ˈ㗠 x ੠ y ᰃᔧࠡ㾘߭ЁᏆ᳝
ⱘDŽ

⦄೼‫؛‬ᅮ೼Ϟ䗄᭛ᄫЁ FOIL 䋾ှഄ䗝ᢽњ Father yz ԰Ў᳔᳝Ꮰᳯⱘ᭛ᄫˈᕫࠄϔ


Ͼ䕗⡍⅞ⱘ㾘߭˖

GrandDaughter xy ĕFather yz 

೼⫳៤Ў䖯ϔℹ⡍࣪䆹㾘߭ⱘ‫׭‬䗝᭛ᄫᯊˈFOIL ⦄㽕㗗㰥ⱘ᭛ᄫ䰸Ϟϔℹ᠔᳝᭛ᄫП
໪ˈ䖬㽕ࡴϞ᭛ᄫˈFemale z Equal zx Equal zy Father zw Father wz ˈҹ
ঞᅗӀⱘ৺ᅮDŽП᠔ҹࡴϞ䖭ѯ᭛ᄫᰃ಴Ў೼ࠡϔℹব䞣 z 㹿ࡴࠄ㾘߭Ёˈ᠔ҹ FOIL 㽕㗗
㰥๲ࡴ঺ϔϾᮄব䞣 wDŽ

བᵰ FOIL 䖭ᯊ䗝ᢽњ Father zx ˈ✊ৢ೼ϟϔᕾ⦃䗝ᢽњ᭛ᄫ Female y ˈᇚᕫࠄ


ϟ䴶ⱘ㾘߭DŽᅗা㽚Ⲫℷ՟ˈ಴ℸˈ㒜ℶњ䖯ϔℹ᧰㋶䆹㾘߭ⱘ⡍࣪ᓣⱘ䖛⿟˖

GrandDaughter xy ĕFather yz ġFather zx ġFemale y 

䖭ᯊˈFOIL ᇚӮ⿏এ㹿䆹ᮄ㾘߭㽚Ⲫⱘ᠔᳝ḋ՟DŽབᵰ䖬᳝᳾㽚Ⲫⱘℷ՟ˈㅫ⊩ᇚᓔ
ྟϟϔϾϔ㠀ࠄ⡍⅞᧰㋶ҹ㦋ᕫᮄⱘ㾘߭DŽ

10.5.2 ᕋሲ FOIL Ⲻᩒ㍘

㽕೼↣ϔℹЁҢ‫׭‬䗝᭛ᄫЁ䗝ᢽ᳔᳝Ꮰᳯⱘ᭛ᄫˈFOIL ೼䆁㒗᭄᥂Ϟ⌟䞣㾘߭ⱘᗻ㛑DŽ
೼ℸ䖛⿟Ёˈᅗ㗗㰥ᔧࠡ㾘߭Ё↣Ͼব䞣ⱘৃ㛑ⱘ㑺ᴳDŽЎ䇈ᯢ䖭ϔ䖛⿟ˈ‫⃵ݡ‬㗗㰥ᄺдⳂ
ᷛ᭛ᄫ GrandDaughter xy ⱘ㾘߭䲚ⱘ՟ᄤDŽ‫؛‬ᅮ䆁㒗᭄᥂ࣙ৿ϟ߫ⱘㅔऩⱘᮁ㿔䲚ড়ˈ
݊ЁՓ⫼㑺ᅮⱘ P xy ৃ㹿䇏԰Āx ⱘ P ᰃ yāDŽ

GrandDaughter VictorSharon Father SharonBob  Father TomBob 


Female Sharon     Father BobVictor 

ᇍ䖭Ͼᇕ䯁ⱘϪ⬠䖬㽕԰ϔ‫؛‬ᅮˈेӏԩ⍝ঞࠄ䇧䆡 GrandDaughterFatherFemale
ঞᐌ䞣 VictorˈSharonˈBob ੠ Tom ⱘ᭛ᄫˈ㢹ᅗӀ≵᳝೼Ϟ䴶߫ߎˈ߭㹿‫؛‬ᅮЎ False˄བˈ
៥Ӏৃҹ䱤৿ഄᮁ㿔™GrandDaughter TomBob ˈ™GrandDaughter VictorVictor ㄝ˅DŽ

Ў䗝ᢽᔧࠡ㾘߭ⱘ᳔Շ⡍࣪ᓣˈFOIL 㗗㰥㾘߭ব䞣㑺ᴳࠄ䆁㒗ḋ՟Ё৘ᐌ䞣ⱘ↣⾡ϡ
ৠⱘᮍᓣDŽ՟བˈ೼߱ྟℹ㾘߭Ў˖

GrandDanghter xy ĕ

㾘߭ব䞣≵᳝㹿ӏԩࠡӊ㑺ᴳˈ಴ℸৃҹ㑺ᴳࠄಯϾᐌ䞣 VictorSharonBob ੠ Tom


ⱘӏᛣ㒘ড়DŽ䖭䞠Փ⫼䆄ো^xBobySharon`ҷ㸼⡍ᅮⱘব䞣㑺ᴳˈेᇚ↣Ͼব䞣᯴ᇘࠄ
ϔᐌ䞣ⱘ㕂ᤶDŽ Ͼᐌ䞣ᇍℸ߱ྟ㾘߭ৃѻ⫳  ⾡ৃ㛑ⱘ㑺ᴳDŽ㗠㑺ᴳ^xVictorySharon`
ᇍᑨⱘᰃℷ՟㑺ᴳˈ಴Ў䆁㒗᭄᥂Ёࣙ৿ᮁ㿔 GrandDaughter VictorSharon DŽ೼ℸ՟Ёˈ
݊Ҫ  ⾡㾘߭‫ܕ‬䆌ⱘ㑺ᴳ˄՟བ㑺ᴳ^xBobyTom`˅㒘៤њ㾘߭ⱘ৺ᅮ䆎᥂ˈ಴Ў䆁㒗
᭄᥂Ё≵᳝ᅗӀⳌᑨⱘᮁ㿔DŽ

೼↣ϔ䰊↉ˈ㾘߭ⱘ䆘Ԅ෎Ѣ䖭ѯℷ՟੠ড՟ব䞣㑺ᴳˈ㗠៥Ӏؒ৥Ѣ䗝ᢽⱘᰃᢹ᳝䕗
໮ℷ՟㑺ᴳ㗠䕗ᇥড՟㑺ᴳⱘ㾘߭DŽᔧᮄ᭛ᄫࡴܹࠄ㾘߭Ёˈ㑺ᴳⱘ䲚ড়ᇚᬍবDŽ⊼ᛣᔧϔ
᭛ᄫࡴܹৢˈᅗᓩܹњϔϾᮄব䞣ˈ䙷М㾘߭ⱘ㑺ᴳ䭓ᑺᇚ๲䭓DŽ՟བˈ㢹Father yz ࡴ
ܹࠄϞ䗄㾘߭ˈ䙷М߱ྟⱘ㑺ᴳ^xVictorySharon`ᇚবЎ᳈䭓ⱘ^xVictorySharon
zBob`DŽ䖬㽕⊼ᛣབᵰᮄব䞣ৃ㑺ᴳࠄ໮Ͼϡৠⱘᐌ䞣ˈ䙷МϢᠽሩৢ㾘߭Ⳍऍ䜡ⱘ㑺ᴳⱘ
᭄Ⳃᇚ໻ѢϢॳྟ㾘߭ऍ䜡ⱘ᭄ⳂDŽ

FOIL Փ⫼䆘Ԅߑ᭄ҹԄ䅵๲ࡴᮄ᭛ᄫⱘᬜ⫼ˈᅗ෎Ѣࡴܹᮄ᭛ᄫࠡৢⱘℷ՟੠ড՟㑺
ᴳ᭄ⳂDŽ᳈㊒⹂ഄ䆆ˈ㗗㰥ᶤ㾘߭ Rˈ੠ϔϾৃ㛑㹿ࡴࠄ R ⱘ㾘߭ԧⱘ‫׭‬䗝᭛ᄫ LDŽҸ R嘔
Ўࡴܹ᭛ᄫ L ࠄ㾘߭ R ৢ⫳៤ⱘ㾘߭DŽFoilBGain LR ⱘؐᅮНЎ˖
§ p1 p0 ·
Foil _ Gain( L, R) { t ¨¨ log 2  log 2 ¸¸ ˄˅
© p1  n1 p 0  n0 ¹

݊ЁpЎ㾘߭Rⱘℷ՟㑺ᴳ᭄ⳂˈnЎRⱘড՟㑺ᴳ᭄Ⳃˈpᰃ㾘߭R嘔ⱘℷ՟㑺ᴳ᭄ˈnЎ
㾘߭R嘔ⱘড՟㑺ᴳ᭄ⳂDŽ᳔ৢˈtᰃ೼ࡴܹ᭛ᄫLࠄRৢҡᮻ㛑㽚Ⲫⱘ㾘߭Rⱘℷ՟㑺ᴳ᭄DŽ
ᔧࡴܹLᓩܹњϔϾᮄব䞣ࠄRЁᯊˈা㽕೼R嘔ⱘ㑺ᴳЁⱘᶤѯ㑺ᴳᠽሩњॳྟⱘ㑺ᴳˈᅗ
Ӏҡ✊㛑㹿㽚ⲪDŽ

p0
䆹 FoilBGain ߑ᭄ৃҹ⫼ֵᙃ䆎ᴹㅔऩഄ㾷䞞DŽᣝ✻ֵᙃ䆎ⱘ⧚䆎ˈ  log 2 ᰃ
p 0  n0
p1
Ўњᇍ㾘߭ R 㛑㽚Ⲫⱘӏᛣℷ՟㑺ᴳ㓪ⷕ᠔䳔ⱘ᳔ᇣԡ᭄DŽⳌԐⱘˈ log 2 ᰃᇍ㾘
p1  n1
߭ R嘔㛑㽚Ⲫⱘӏᛣℷ՟㑺ᴳ㓪ⷕⱘ᳔ᇣԡ᭄DŽ⬅Ѣ t ᰃ R 㛑㽚Ⲫⱘℷ՟㑺ᴳЁҡֱ⬭೼ R嘔
Ёⱘ㑺ᴳˈFoilBGain LR ৃ㹿ⳟ԰˖Ўњ㓪ⷕ R ⱘ᠔᳝ℷ՟㑺ᴳⱘߚ㉏᠔䳔ⱘܼ䚼ԡ᭄⬅
Ѣ L ᏺᴹⱘ‫ޣ‬ᇥDŽ

10.5.3 ᆜҖ䙈ᖈ㿺ࡏ䳼

೼Ϟ䴶ⱘ䅼䆎Ёˈ៥Ӏᗑ⬹њࡴܹࠄ㾘߭ԧЁⱘᄤহЎⳂᷛ䇧䆡ᴀ䑿˄े೼㾘߭༈Ёߎ
⦄ⱘ䇧䆡˅ⱘৃ㛑ᗻDŽ✊㗠ˈབᵰ೼ Predicates ⱘ䕧ܹ߫㸼Ёࣙ৿Ⳃᷛ䇧䆡ˈFOIL ೼⫳៤
‫׭‬䗝᭛ᄫᯊᖙ乏㗗㰥ᅗDŽ䖭‫ܕ‬䆌ᅗѻ⫳䗦ᔦⱘ㾘߭üüे೼㾘߭༈੠㾘߭ԧЁՓ⫼Ⳍৠ䇧䆡
ⱘ㾘߭DŽ՟བˈಲᖚ Ancestor ݇㋏ⱘ䗦ᔦᅮНDŽ⬅ϟ䴶ⱘ㾘߭䲚㸼⼎˖

IF Parent xy     THENAncestor xy 


IF Parent xz ġAncestor zy THENAncestor xy 

㒭ᅮ䗖ᔧⱘ䆁㒗ḋ՟䲚ˈ䖭ϸϾ㾘߭ⱘᄺдৃᣝ✻㉏ԐѢϞ䴶 GrandDaughter ⱘℹ偸DŽ


⊼ᛣা㽕 Ancestor ࣙ৿೼ Predicates ߫㸼Ёˈৢ㗙‫އ‬ᅮњ೼⫳៤ᮄ᭛ᄫᯊ㽕㗗㰥ⱘ䇧䆡ˈϞ
䴶㄀ѠϾ㾘߭ህࣙ৿೼ FOIL ⱘ↣⃵ⱘ᧰㋶ЁDŽᔧ✊䆹⡍ᅮ㾘߭ᰃ৺㛑㹿ᄺдࠄপ‫އ‬Ѣ䖭ѯ
⡍ᅮⱘᄤহ೼ FOIL ⱘ䋾ှ᧰㋶⏤䖯⡍⅞ⱘ㾘߭Ё㛑↨݊Ҫ‫׭‬䗝䆘ߚ᳈催DŽCameronJones 
Quinlan˄˅䅼䆎њ޴Ͼ՟ᄤˈ݊Ё FOIL 㛑៤ࡳഄথ⦄䗦ᔦⱘ㾘߭䲚DŽҪӀ䖬䅼䆎њৃ
㛑ѻ⫳ⱘ䞡㽕䯂乬ˈ↨བབԩ䙓‫ܡ‬೼ᄺд㾘߭䲚Ёѻ⫳᮴䰤䗦ᔦDŽ

10.5.4 FOIL ቅ㔉

ὖᣀⱘ䇈ˈFOIL ᠽሩњ CN ⱘᑣ߫㽚Ⲫㅫ⊩ˈҹ໘⧚㉏ԐѢ Horn ᄤহⱘϔ䰊㾘߭ᄺ


д䯂乬DŽЎᄺд䖭ḋⱘ㾘߭ˈFOIL ᠻ㸠ϔ㠀ࠄ⡍⅞᧰㋶ˈ↣ℹ๲ࡴϔϾᮄⱘ᭛ᄫࠄ㾘߭ࠡ
ӊЁএDŽᮄⱘ᭛ᄫৃЎ㾘߭ࠡӊ៪ৢӊЁᏆ᳝ⱘব䞣ˈ៪㗙ৃᰃϔᮄব䞣DŽ೼↣ϔℹˈᅗՓ
⫼ᓣ  Ёⱘ FoilBGrain ߑ᭄೼‫׭‬䗝ᮄ᭛ᄫЁ䖯㸠䗝ᢽDŽབᵰᮄ᭛ᄫৃᣛ৥Ⳃᷛ䇧䆡ˈ䙷
Мॳ߭Ϟ FOIL ৃᄺдࠄ䗦ᔦ㾘߭䲚DŽ㱑✊䖭ѻ⫳њ঺ϔ໡ᴖᗻˈे䙓‫ܡ‬㾘߭䲚ⱘ᮴䰤䗦ᔦˈ
Ԛ FOIL Ꮖ೼ᶤѯᚙ‫މ‬ϟ៤ࡳഄ⫼Ѣᄺд䗦ᔦ㾘߭䲚DŽ

೼䆁㒗᭄᥂᮴ాໄⱘᚙ‫މ‬ϟˈFOIL ৃᣕ㓁ഄ๲ࡴᮄ᭛ᄫࠄ㾘߭ЁˈⳈࠄᅗϡ㽚Ⲫӏԩ
ড՟DŽЎ໘⧚᳝ాໄ᭄᥂ˈ᧰㋶ⱘ㒜ℶ䳔㽕೼㾘߭㊒ᑺǃ㽚Ⲫᑺ੠໡ᴖᗻП䯈԰ߎᡬЁDŽ
FOIL Փ⫼᳔ᇣᦣ䗄䭓ᑺⱘᮍ⊩ᴹՓ㾘߭๲䭓㒜ℶˈᮄⱘ᭛ᄫা೼ᅗӀⱘᦣ䗄䭓ᑺⷁѢᅗӀ
᠔㾷䞞ⱘ᭄᥂ⱘᦣ䗄䭓ᑺᯊᠡ㹿ࡴܹDŽ䆹ㄪ⬹ⱘ㒚㡖⬅ Quinlan˄˅㒭ߎDŽ঺໪DŽFOIL
ᇍ↣Ͼᄺࠄⱘ㾘߭䖯㸠ৢׂ࠾ˈՓ⫼㄀  ゴ‫އ‬ㄪᷥЁⳌৠⱘ㾘߭ৢׂ࠾ㄪ⬹DŽ

10.6 ֒Ѱ䘼╊㔄Ⲻᖈ㓩

ᔦ㒇䘏䕥㓪⿟᳝঺ϔ⾡ᅠܼϡৠⱘ䗨ᕘˈᅗ෎ѢϔϾㅔऩⱘџᅲ˖ेᔦ㒇ᰃⓨ㒢ⱘ䗚䖛
⿟DŽϔ㠀ᴹ䇈ˈᴎ఼ᄺд⍝ঞⱘᰃབԩᓎゟ㛑㾷䞞㾖ᆳ᭄᥂ⱘ⧚䆎DŽ㒭ᅮᶤѯ᭄᥂D੠ϔѯ
ϡᅠᭈⱘ㚠᱃ⶹ䆚Bˈᄺд䖛⿟ৃ㹿ᦣ䗄Ў⫳៤ϔϾ‫؛‬䆒hˈᅗϢBϔ䍋㾷䞞њDDŽ᳈㊒⹂ഄ
䆆ˈ‫؛‬ᅮབ䗮ᐌ䙷ḋ䆁㒗᭄᥂DЎ䆁㒗ḋ՟ⱘ䲚ড়ˈ↣Ͼḋ՟ᔶᓣЎLJxif xi LjDŽ䖭䞠xiҷ
㸼㄀iϾ䆁㒗ᅲ՟ˈ㗠f xi ҷ㸼ᅗⱘⳂᷛؐDŽ䙷Мᄺд䖛⿟ህᰃЎњথ⦄ϔϾ‫؛‬䆒hˈՓ↣Ͼ
䆁㒗ᅲ՟xiⱘߚ㉏f xi ᰃҢ‫؛‬䆒hǃxiⱘᦣ䗄ǃঞ㋏㒳ⶹ䘧ⱘӏᛣ㚠᱃ⶹ䆚BЁⓨ㒢⌒⫳DŽ

(¢ xi , f ( xi )²  D)( B š h š xi ) ƅf xi   ˄˅

㸼䖒ᓣXƅY䇏԰ĀYҢXЁⓨ㒢⌒⫳ā
ˈ៪㗙ЎĀX⎉㭈˄entail˅YāDŽ㸼䖒ᓣ  ᦣ䗄
њᄺдࠄⱘ‫؛‬䆒hᖙ乏⒵䎇ⱘ㑺ᴳˈेᇍ↣Ͼ䆁㒗ᅲ՟xiˈⳂᷛߚ㉏f xi ᖙ乏ҢBǃh੠xiЁⓨ
㒢⌒⫳DŽ

㗗㰥ϔϾ՟ᄤˈ݊ЁᕙᄺдⱘⳂᷛὖᗉᰃĀϸϾҎuv!Ё u ⱘᄽᄤᰃ vāˈᅗ㸼⼎њ䇧


䆡 Child uv DŽ‫؛‬ᅮ㒭ߎњऩϾℷ՟ Child BobSharon ˈ݊Ёᅲ՟ᦣ䗄Ў᭛ᄫ Male Bob 
Female Sharon ੠ Father SharonBob DŽ䖯ϔℹ‫؛‬ᅮ᳝㚠᱃ⶹ䆚 Parent uv ĕFather uv DŽ
ৃᇚℸᚙᔶᣝᓣ  ᦣ䗄བϟ˖

xi Male Bob Female Sharon Father SharonBob 


f xi  Child BobSharon 
B  Parent uv ĕFather uv 

೼ℸᚙ‫މ‬ϟˈ䆌໮‫؛‬䆒Ё⒵䎇㑺ᴳ ( B š h š xi ) ƅf xi ⱘϸϾ‫؛‬䆒Ў˖

hChild uv ĕFather vu 


hChild uv ĕParent vu 

⊼ᛣⳂᷛ᭛ᄫChild BobSharon ᰃ⬅hġxi⎉㭈ˈϡ䳔㽕㚠᱃ⶹ䆚BDŽ✊㗠ᇍѢ‫؛‬䆒hˈ


ᚙ‫މ‬᳝ѯϡৠDŽⳂᷛChild BobSharon ᰃҢBġhġxiЁ⌒⫳ˈ㗠ϡᰃऩ⣀ⱘhġxiЁ⌒⫳DŽ
䆹՟䇈ᯢњ㚠᱃ⶹ䆚ⱘ԰⫼ˈे䩜ᇍ㒭ᅮⱘ䆁㒗᭄᥂ᠽሩৃ᥹ফⱘ‫؛‬䆒䲚ড়DŽᅗ䖬䇈ᯢᮄⱘ
䇧䆡˄བParent˅ᗢḋᓩܹࠄ‫؛‬䆒˄བh˅ЁˈेՓℸ䇧䆡ϡ೼ॳᴹⱘᅲ՟xiᦣ䗄ЁDŽ䖭ϔ
෎Ѣ㚠᱃ⶹ䆚ᠽሩ䇧䆡䲚ড়ⱘ䖛⿟ˈ䗮ᐌ⿄Ўᓎ䆒ᗻᔦ㒇 constructiveinduction DŽ

ᓣ  ⱘᛣН೼Ѣᅗᡞᄺд䯂乬㕂Ѣⓨ㒢᥼⧚੠ᔶᓣ䘏䕥ⱘḚᶊПϟDŽᇍѢੑ乬䘏䕥
੠ϔ䰊䘏䕥ˈ᳝ϔѯᏆ⧚㾷ᕫᕜདⱘㅫ⊩ৃ㞾ࡼⓨ㒢DŽ᳝䍷ⱘᰃˈ᳝ৃ㛑߽⫼ⓨ㒢᥼⧚ⱘ䗚
䖛⿟ˈҹՓᔦ㒇⊯࣪ⱘ䖛⿟㞾ࡼ࣪DŽᇍĀᔦ㒇ৃ⬅ড䕀ⱘⓨ㒢ᅲ⦄ā䖭ϔ㾖⚍ⱘ⋲ᙝ佪‫ߎܜ‬
⦄Ѣ  Ϫ㑾ⱘ㒣⌢ᄺᆊ WSJevonsˈҪ‫˖ࠄݭ‬

ᔦ㒇ᅲ䰙Ϟᰃⓨ㒢ⱘ䗚᪡԰ˈ㗠Ϩϡ㛑ᛇ䈵≵᳝݊ЁϔϾᯊˈ঺ϔϾӮᄬ೼DŽ಴ℸϡӮ᳝ાϔ
Ͼ᳈䞡㽕ⱘ䯂乬DŽ䇕Ӯ䯂ࡴ⊩੠‫⊩ޣ‬ЁાϔϾᰃ↨䕗䞡㽕ⱘ᭄ᄺ᪡԰ਸ਼˛Ԛৠᯊˈ೼ϔ᪡԰੠ᅗⱘ䗚
᪡԰П䯈ˈ݊䲒ᑺ᳝ᕜ໻ⱘᏂᓖ˗ĂĂᖙ乏ᡓ䅸ˈᔦ㒇ߚᵤ೼䲒ᑺ੠໡ᴖᑺᮍ䴶䛑䖰䖰໻Ѣӏԩⓨ㒢
䯂乬DŽ˄Jevons 1874˅

ᴀゴⱘ࠽ԭ䚼ߚᇚ᥶お䖭⾡ᡞᔦ㒇ⳟ៤䗚ⓨ㒢ⱘ㾖⚍DŽ៥Ӏ೼䖭䞠᠔ᛳ݈䍷ⱘᰃϔ㠀䯂
乬ᰃ䆒䅵ϔϾ䗚⎉㭈ㅫᄤ inverseentailmentoperator DŽϔϾ䗚⎉㭈ㅫᄤO BD Փ⫼䆁㒗
᭄᥂D ^xif xi !`੠㚠᱃ⶹ䆚B԰Ў䕧ܹˈᑊϨ䕧ߎϔ‫؛‬䆒h⒵䎇ᓣ DŽ

O BD h݊Ё (¢ xi , f ( xi )²  D)( B š h š xi ) ƅf xi 

ᔧ✊Ӯ᳝ᕜ໮ϡৠⱘ‫؛‬䆒h⒵䎇 (¢ xi , f ( xi )²  D)( B š h š xi ) ƅf xi DŽ೼ILPЁ䗝ᢽ


‫؛‬䆒ⱘᐌ⫼ਃথᓣ㾘߭Ўձ䌪Ѣ᳔ᇣᦣ䗄䭓ᑺ‫˄߭ޚ‬㾕  㡖˅DŽ

ᇚᄺдӏࡵᔶᓣ࣪ЎᇏᡒϔϾ‫؛‬䆒hՓ݊⒵䎇 (¢ xi , f ( xi )²  D)( B š h š xi ) ƅf xi ˈ


᳝䆌໮᳝਌ᓩ࡯ⱘ⡍⚍˖
x 䖭⾡݀ᓣࣙ৿њϔ⾡᱂䘡ⱘᄺдᅮНᮍ⊩ˈेᇏᡒᶤϾϔ㠀ὖᗉˈᅗϢ㒭ᅮⱘ
䆁㒗ḋ՟Ⳍᢳড়DŽ݊Ё䆁㒗ḋ՟ᇍᑨ≵᳝㚠᱃ⶹ䆚 B ᯊⱘ⡍⅞ᚙ‫މ‬DŽ
x ℸ݀ᓣ䗮䖛ᓩܹ㚠᱃ⶹ䆚BˈৃҹᇍԩᯊϔϾ‫؛‬䆒ৃ㹿⿄԰Āᢳড়ā䆁㒗᭄᥂䖯
㸠᳈‫ⱘߚܙ‬ᅮНDŽ㟇ℸЎℶˈ៥ӀϔⳈ䛑ҙҙ෎Ѣ‫؛‬䆒੠᭄᥂ⱘᦣ䗄ᴹ⹂ᅮϔ
‫؛‬䆒˄བ⼲㒣㔥㒰˅ᰃ৺ᢳড়᭄᥂ˈ㗠ϡձ䌪Ѣᕙᄺдⱘӏࡵ乚ඳDŽⳌডˈ䖭
⾡ᔶᓣ‫ܕ‬䆌乚ඳ⡍ᅮⱘ㚠᱃ֵᙃB៤ЎĀᢳড়āᅮНⱘϔ䚼ߚDŽ⹂ߛഄ䆆ˈhা
೼f(xi)ҢBġhġxiЁⓨ㒢⌒⫳ᯊˈᢳড়䆁㒗ḋ՟<xi,f(xi)>DŽ
x 䗮䖛ᓩܹ㚠᱃ⶹ䆚 Bˈ䆹݀ᓣ㽕∖ᄺдㅫ⊩Փ⫼䖭ϔ㚠᱃ֵᙃᴹᓩᇐ h ⱘ᧰㋶ˈ
㗠ϡᰃা᧰㋶䇁⊩ড়⊩ⱘ‫؛‬䆒ぎ䯈DŽϟ䴶ゴ㡖Ёᦣ䗄ⱘ䗚ᔦ㒧䖛⿟ህҹ䖭⾡ᔶ
ᓣՓ⫼њ㚠᱃ⶹ䆚DŽ

ৠᯊˈᣝ✻䖭⾡݀ᓣⱘᔦ㒇䘏䕥㓪⿟䘛ࠄњ޴⾡ᅲ䏉Ϟⱘೄ䲒DŽ

x ᇍ (¢ xi , f ( xi )²  D)( B š h š xi ) ƅf xi ⱘ㽕∖ᅲ䋼Ϟϡ㛑໘⧚᳝ాໄ᭄᥂DŽ


䯂乬೼Ѣˈ䆹㸼䖒ᓣϡ‫ܕ‬䆌೼㾖ᆳࠄᅲ՟xi੠݊Ⳃᷛؐf(xi)Ёߎ⦄Ꮒ䫭ⱘৃ㛑ᗻDŽ
䖭ḋⱘᏂ䫭ৃ㛑ѻ⫳ᇍhⱘϡϔ㟈㑺ᴳDŽϡᑌⱘᰃˈ໮᭄ᔶᓣ䘏䕥Ḛᶊᅠܼ≵᳝
㛑࡯೼㒭ᅮϡϔ㟈ᮁ㿔ᯊऎߚߎⳳ੠‫؛‬ᴹDŽ
x ϔ䰊䘏䕥䇁㿔ⱘ㸼ᕕ࡯໾ᔎˈ㗠Ϩ⒵䎇 (¢ xi , f ( xi )²  D)( B š h š xi ) ƅf xi
ⱘ‫؛‬䆒᭄䞣໾໮ˈҹ㟇Ѣ‫؛‬䆒ぎ䯈ⱘ᧰㋶೼ϔ㠀ᚙᔶϟᰃ䲒ҹᠻ㸠ⱘDŽ䆌໮䖥
ᳳⱘᎹ԰Ꮖᇏ∖ফ䰤ᔶᓣⱘϔ䰊㸼䖒ᓣ៪݊ҪѠ䰊ⶹ䆚ˈҹᬍ䖯‫؛‬䆒ぎ䯈᧰㋶
ⱘᯧ໘⧚ᗻDŽ
x ሑㅵⳈ㾝Ϟ㚠᱃ⶹ䆚ৃ᳝ࡽѢ䰤ࠊ‫؛‬䆒ⱘ᧰㋶ˈ೼໮᭄ ILP ㋏㒳Ё˄ࣙᣀ᠔᳝
ᴀゴ䅼䆎ⱘ˅ˈ‫؛‬䆒ぎ䯈᧰㋶ⱘ໡ᴖᑺӮ䱣ⴔ㚠᱃ⶹ䆚ⱘ๲ࡴ㗠๲催DŽ˄✊㗠ˈ
ৃ㾕㄀ 11 ੠ 12 ゴЁϔѯㅫ⊩Փ⫼㚠᱃ⶹ䆚ᴹ‫ޣ‬ᇣ㗠ϡᰃ๲ࡴḋᴀ໡ᴖᑺDŽ˅

೼ϟϔ㡖ˈ៥Ӏ㗗ᶹњϔϾᕜ᱂䘡ⱘ䗚⎉㭈ㅫᄤˈᅗ䗮䖛ড䕀ⱘⓨ㒢᥼⧚㾘߭ᴹᵘ䗴‫؛‬
䆒DŽ

10.7 䘼ᖈ㔉

㞾ࡼⓨ㒢ⱘϔ㠀ᮍ⊩ᰃ⫼ Robinson˄˅ᦤߎⱘᔦ㒧㾘߭˄resolutionrule˅DŽᔦ㒧㾘
߭ᰃϔ䰊䘏䕥ЁϔϾড়⧚Ϩᅠ໛ⱘⓨ㒢᥼⧚㾘߭DŽ಴ℸˈৃҹᛇࠄ䖭ḋⱘ䯂乬˖ᰃ৺ৃҹ䗮
䖛ড䕀ᔦ㒧㾘߭ᴹᔶ៤䗚⎉㭈ㅫᄤDŽಲㄨᰃ㚃ᅮⱘˈ㗠Ϩℷᰃ䖭Ͼㅫᄤᔶ៤њ Cigol ⿟ᑣⱘ
෎⸔DŽ˄Muggleton Buntine˅DŽ
ҟ㒡ᔦ㒧㾘᳔߭ᆍᯧⱘᮍ⊩ᰃҹੑ乬㸼⼎ⱘᔶᓣˈᅗৃҹ㹿ᠽሩࠄϔ䰊㸼⼎ЁDŽҸ L
ЎӏᛣϔϾੑ乬᭛ᄫˈᑊҸ P ੠ R Ўӏᛣੑ乬ᄤহDŽᔦ㒧㾘߭Ў˖

P Ģ L

™L Ģ R

P Ģ R

ᅗৃ⧚㾷Ў˖㒭ᅮ㒓ϞⱘϸϾᄤহˈᕫࠄ㒓ϟⱘᄤহDŽⳈ㾝Ϟᔦ㒧㾘߭ᰃ⧚᠔ᔧ✊ⱘDŽ
㒭ᅮϸϾᮁ㿔 PĢL ੠™LĢRˈᰒ✊ L ៪™L Ёᖙ᳝ϔϾЎ‫؛‬DŽ಴ℸˈP ៪ R Ёᖙ᳝ϔϾЎ
ⳳDŽ಴ℸ㒧䆎 PĢR 㚃ᅮᰃ⒵䎇ⱘDŽ

ੑ乬ᔦ㒧ㅫᄤⱘϔ㠀ᔶᓣ೼㸼  Ёᦣ䗄DŽ㒭ᅮϸϾᄤহC੠Cˈᔦ㒧ㅫᄤ佪‫⹂ܜ‬ᅮ


᭛ᄫLᰃ৺ҹℷ᭛ᄫᔶᓣߎ⦄೼ϔϾᄤহЁˈᑊҹ䋳᭛ᄫᔶᓣߎ⦄೼঺ϔᄤহЁDŽ✊ৢᕫࠄ
བϞ݀ᓣЁⱘ㒧䆎DŽ՟བˈ೒  Ꮊջⱘᔦ㒧ㅫᄤDŽ㒭ᅮᄤহC੠Cˈ㄀ϔℹ⹂ᅮ᭛ᄫ
L ™KnowMaterialˈᅗ೼CЁߎ⦄ˈ㗠ᅗⱘ䋳᭛ᄫ™ ™KnowMaterial KnowMaterial೼CЁ
ߎ⦄DŽ᠔ҹ㒧䆎ᰃϔᄤহˈ݊ᔶᓣЎ᭛ᄫC^L` PassExam੠C^™L` ™Studyⱘ㘨ড়DŽВ঺
ϔϾ՟ᄤˈᑨ⫼ᔦ㒧㾘߭ࠄᄤহC AĢBĢCĢ™D੠C ™BĢEĢFᕫࠄ㒧ᵰЎᄤহAĢCĢ
™DĢEĢFDŽ

㸼 10-5 ᔦ㒧ㅫᄤ˄ੑ乬ᔶᓣ˅
DŽ

㒭ᅮᄤহC1੠C2DŽᔦ㒧ㅫᄤᵘ䗴ߎϔᄤহCՓC1ġC2ƅCDŽ

1. 㒭ᅮ߱ྟᄤহC1੠C2ˈҢᄤহC1ЁᇏᡒϔϾ᭛ᄫLˈᑊϨ™Lߎ⦄೼C2ЁDŽ
2. 䗮䖛ড়ᑊC1੠C2Ёⱘ䰸њL੠™L໪ⱘ᠔᳝᭛ᄫˈᔶ៤ᔦ㒧ᓣCDŽ᳈㊒⹂ഄˈߎ⦄೼㒧ᵰCЁⱘ᭛ᄫ䲚ড়
Ў˖

C (C1  {L}) ‰ (C 2  {™L})


݊ЁĤ㸼⼎䲚ড়ᑊˈĀˉā㸼⼎䲚ড়ᏂDŽ

插图——原书页码:295

೒ 10-2 ᔦ㒧੠䗚ᔦ㒧ⱘ՟ᄤ

Ꮊ䖍Ўᑨ⫼ᔦ㒧㾘߭˄ⓨ㒢ⱘ˅Ң㒭ᅮᄤহC1੠C2Ё᥼⧚ߎᄤহCDŽে䖍Ў݊䗚䖛⿟ⱘᑨ⫼˄ᔦ
㒇ⱘ˅ˈҢC੠C1Ё᥼䆎ߎC2DŽ

ᕜᆍᯧ⫼ᔦ㒧ㅫᄤⱘ䗚䕀ᴹᔶ៤ϔᠻ㸠ᔦ㒇᥼⧚ⱘ䗚⎉㭈ㅫᄤO CC DŽϔ㠀ᴹ䇈ˈ


䗚⎉㭈ㅫᄤᖙ乏೼㒭ᅮᔦ㒧ᓣC੠ϔ߱ྟᄤহCᯊ᥼ᇐߎ঺ϔ߱ྟᄤহCDŽ㗗㰥ϔϾ՟ᄤˈ
㒭ᅮᔦ㒧ᓣC AĢBϨ߱ྟᄤহC BĢDDŽབԩ᥼ᇐߎᄤহCҹՓCġCƅC˛佪‫⊼ˈܜ‬ᛣ⬅
ᔦ㒧ㅫᄤⱘᅮНˈӏᛣߎ⦄೼CЁԚϡ೼CЁⱘ᭛ᄫᖙ乏Ꮖ೼CЁߎ⦄DŽ೼䖭Ͼ՟ᄤЁˈᅗ
㸼⼎Cᖙ乏ࣙ৿᭛ᄫADŽ݊⃵ˈ೼CЁߎ⦄Ԛϡ೼CЁⱘ᭛ᄫᖙЎᔦ㒧㾘߭⿏এњⱘ᭛ᄫˈ
಴ℸᅗⱘ䋳᭛ᄫᖙ乏೼C ЁDŽ೼ℸ՟Ёˈᅗ㸼⼎Cᖙ乏ࣙ৿᭛ᄫ™DDŽ಴ℸC AĢ™DDŽ䇏
㗙ৃҹᕜᆍᯧഄ偠䆕ˈᑨ⫼ᔦ㒧㾘߭ࠄC੠C⹂ᅲѻ⫳њ᠔Ꮰᳯⱘᔦ㒧ᓣCDŽ

⊼ᛣ೼Ϟ՟ЁC᳝঺ϔ⾡ৃ㛑ⱘ㾷DŽ⹂ߛഄ䆆ˈCৃҹᰃ᳈⡍⅞ⱘᄤহAĢ™DĢBDŽℸ
㾷Ϣ㄀ϔϾ㾷ⱘϡৠ೼ѢCЁࣙ৿њϔϾCЁߎ⦄ⱘ᭛ᄫDŽҢЁৃᕫࠄⱘϔ㠀䆎⚍೼Ѣˈ䗚
ᔦ㒧ᰃϡ⹂ᅮⱘˈेৃ㛑᳝໮ϾᄤহCՓC੠Cѻ⫳ᔦ㒧ᓣCDŽ೼݊Ё䖯㸠䗝ᢽⱘϔϾਃথ
ᓣᮍ⊩Ў‫أ‬ད᳈ⷁⱘᄤহˈ៪ㄝӋഄˈ‫؛‬ᅮCϢC≵᳝݅ৠⱘ᭛ᄫDŽབᵰᓩܹ䖭⾡ᇍⷁᄤহ
ⱘ‫أ‬དˈᇍ䗚ᔦ㒧䖛⿟ⱘϔ㠀ᦣ䗄㾕㸼 DŽ

㸼 10-6 䗚ᔦ㒧ㅫᄤ˄ੑ乬ᔶᓣ˅
DŽ

㒭ᅮϸᄤহC੠C1ˈᅗ䅵ㅫߎC2ՓCġCƅCDŽ

1. 㒭ᅮ߱ྟᄤহC1੠CˈᇏᡒϔϾ᭛ᄫLˈᅗߎ⦄೼ᄤহC1ЁԚϡߎ⦄೼CЁDŽ
2. 䗮䖛ࣙ৿ϟ߫ⱘ᭛ᄫˈᔶ៤㄀ѠϾᄤহC2˖

C2 (C  (C1  {L})) ‰ {™L}

៥Ӏৃҹ෎Ѣབ䗚ᔦ㒧䖭ḋⱘ䗚⎉㭈ㅫᄤᓔথߎ㾘߭ᄺдㅫ⊩ᴹDŽ⹂ߛഄ䆆ˈᄺдㅫ⊩
ৃՓ⫼䗚⎉㭈ᴹᵘ䗴ߎ‫؛‬䆒ˈℸ‫؛‬䆒Ϣ㚠᱃ⶹ䆚ϔ䍋⎉㭈䆁㒗᭄᥂DŽϔ⾡ㄪ⬹ᰃՓ⫼ᑣ߫㽚
Ⲫㅫ⊩ˈᕾ⦃ഄҹ䖭⾡ᮍ⊩ᄺдHornᄤহ䲚DŽ೼↣⃵ᕾ⦃Ёˈㅫ⊩䗝ᢽ≵᳝㹿ҹࠡᄺдࠄ
ⱘᄤহ㽚ⲪⱘϔϾ䆁㒗ḋ՟xif xi !DŽ✊ৢᑨ⫼ᔦ㒧㾘߭ᴹ⫳៤⒵䎇 ( B š h š xi ) ƅf xi
ⱘ‫׭‬䗝‫؛‬䆒hiˈ݊ЁBЎ㚠᱃ⶹ䆚ࡴϞҹࠡᕾ⦃ЁᄺࠄⱘӏᛣᄤহDŽ⊼ᛣ䖭ᰃϔϾḋ՟偅ࡼ
ⱘ᧰㋶ˈ಴Ў↣Ͼ‫׭‬䗝‫؛‬䆒ⱘᓎゟᰃЎњ㽚Ⲫϔ⡍ᅮḋ՟DŽᔧ✊བᵰᄬ೼໮Ͼ‫׭‬䗝‫؛‬䆒ˈ䙷
М೼݊Ё䗝ᢽⱘㄪ⬹ᰃ䗝প೼݊Ҫḋ՟Ϟг᳔᳝催㊒ᑺⱘ‫؛‬䆒DŽCigol⿟ᑣՓ⫼њ㒧ড়䖭⾡
ᑣ߫㽚Ⲫㅫ⊩ⱘ䗚ᔦ㒧ˈҹℸϢ⫼᠋䖯㸠ѸѦҹ㦋ᕫ䆁㒗ḋ՟ᑊᓩᇐ݊೼ৃ㛑ⱘᔦ㒇᥼⧚ℹ
ⱘᎼ໻ぎ䯈Ёⱘ᧰㋶DŽ✊㗠CigolՓ⫼њϔ䰊㸼⼎㗠ϡᰃੑ乬㸼⼎DŽϟ䴶៥Ӏᦣ䗄Ў໘⧚ϔ
䰊㸼⼎᠔䳔ᇍᔦ㒇㾘߭ⱘᠽሩDŽ

10.7.1 ж䱬ᖈ㔉

ᔦ㒧㾘߭ৃҹᕜᆍᯧഄᠽሩࠄϔ䰊㸼⼎ЁDŽབੑ乬䘏䕥Ёϔḋˈᅗ䳔㽕䕧ܹϸϾᄤহˈ
䕧ߎ㄀ϝϾᄤহDŽᅗϢੑ乬ᔦ㒧ⱘ݇䬂ϡৠ೼Ѣˈ䖭ϔ䖛⿟བҞ㽕෎Ѣড়ϔ˄unifying˅㕂
ᤶ᪡԰DŽ

ᅮН㕂ᤶ substitution Ўব䞣ࠄ乍ⱘӏᛣ᯴ᇘDŽ՟བˈ㕂ᤶ© ^xBobyz`㸼⼎ব䞣 x


᳓ᤶЎ乍 Bobˈ㗠ব䞣 y ᳓ᤶЎ乍 zDŽՓ⫼ヺো W©ҷ㸼ᑨ⫼ࠄϔ㕂ᤶ©ࠄᶤ㸼䖒ᓣ W ⱘ㒧
ᵰDŽ՟བˈ㢹 L ᰃ᭛ᄫ Father xBill ˈϨ©ЎϞ䗄ⱘ㕂ᤶˈ߭ L© Father BobBill DŽ

བᵰL© L©ˈ߭⿄©Ўϸ᭛ᄫL੠Lⱘড়ϔ㕂ᤶ˄unifyingsubstitution˅DŽ՟བˈ㢹
L Father xy ˈL Father Billz ˈϨ© ^xBillzy`ˈ䙷М©ᰃL੠Lⱘড়ϔ㕂ᤶˈ಴
ЎL© L© Father Billy DŽড়ϔ㕂ᤶⱘᛣНᰃ˖೼ᔦ㒧ⱘੑ乬ᔶᓣЁˈϸᄤহC੠Cⱘ
ᔦ㒧ᓣⱘ㦋ᕫᰃ䗮䖛⹂ᅮϔ೼CЁⱘᄤহLᑊϨ™L೼CЁDŽ೼ϔ䰊ᔦ㒧Ёˈᅗ᥼ᑓЎҢᄤহ
CЁᇏᡒϔ᭛ᄫL੠೼CЁᇏᡒ᭛ᄫLˈՓᕫৃᡒࠄᇍѢL੠™Lⱘᶤড়ϔ㕂ᤶ©˄ेˈՓL
© ™L©˅DŽᔦ㒧㾘߭✊ৢᣝϟ䴶ⱘㄝᓣᓎゟᔦ㒧ᓣC˖

C (C1  {L1 })T ‰ (C 2  {L2 })T   


ᔦ 㒧 㾘 ߭ ⱘ ϔ 㠀 ᦣ 䗄 㾕 㸼  DŽ Ў 䇈 ᯢ ᅗ ˈ ‫ ؛‬ᅮ C White x ĕ Swan x ঞ
C Swan Fred DŽ Ў ᑨ ⫼ ᔦ 㒧 㾘 ߭ 佪 ‫ ܜ‬ᇚ C ㄝ Ӌ ഄ 㸼 ⼎ Ў ᄤ হ ⱘ ᔶ ᓣ C White x Ģ
™Swan x DŽ✊ৢৃᑨ⫼ᔦ㒧㾘߭DŽ㄀ϔℹˈ‫ܜ‬ᡒࠄCЁⱘ᭛ᄫL ™Swan x ੠CЁⱘ᭛ᄫ
L Swan Fred DŽབᵰ䗝ᢽড়ϔ㕂ᤶ© ^xFred`ˈ߭ϸϾᄤহ⒵䎇L© ™L© ™Swan Fred DŽ
಴ℸˈ㒧䆎CЎ C^L` © White Fred ੠ C^L` © ‡ˈेC White Fred DŽ

㸼 10-7 ᔦ㒧㾘߭˄ϔ䰊ᔶᓣ˅

1. ᇏᡒC1Ёⱘ᭛ᄫL1ˈC2Ёⱘ᭛ᄫL2ˈҹঞ㕂ᤶ©ˈՓᕫL© ™L©DŽ
2. 䗮䖛ࣙ৿C1©੠C©Ё䰸њL©੠™L©ҹ໪ⱘ᭛ᄫˈᔶ៤ᔦ㒧ᓣCDŽ᳈㊒⹂ഄ䆆ˈߎ⦄೼㒧䆎CЁⱘ
᭛ᄫ䲚ড়Ў˖

C (C1  {L1 })T ‰ (C 2  {L2 })T

10.7.2 䘼ᖈ㔉φж䱬᛻߫

៥Ӏৃҹ⫼ߚᵤ⊩᥼ᇐߎ䗚ᔦ㒧ㅫᄤˈᮍ⊩ᰃ䗮䖛ᇍᅮНᔦ㒧㾘߭ⱘᓣ  䖯㸠ҷ᭄


᪡԰DŽ佪‫⊼ˈܜ‬ᛣᓣ  Ёⱘড়ϔ㕂ᤶ©ৃ㹿ᚳϔഄߚ㾷Ў©੠©ˈ݊Ё© ©©ˈ©ࣙ
৿⍝ঞᄤহCЁব䞣ⱘ᠔᳝㕂ᤶˈ㗠©ࣙ৿⍝ঞCЁব䞣ⱘ᠔᳝㕂ᤶDŽ䆹ߚ㾷ⱘড়⧚ᗻ೼
ѢC੠CᘏᰃᓔྟѢϡৠⱘব䞣ৡ˄಴ЎᅗӀᰃϡৠⱘܼ⿄䞣࣪䰜䗄˅DŽՓ⫼©ⱘ䖭⾡ߚ㾷ˈ
ৃᇚᓣ  䞡ᮄ㸼䖒Ў˖

C (C1  {L1 })T 1 ‰ (C 2  {L2 })T 2 

䆄ԣ䖭䞠ⱘ‫ޣ‬োĀāҷ㸼䲚ড়ᏂDŽ⦄೼བᵰ䰤ࠊ䗚ᔦ㒧ㅫᄤЎ᥼⧚ߎⱘCЁ≵᳝ϢC݅
ৠⱘ᭛ᄫ˄㸼⼎‫أ‬ད᳔ⷁⱘCᄤহ˅
ˈ䙷МৃᇚϞᓣ‫ݭ‬Ў˖

C  (C1  {L1 })T 1 (C 2  {L2 })T 2 

1
᳔ৢৃՓ⫼ᔦ㒧㾘߭ⱘᅮН L2 ™L1T 1T 2 ˈ㾷ߎCᴹᕫࠄ

䗚ᔦ㒧˖

1 1
C2 (C  (C1  {L1 })T 1 )T 2 ‰ {™L1T 1T 2 } ˄˅

ᓣ  㒭ߎњϔ䰊䘏䕥ⱘ䗚ᔦ㒧㾘߭DŽབ೼ੑ乬ᔶᓣЁˈℸ䗚⎉㭈ㅫᄤᰃ䴲⹂ᅮᗻⱘDŽ
⹂ߛഄ䆆ˈ೼ᑨ⫼ᅗⱘ䖛⿟Ёˈϔ㠀ৃᡒࠄᕙᔦ㒧ⱘᄤহC੠㕂ᤶ©੠©ⱘ໮⾡䗝ᢽDŽ↣
ϔ㒘䗝ᢽ䛑ѻ⫳ϔϾϡৠⱘC㾷DŽ

೒  ೒⼎њℸ䗚ᔦ㒧㾘߭ᑨ⫼೼ϔㅔऩ՟ᄤϞⱘ໮Ͼℹ偸DŽ೼೒Ёˈ៥ӀᏠᳯḍ᥂
㒭 ᅮ ⱘ 䆁 㒗 ᭄ ᥂ D GrandChild Bob Shannon ੠ 㚠 ᱃ ֵ ᙃ B ^Father Shannon Tom 
Father TomBob `ˈᄺдࠄⳂᷛ䇧䆡GrandChild yx ⱘ㾘߭DŽ㗗㰥೒  Ё䗚ᔦ㒧ᷥⱘ
᳔ϟ䴶ϔℹDŽ䖭䞠ˈ៥Ӏ䆒㕂㒧䆎CЎ䆁㒗ḋ՟GrandChild BobShannon ˈᑊϨҢ㚠᱃
ֵᙃЁ䗝ᢽᄤহC Father ShannonTom DŽЎᑨ⫼䗚ᔦ㒧ㅫᄤˈᇍѢ᭛ᄫLা᳝ϔ⾡䗝ᢽˈ
 
⿄ЎFather ShannonTom DŽ‫؛‬ᅮ៥Ӏ䗝ᢽ䗚㕂ᤶ© ^`Ϩ© ^Shannonx`DŽ೼ℸᚙ‫މ‬ϟˈ
1 1
ᕫࠄⱘᄤহC Ўᄤহ (C  (C1  {L1 })T 1 )T 2 (CT 1 )T 2 GrandChild ( Bob, x) ੠ᄤহ
1
{™L1T 1T 2 } ™Father ( x, Tom) ⱘ 㘨 ড় DŽ ಴ ℸ 㒧 ᵰ Ў ᄤ হ GrandChild ( Bob, x ) › 
™Father(x,Tom)ˈ៪ㄝӋⱘᄤহ GrandChild ( Bob, x) m Father ( x, Tom ) DŽ⊼ᛣ䖭Ͼϔ㠀㾘
߭ϢCϔ䍋⎉㭈њ䆁㒗ḋ՟GrandChild BobShanon DŽ

ҹⳌԐⱘᮍᓣˈ᥼⧚ᕫࠄⱘᄤহৃ԰Ў㄀ѠϾᔦ㒧ℹЁⱘ㒧䆎 Cˈབ೒ ᠔⼎DŽ೼


䖭ϸℹЁⱘ↣ϔℹЁ䛑ৃ㛑᳝໮Ͼ䕧ߎˈ䖭প‫އ‬Ѣᇍ㕂ᤶⱘ䗝ᢽ˄㾕д乬 ˅DŽ೼೒ 
ⱘ ՟ ᄤ Ё ˈ ⡍ ᅮ ⱘ 䗝 ᢽ ѻ ⫳ њ Ⳉ 㾝 Ϟ ৃ ⒵ 䎇 ⱘ ᳔ 㒜 ᄤ হ GrandChild ( y , x) m 
Father ( x, z ) š Father ( z , y ) DŽ

插图——原书页码:298

೒ 10-3 ϔϾ໮ℹ䗚ᔦ㒧

݊ЁᏺᮍḚⱘᄤহЎ᥼⧚ℹⱘ㒧ᵰDŽ೼↣ϔℹˈCᰃԡѢᑩ䚼ⱘᄤহˈC1 ᰃᎺ䖍ⱘᄤহˈC2
ᰃে䖍ᏺᮍḚⱘᄤহDŽ೼䖭ϸϾ᥼⧚ℹЁˈ©䛑ᰃぎ㕂ᤶˈ㗠©㕂ᤶᰒ⼎೼C ϟᮍDŽ⊼ᛣ᳔㒜
ⱘ㒧䆎˄᳔েϞ㾦ⱘᏺᮍḚᄤহ˅ᰃHornᄤহGrandChild yx mFather xz šFather zy ⱘ঺
ϔ⾡ᔶᓣDŽ

10.7.3 䘼ᖈ㔉ቅ㔉

ὖᣀഄ䆆ˈ䗚ᔦ㒧ᦤկњϔ⾡ϔ㠀ⱘ䗨ᕘҹ㞾ࡼѻ⫳⒵䎇㑺ᴳ ( B š h š xi ) ƅf xi ⱘ
‫؛‬䆒hDŽ䖭ᰃ䗮䖛䗚䕀ᓣ  㒭ߎⱘᔦ㒧㾘߭ᕫࠄⱘDŽҢℸᔦ㒧㾘߭Ё㾷ߎᄤহCˈᓣ 
Ёⱘ䗚ᔦ㒧㾘߭ⱘᕜᆍᯧ᥼ᇐߎDŽ

㒭ᅮϔ㒘ᓔྟᄤহˈৃ䗮䖛䞡໡ᑨ⫼ℸ䗚ᔦ㒧㾘߭⫳៤໮Ͼ‫؛‬䆒DŽ⊼ᛣ䗚ᔦ㒧㾘߭‫݋‬᳝
ϔ Ӭ ⚍ ˈ ᅗ া ⫳ ៤ ⒵ 䎇 ( B š h š xi ) ƅ  f xi ⱘ ‫ ؛‬䆒 DŽ Ⳍ ড ˈ FOIL ⱘ ⫳ ៤ ‫ ⌟ ݡ‬䆩
˄generate-and-test˅᧰㋶೼↣ϔ᧰㋶ℹ⫳៤໮Ͼ‫؛‬䆒ˈࣙᣀϔѯϡ⒵䎇ℸ㑺ᴳⱘDŽ✊ৢFOIL
䗮䖛㗗㰥᭄᥂Dᴹ೼䖭ѯ‫؛‬䆒Ё԰ߎ䗝ᢽDŽ⬅Ѣ䖭ϔᏂᓖˈ៥Ӏৃᳳᳯ෎Ѣ䗚ᔦ㒧ⱘ᧰㋶᳈
᳝䩜ᇍᗻϨ᳈᳝ᬜDŽ✊㗠ᅲ䰙᳾ᖙབℸDŽϔϾॳ಴ᰃ䗚ᔦ㒧ㅫᄤ೼ӏᛣϔℹ⫳៤ᅗⱘ‫؛‬䆒ᯊˈ
া㛑㗗㰥ৃ⫼᭄᥂Ёⱘϔᇣ䚼ߚDŽ㗠FOIL㗗㰥᠔᳝ⱘৃ⫼᭄᥂ˈ೼݊ᣝ䇁⊩⫳៤ⱘ‫؛‬䆒Ё
䖯㸠䗝ᢽDŽՓ⫼䗚⎉㭈੠Փ⫼⫳៤‫⌟ݡ‬䆩ϸ⾡᧰㋶ㄪ⬹ⱘᏂ߿ҡᰃϔϾⷨおЏ乬DŽSrinivasan
ㄝ˄˅ᦤկњᇍ䖭ϸ⾡ᮍ⊩ⱘᅲ偠ᗻ↨䕗DŽ

10.7.4 ⌑ौȽ­ऻᇯૂ⏫㮪

ࠡϔ㡖ᣛߎњᔦ㒇੠䗚⎉㭈П䯈ⱘ㘨㋏DŽ⬅Ѣҹࠡⴔ䞡Ѣ䆆䗄೼‫؛‬䆒᧰㋶Ёⱘϔ㠀ࠄ⡍
⅞ᑣˈ䙷М᳝ᖙ㽕ⷨお moregeneralthan ݇㋏੠䗚⎉㭈П䯈ⱘ㘨㋏DŽЎ䇈ᯢℸˈ㗗㰥བϟ
ⱘᅮН˖
x more-general-thanDŽ㄀ 2 ゴЁⱘmore-general-than-or-equal-to݇㋏˄ıg˅ᅮНЎ˖
㒭ᅮϸᏗᇨؐߑ᭄hj(x)੠hk(x)ˈ៥Ӏ⿄hjıg hkᔧϨҙᔧ (x)hk ( x) o h j ( x) DŽℸ
ıg݇㋏㹿⫼Ѣ䆌໮ᄺдㅫ⊩Ёҹᓩᇐ‫؛‬䆒ぎ䯈ⱘ᧰㋶DŽ
x ©-ࣙᆍ˄©-subsumption˅DŽ㗗㰥ϸϾᄤহCj੠CkˈᅗӀⱘᔶᓣ䛑ᰃHĢL1Ģ…Lnˈ
݊ЁHЎϔℷ᭛ᄫˈ㗠LiЎӏᛣ᭛ᄫDŽ⿄ᄤহCj©-ࣙᆍᄤহCkˈᔧϨҙᔧᄬ೼ϔ
Ͼ㕂ᤶՓ C jT Ž C k˄䖭䞠៥ӀᇚӏᛣᄤহCᦣ䗄Ў݊ᵤপᓣЁ৘᭛ᄫⱘ䲚ড়˅DŽ
䆹ᅮН㾕Plotkin˄1970˅DŽ
x ⎉㭈˄entailment˅㗗㰥ϸᄤহCj੠CkDŽᄤহCj㹿⿄Ў⎉㭈ᄤহCk˄‫ݭ‬԰CjƅCk˅
ᔧϨҙᔧCkҢCjЁⓨ㒢⌒⫳DŽ

䖭ϝϾᅮНП䯈᳝ҔМ‫ݙ‬೼㘨㋏˛佪‫ˈܜ‬ᇚıgⱘᅮН䞡ᮄ㸼⼎Ўϔ䰊ᔶᓣˈབ঺ϸϾ
ᅮНϔḋDŽབᵰᇍᶤⳂᷛὖᗉc x 㗗㰥ϔᏗᇨؐ‫؛‬䆒h x ˈ݊Ёh x 㸼⼎Ў᭛ᄫⱘড়পˈ䙷
Мৃ䞡ᮄ㸼⼎ℸ‫؛‬䆒Ўᄤহ˖

c x ĕh x 

䖭䞠៥Ӏ䙉ᕾ䗮ᐌⱘProlog㾷䞞ˈेx㢹ϡ㛑㹿䆕ᯢЎℷ՟ᯊˈ߭x㹿ߚ㉏Ўড՟DŽ಴ℸˈ
ৃⳟߎࠡ䴶ᅮНⱘıgᑨ⫼ѢHornᄤহⱘࠡӊ˄៪㾘߭ԧ˅DŽHornᄤহ䱤৿ⱘৢӊЎⳂᷛὖᗉ
c x DŽ

ıgᅮН੠©ࣙᆍᅮНП䯈ⱘ݇㋏ᰃҔМ˛⊼ᛣབᵰhıghˈ߭ᄤহCc x ĕh x
ᰃ©ࣙᆍᄤহCc x ĕh x DŽ᳈䖯ϔℹˈेՓ೼ᄤহ᳝ϡৠⱘ༈䚼ᯊˈ©-ࣙᆍгৃ៤ゟDŽ
՟བˈϟ䴶ⱘᚙᔶЁᄤহA©ࣙᆍᄤহB˖

AMother xy   ĕFather xz ġSpouse zy 


BMother xLouise ĕFather xBob ġSpouse Boby ġFemale x 

಴Ўབᵰ䗝ᢽ© ^yLouisezBob`߭ AT Ž B DŽ䖭䞠ⱘ݇䬂ऎ߿೼Ѣıg䱤৿‫؛‬ᅮњϸ


Ͼᄤহⱘ༈䚼ᰃⳌৠⱘˈ㗠©-ࣙᆍৃ೼ᄤহ༈䚼ϡৠᯊ៤ゟDŽ

᳔ৢˈ©ࣙᆍᰃ⎉㭈ⱘϔ⾡⡍⅞ᔶᓣDŽेˈབᵰᄤহ A©ࣙᆍᄤহ Bˈ߭ AƅBDŽ✊


㗠ˈ៥Ӏৃᡒࠄ䖭ḋⱘ A ੠ BˈՓ AƅB Ԛ A ᑊϡ©ࣙᆍ BDŽ՟བϟ䴶ϸϾᄤহ˖

AElephant fatherBof x    ĕElephant x 

BElephant fatherBof fatherBof y ĕElephant y 

݊Ё fatherBof x Ўϔߑ᭄ˈҷ㸼 x ⱘ⠊҆DŽ⊼ᛣ㱑✊ B ৃ⬅ A ᕫࠄ䆕ᯢˈैϡᄬ೼㕂


ᤶ©Փ A©ࣙᆍ BDŽ

བ䖭ѯ՟ᄤ᠔⼎ˈࠡ䴶ᇍ moregeneralthan ⱘᅮНᰃ©ࣙᆍⱘϔ⾡⡍⅞ᚙ‫ˈމ‬㗠©


ࣙᆍজᰃ⎉㭈ⱘ⡍⅞ᚙ‫މ‬DŽ಴ℸˈ䗮䖛⊯࣪੠⡍࣪‫؛‬䆒ᴹ᧰㋶‫؛‬䆒ぎ䯈↨⫼ϔ㠀ⱘ䗚⎉㭈ㅫ
ᄤᴹ᧰㋶᳈Ўሔ䰤DŽϡᑌⱘᰃˈ䗚⎉㭈䖭⾡᳔ϔ㠀ⱘᔶᓣৃѻ⫳᮴⊩໘⧚ⱘ᧰㋶DŽ✊ৢЁ䯈
ⱘ©ࣙᆍⱘᅮНᦤկњԡѢ moregeneralthen ੠⎉㭈Ё䯈ⱘϔ⾡ὖᗉDŽ

10.7.5 Progol

㱑✊ᇍѢ⫳៤‫׭‬䗝‫؛‬䆒ˈ䗚ᔦ㒧ᰃϔ⾡ᕜ਌ᓩҎⱘᮍ⊩DŽ೼ᅲ䏉Ёᅗᕜᆍᯧᇐ㟈‫׭‬䗝‫؛‬
䆒ⱘ㒘ড়⟚⚌DŽ঺ϔ⾡䗨ᕘᰃাՓ⫼䗚⎉㭈ᴹ⫳៤ϔϾ᳔⡍⅞‫؛‬䆒ˈᅗϢ㚠᱃ֵᙃϔ䍋⎉㭈
㾖ᆳⱘ᭄᥂DŽ✊ৢˈ䖭Ͼ᳔⡍⅞‫؛‬䆒ৃ⫼Ѣ⹂ᅮ‫؛‬䆒ぎ䯈ⱘϔ㠀ࠄ⡍⅞᧰㋶䖍⬠ˈϢ FOIL
ЁՓ⫼ⱘ᧰㋶ϔḋˈԚ᳝ϔ᳈໮ⱘ䰤ࠊ˖া㗗㰥↨ℸ䖍⬠᳈ϔ㠀ⱘ‫؛‬䆒DŽ䆹ᮍ⊩㹿⫼Ѣ Progol
㋏㒳ˈᅗⱘㅫ⊩ৃὖ䗄བϟ˖
ˊ⫼᠋ᣛᅮՓ⫼ϔϾফ䰤ⱘϔ䰊㸼⼎䇁㿔Ў‫؛‬䆒ぎ䯈ˤDŽ䖭ѯ䰤ࠊ⫼Ā῵ᗕໄᯢ˄mode
declaration˅āᴹᦣ䗄ˈᅗ‫ܕ‬䆌⫼᠋ᣛᅮ㽕㗗㰥ⱘ䇧䆡੠ߑ᭄ヺোˈҹঞᅗӀⱘখ㗗㉏ൟ੠Ḑ
ᓣDŽ

ˊProgolՓ⫼ᑣ߫㽚Ⲫ⊩ᴹҢˤЁᄺдϔ㒘㽚Ⲫ᭄᥂ⱘ㸼䖒ᓣDŽᇍѢ↣Ͼ䖬≵㹿䖭ѯ
ᄺࠄⱘ㸼䖒ᓣ㽚Ⲫⱘḋ՟xif xi !ˈᅗ佪‫ܜ‬ᇏᡒ ˤ Ё᳔⡍⅞ⱘ‫؛‬䆒hi ˈՓ ( B š h š xi ) ƅ
f xi DŽ᳈㊒⹂ഄ䆆ˈᅗ‫ܜ‬ᡒࠄ㛑䗮䖛ᑨ⫼k⃵ᔦ㒧㾘߭⎉㭈f xi ⱘ‫؛‬䆒ˈ೼݊Ё䅵ㅫߎ᳔⡍
⅞ⱘ‫؛‬䆒ˈҢ㗠䖥ԐᕫࠄhiDŽ

ˊ✊ৢProgol೼䖭Ͼ⬅᳔ϔ㠀‫؛‬䆒੠㄀ˎℹЁᕫࠄⱘ⡍⅞䖍⬠hi᠔⬠ᅮⱘ‫؛‬䆒ぎ䯈Ёᠻ
㸠њϔ㠀ࠄ⡍⅞᧰㋶DŽ೼ℸ‫؛‬䆒䲚ড়Ёˈᅗᇏᡒ᳔᳝ᇣᦣ䗄䭓ᑺ˄⬅᭛ᄫⱘ᭄䞣ᑺ䞣˅ⱘ‫؛‬

䆒DŽ䆹䚼ߚⱘ᧰㋶ᰃ⬅‫ڣ‬A 䙷ḋⱘਃথᓣ㾘߭ᓩᇐⱘˈᅗⱘׂ࠾᪡԰ৃ೼≵ׂ᳝࠾ᥝ᳔ⷁ‫؛‬
䆒ⱘ亢䰽ϟ䖯㸠DŽ

㒚㡖ⱘ Progol ㅫ⊩㾕 Muggleton˄ˈ˅DŽ

10.8 ቅ㔉ૂ㺛‫ݻ‬䈱⢟

ᴀゴⱘ㽕⚍ࣙᣀ˖
x ᑣ߫㽚Ⲫㅫ⊩ᄺдᵤপⱘ㾘߭䲚ˈᮍ⊩ᰃ‫ܜ‬ᄺдऩϾ㊒⹂ⱘ㾘߭ˈ✊ৢ⿏এ㹿
ℸ㾘߭㽚Ⲫⱘℷ՟ˈ‫ݡ‬೼࠽ԭḋ՟Ϟ䞡໡䖭ϔ䖛⿟DŽᅗᦤկњϔϾᄺд㾘߭䲚
ⱘ᳝ᬜⱘ䋾ှㅫ⊩ˈৃ԰Ў⬅乊৥ϟⱘ‫އ‬ㄪᷥᄺдㅫ⊩˄བ ID3˅ⱘ᳓ҷㅫ⊩DŽ
‫އ‬ㄪᷥㅫ⊩ৃ㹿ⳟ԰ᑊ㸠㽚ⲪˈϢᑣ߫㽚ⲪⳌᇍᑨDŽ
x ೼ᑣ߫㽚Ⲫㅫ⊩ЁˈᏆⷨおњ໮⾡ᮍ⊩ҹᄺдऩϾⱘ㾘߭DŽ䖭ѯᮍ⊩ⱘϡৠ೼
ѢᅗӀ㗗ᶹ㾘߭ࠡӊぎ䯈ⱘㄪ⬹ϡৠDŽϔϾᕜ⌕㸠ⱘǃ೼ CN2 ⿟ᑣЁՓ⫼ⱘᮍ
⊩ᰃᠻ㸠ϔ㠀ࠄ⡍⅞ⱘ᷅⢊᧰㋶ˈ⏤䖯ഄ⫳៤ᑊ⌟䆩᳈⡍⅞ⱘ㾘߭ˈⳈࠄᡒࠄ
ϔϾ䎇໳㊒⹂ⱘ㾘߭DŽ݊Ҫⱘᮍ⊩Ң⡍⅞ࠄϔ㠀䖯㸠‫؛‬䆒᧰㋶ˈՓ⫼ḋ՟偅ࡼ
㗠ϡᰃ⫳៤ᑊ⌟䆩ˈᑊϨᑨ⫼њϡৠⱘ㒳䅵䞣ᑺⱘ㾘߭㊒ᑺᴹᣛᓩ᧰㋶DŽ
x ϔ䰊㾘߭䲚˄ेࣙ৿ব䞣ⱘ㾘߭˅ᦤկњϔ⾡㸼ᕕ㛑࡯ᕜᔎⱘ㸼⼎DŽ՟བˈ㓪
⿟䇁㿔 Prolog Փ⫼ϔ䰊 Horn ᄤহᑣ߫ᴹ㸼⼎ϔ㠀ⱘ⿟ᑣDŽ಴ℸˈᄺдϔ䰊 Horn
ᄤহⱘ䯂乬гᐌ㹿⿄Ўᔦ㒇䘏䕥㓪⿟ⱘ䯂乬DŽ
x ᄺдϔ䰊㾘߭䲚ⱘᮍ⊩ᰃᇚ CN2 Ёⱘᑣ߫㽚Ⲫㅫ⊩⬅ੑ乬ᔶᓣᠽሩࠄϔ䰊㸼
⼎DŽ䆹ᮍ⊩೼ FOIL ⿟ᑣЁ՟⼎ˈᅗৃᄺдࣙᣀㅔऩ䗦ᔦ㾘߭䲚೼‫ⱘݙ‬ϔ䰊㾘߭
䲚DŽ
x ᄺдϔ䰊㾘߭ⱘ঺ϔᮍ⊩෎ѢϔϾথ⦄˖ेᔦ㒇ᰃⓨ㒢ⱘ䗚䕀DŽᤶ㿔Пˈᔦ㒇
ⱘ䯂乬ᰃᇏᡒϔϾ‫؛‬䆒 h ⒵䎇ϟ䴶ⱘ㑺ᴳDŽ
(¢ xi , f ( xi )²  D)( B š h š xi ) ƅf xi
݊ЁBᰃϔ㠀㚠᱃ֵᙃˈx1…xnᰃ䆁㒗᭄᥂DЁᅲ՟ⱘᦣ䗄ˈ㗠f(x1)…f(xn)Ў䆁㒗
ᅲ՟ⱘⳂᷛؐDŽ
x ϔѯ⿟ᑣ䙉ᕾњᔦ㒇ᰃⓨ㒢ⱘ䗚䕀ⱘ㾖⚍ˈ䗮䖛䖤⫼❳ⶹⱘⓨ㒢᥼⧚ⱘ䗚᪡԰
ᴹ᧰㋶‫؛‬䆒DŽ՟བ Cigol Փ⫼ⱘ䗚ᔦ㒧ᰃᔦ㒧ㅫᄤⱘ䗚䕀ˈ㗠ᔦ㒧ᰃ᱂䘡⫼Ѣᴎ
఼ᅮ⧚䆕ᯢⱘϔ⾡᥼⧚㾘߭DŽProgol 㒧ড়њ䗚⎉㭈ㄪ⬹੠ϔ㠀ࠄ⡍⅞ㄪ⬹ᴹ᧰
㋶‫؛‬䆒ぎ䯈DŽ

ᄺд݇㋏ᦣ䗄ⱘᮽᳳᎹ԰ࣙᣀ Winston˄˅ⱘ㨫ৡⱘ⿟ᑣˈᅗᄺдབĀarchā䖭ḋ
ⱘὖᗉⱘ㔥㒰ᓣᦣ䗄DŽBanerji  ⱘᎹ԰੠ Michalski ⱘ AQ ㅫ⊩㋏߫Ꮉ԰˄བ
MichalskiMichalskietal˅ᰃ᳔ᮽᇚ䘏䕥㸼⼎⫼Ѣᄺд䯂乬ⱘⷨおПϔDŽPlotkin
˄˅ⱘ©ࣙᆍᅮН䕗ᮽഄᇍᔦ㒇੠ⓨ㒢П䯈ⱘ݇㋏䖯㸠њᔶᓣ࣪DŽVere˄˅гⷨ
おњᄺдⱘ䘏䕥㸼⼎䯂乬ˈϨ Buchanan˄˅ⱘ METADENDRAL ⿟ᑣৃᄺдࠄ݇㋏ᦣ
䗄ҹ㸼⼎ߚᄤ㒧ᵘЁৃ೼䋼䈅ҾЁ㹿ߚࡆⱘ䚼ߚDŽ䆹⿟ᑣ៤ࡳഄথ⦄њϔѯ᳝⫼ⱘ㾘߭ˈᅗ
Ӏ೼࣪ᄺᄺᴃ乚ඳ㹿݀ᏗDŽMitchell˄˅ⱘ‫׭‬䗝⍜䰸বൟぎ䯈ㅫ⊩㹿ᑨ⫼Ѣৠḋⱘ࣪ᄺ
㒧ᵘⱘ݇㋏ᦣ䗄DŽ

䱣ⴔ  ᑈҷᎹЁ Prolog 䇁㿔ⱘ᱂䘡࣪ˈⷨおҎਬᓔྟ⏅ܹⷨお Horn ᄤহ㸼⼎ⱘ݇㋏


ᦣ䗄DŽ䕗ᮽⱘᄺд Horn ᄤহⱘᎹ԰ࣙᣀ Shapiro  ⱘ MIS ੠ Sammut Banerji˄˅
ⱘ MarvinDŽ䖭䞠䅼䆎ⱘ Quinlan˄˅ⱘ FOIL ㅫ⊩ߎ⦄ৢˈᕜᖿ䱣Пѻ⫳њ໮Ͼᑨ⫼ϔ
䰊㾘߭ⱘϔ㠀ࠄ⡍⅞᧰㋶ⱘㅫ⊩ˈࣙᣀ MFOIL˄Dzeroski˅ ǃFOCL Pazzanietal ǃ
DŽFOCL ㅫ⊩೼
CLAUDIEN DeRaedt Bruynooghe ੠ MARKUS˄Grobelnik˅
㄀  ゴЁᦣ䗄DŽ

ᄺд Horn ᄤহⱘ঺ϔᴵⷨお䏃㒓ᰃ䗮䖛䗚⎉㭈ˈᰃ⬅ Muggleton Buntine˄˅ᦤ


ߎˈᅗⱘ෎⸔ᰃ Sammut Banerji˄˅੠ Muggleton˄˅Ё㉏Ԑⱘᛇ⊩DŽℸ䏃㒓Ϟ
᳔䖥ⱘᎹ԰ⴔ䞡Ѣⷨおϡৠⱘ᧰㋶ㄪ⬹੠䰤ࠊ‫؛‬䆒ぎ䯈ҹՓᄺд䖛⿟᳈ᯧѢ໘⧚ⱘᮍ⊩DŽ՟
བ Kietz Wrobel˄˅Փ⫼೼݊ RDT ⿟ᑣЁ㾘߭῵ᓣᴹ䰤ࠊᄺд䖛⿟Ёৃ㗗㰥ⱘ㸼䖒
ᓣⱘᔶᓣDŽMuggleton Feng˄˅䅼䆎њᇚϔ䰊㸼⼎䰤ࠊЎ ijdeterminate ᭛ᄫDŽCohen
˄˅䅼䆎њ GRENDEL ⿟ᑣˈᅗ᥹ফϔϾᰒᓣⱘ䇁㿔ᦣ䗄䕧ܹˈҹᦣ䗄ᄤহԧˈҢ㗠
‫ܕ‬䆌⫼᠋ᰒᓣഄ㑺ᴳ‫؛‬䆒ぎ䯈DŽ

Lavrac Dzeroski˄˅ᦤկњᔦ㒇䘏䕥㓪⿟ⱘϔϾৃ䇏ᗻᕜᔎⱘᬭᴤDŽ䖥ᳳ݊Ҫ᳝
⫼ⱘϧ乬᡹㗗੠᭛䲚ࣙᣀ˄Bergadano Gunetti˗Moriketal˗Muggleton
b˅DŽWrobel˄˅ⱘ㓐䗄ゴгᦤկњ䆹乚ඳⱘϔϾདᴤ᭭DŽBratko Muggleton 
ὖ䗄њ ILP ೼ϔѯ䞡㽕䯂乬Ϟⱘ䖥ᳳᑨ⫼DŽϔ㋏߫ⱘ ILP ᮍ䴶ⱘᑈᑺϧ乬䅼䆎Ӯгᦤկњ䖥
ᳳⷨお䆎᭛ⱘᕜདᴹ⑤˄՟བ DeRaedt˅DŽ
д乬

 㗗㰥ϔϾབCN 䙷ḋⱘᑣ߫㽚Ⲫㅫ⊩੠ϔϾབID 䙷ḋⱘᑊ㸠㽚Ⲫㅫ⊩DŽϸϾㅫ


⊩䛑㹿⫼ѢᄺдϔⳂᷛὖᗉˈᅗᅮН೼⬅nϾᏗᇨሲᗻড়প㸼⼎ⱘᅲ՟ϞDŽབᵰID ᄺдࠄ
⏅ᑺЎdⱘᑇ㸵‫އ‬ㄪᷥˈᅗᇚࣙ৿ d Ͼϡৠⱘ‫އ‬ㄪ㒧⚍ˈ㗠Ϩ೼ᓎゟ݊䕧ߎ‫؛‬䆒ᯊ԰ߎ
d ⃵ϡৠ䗝ᢽDŽབᵰ䆹ᷥ㹿䞡ᮄ㸼⼎Ўϔᵤপ㾘߭䲚ˈৃᔶ៤໮ᇥ㾘߭˛↣Ͼ㾘߭ᢹ᳝
໮ᇥࠡӊ˛ϔϾᑣ߫㽚Ⲫㅫ⊩Ўᄺдࠄৠḋⱘ㾘߭䲚䳔԰ߎ໮ᇥ⃵ϡৠⱘ䗝ᢽ˛བᵰ㒭ᅮ
Ⳍৠⱘ䆁㒗᭄᥂ˈાϔϾ㋏㒳Դ䅸Ў᳈ᆍᯧߎ⦄䖛ᑺᢳড়˛

 ᬍ䖯㸼  ⱘ learnonerule ㅫ⊩ˈՓᅗ㛑ᄺдࠡӊЁࣙ৿ᅲ᭄ሲᗻ䯜ؐⱘ㾘߭


˄བ temprature!˅DŽᣛߎᮄⱘㅫ⊩ৃҢ㸼  Ё԰ાѯׂᬍᕫࠄDŽᦤ⼎˖㗗㰥೼‫އ‬ㄪᷥ
Ё䖭ᰃᗢḋᅠ៤ⱘDŽ

 ᬍ䖯㸼  ⱘ learnonerule ㅫ⊩ˈՓᅗ㛑ᄺдⱘ㾘߭ⱘࠡӊЁৃࣙ৿㉏ԐѢ


nationalityę^CanadianBrazilian`ⱘ㑺ᴳˈे⾏ᬷؐሲᗻৃপᶤᣛᅮ䲚ড়ЁӏᛣؐDŽׂᬍৢ
ⱘ⿟ᑣᑨ᥶㋶ࣙ৿᠔᳝䖭ḋᄤ䲚ⱘ‫؛‬䆒ぎ䯈DŽᣛߎᮄⱘㅫ⊩ৃҢ㸼  Ё԰ાѯׂᬍᕫࠄDŽ

 㗗㰥ᅲ⦄ Learnonerule ᧰㋶‫؛‬䆒ぎ䯈ᯊৃ䗝ⱘㄪ⬹ˈ⹂ߛഄ䆆ˈ㗗㰥ϟ߫᧰㋶


䖛⿟ሲᗻ˖

˄a˅⫳៤ᑊ⌟䆩 vs᭄᥂偅ࡼ

˄b˅ϔ㠀ࠄ⡍⅞ vs⡍⅞ࠄϔ㠀

˄c˅ᑣ߫㽚Ⲫ vsᑊ㸠㽚Ⲫ

䅼䆎㸼  ੠  Ёㅫ⊩Ё᠔‫خ‬䗝ᢽⱘད໘DŽᇍѢ᧰㋶ㄪ⬹Ёⱘ䖭ϝ⾡ሲᗻˈ䅼䆎䗝


ᢽ঺ϔᮍḜᯊⱘᕅડ˄ℷ䴶ⱘ੠䋳䴶ⱘ˅DŽ

 ᑨ⫼ੑ乬ᔶᓣⱘ䗚ᔦ㒧ࠄᄤহC AĢBˈC AĢBĢGDŽ㒭ߎCⱘ㟇ᇥϸ⾡ৃ㛑㒧ᵰDŽ




 ᑨ⫼䗚ᔦ㒧ࠄᄤহC R Bx ĢP xA ੠C S By ĢR zx DŽ㒭ߎCⱘ㟇ᇥ


ಯ⾡ৃ㛑㒧ᵰDŽ䖭䞠A੠BЎᐌ䞣ˈx੠yЎব䞣DŽ

 㗗㰥೒  Ё᳔ϟ䴶ⱘ䗚ᔦ㒧ℹDŽ㢹㒭ᅮ㕂ᤶ©੠©ⱘϡৠ䗝ᢽˈ᥼ᇐߎ㟇ᇥ


ϸ⾡ৃ㛑ѻ⫳ⱘϡৠ䕧ߎDŽབᵰ⫼ᄤহFather TomBob ᳓ᤶњFather ShannonTom ˈ᥼
ᇐߎℸ䗚ᔦ㒧ℹⱘϔϾ㒧ᵰDŽ

 㗗㰥ᴀゴЁᔦ㒇䯂乬ⱘᅮН˖

(¢ xi , f ( xi )²  D)( B š h š xi ) ƅf xi 

੠ࠡ䴶㄀  ゴᇍᔦ㒇‫أ‬㕂ⱘᅮН˄ᓣ ˅П䯈ⱘ㘨㋏DŽ݊Ёᔦ㒇‫أ‬㕂BbiasᅮНЎ㸼䖒


ᓣ

(xi  X )( Bbias š D š xi ) ƅL xiD 


݊ЁL xiD ᰃᄺд఼೼Ң䆁㒗᭄᥂DϞᄺдৢ䌟ќᮄᅲ՟xiⱘߚ㉏ˈ㗠XЎᭈϾᅲ՟ぎ
䯈DŽ⊼ᛣ㄀ϔϾ㸼䖒ᓣᰃЎњᦣ䗄៥ӀᏠᳯᄺд఼䕧ߎⱘ‫؛‬䆒ˈ㗠㄀ѠϾ㸼䖒ᓣᰃЎњᦣ䗄
ᄺд఼Ң䆁㒗᭄᥂Ё⊯࣪ⱘㄪ⬹DŽ䆒䅵ϔᄺд఼ˈ݊ᔦ㒇‫أ‬㕂BbiasㄝѢ᠔ᦤկⱘ㚠᱃ⶹ䆚BDŽ
ㅢ11ㄖ ࠼᷆ᆜҖ

⾎㓿㖁㔌઼ߣㆆṁ䘉ṧⲴᆖҐᯩ⌅䴰㾱аᇊᮠⴞⲴ䇝㓳ṧֻˈԕ䗮ࡠаᇊ㓗࡛Ⲵ⌋ॆ㋮
ᓖDŽࡽ䶒ㄐ㢲䇘䇪Ⲵ⨶䇪⭼䲀઼ᇎ傼㔃᷌৽᱐ࠪҶ䘉аһᇎDŽ࠶᷀ᆖҐ֯⭘‫ݸ‬傼⸕䇶઼╄㓾᧘
⨶ᶕᢙབྷ䇝㓳ṧֻᨀ‫ؑⲴ׋‬᚟ˈഐ↔ᆳнਇ਼ṧⲴ⭼䲀ᡰࡦ㓖DŽᵜㄐ㘳㲁Ҷа⿽〠ѪสҾ䀓䟺
ⲴᆖҐ˄EBL˅Ⲵ࠶᷀ᆖҐᯩ⌅DŽ൘สҾ䀓䟺ⲴᆖҐѝˈ‫ݸ‬傼⸕䇶⭘Ҿ࠶᷀˄ᡆ㘵䀓䟺˅㿲ሏ
ࡠⲴᆖҐṧֻᱟᘾṧ┑䏣ⴞḷᾲᘥⲴDŽ❦ਾ䘉њ䀓䟺㻛⭘Ҿ४࠶䇝㓳ṧֻѝଚӋᱟ⴨‫Ⲵޣ‬⢩
ᖱˈଚӋᱟн⴨‫Ⲵޣ‬DŽ䘉ṧṧֻቡਟสҾ䙫䗁᧘⨶䘋㹼⌋ॆˈ㘼нᱟสҾ㔏䇑᧘⨶DŽสҾ䀓䟺
ⲴᆖҐᐢ㻛ᡀ࣏ൠ⭘Ҿ൘਴⿽㿴ࡂ઼䈳ᓖԫ࣑ѝᆖҐᩌ㍒᧗ࡦ㿴ࡉDŽᵜㄐ㘳㲁ᆖҐಘⲴ‫ݸ‬傼⸕
䇶↓⺞ᒦфᆼᮤᰦⲴสҾ䀓䟺ⲴᆖҐDŽлаㄐ㘳㲁‫ݸ‬傼⸕䇶ਚᱟ䘁լ↓⺞ᰦˈሶᖂ㓣ᆖҐ઼࠶
᷀ᆖҐ㔃ਸ䎧ᶕDŽ

11.1 ԁ㔃

ࡽ䶒ㄐ㢲ᐢ㘳㲁Ҷ਴⿽ᖂ㓣⌅ˈণ䙊䗷⺞ᇊ㜭ཏ㓿傼ൠ४࠶↓઼ֻ৽ֻⲴ⢩ᖱˈᶕӾ㿲ሏ
ࡠⲴ䇝㓳ṧֻѝ⌋ॆDŽߣㆆṁᆖҐǃ⾎㓿㖁㔌ᆖҐǃᖂ㓣䙫䗁㕆〻ǃԕ৺䚇Ր㇇⌅ᱟԕ䘉⿽ᯩ
ᔿ᫽֌Ⲵᖂ㓣ᆖҐᯩ⌅DŽ䘉Ӌᖂ㓣ᆖҐಘ൘ᇎ䐥ѝⲴањ‫ޣ‬䭞䲀ࡦ൘ҾˈᆳԜ൘ਟ⭘ᮠᦞн䏣
ᰦᙗ㜭䖳ᐞDŽᇎ䱵кˈྲㅜ 7 ㄐᡰ䇘䇪Ⲵˈ⨶䇪࠶᷀ᱮ⽪Ӿ㔉ᇊᮠⴞⲴ䇝㓳ṧֻѝᆖҐ൘㋮ᓖ
кᆈ൘สᵜⲴкл⭼DŽ

ᱟ੖㜭ᔰਁࠪ䘉ṧⲴᆖҐᯩ⌅ˈᆳԜнਇਟ⭘䇝㓳ᮠᦞⲴᮠ䟿ᡰᑖᶕⲴ䇝㓳㋮ᓖкⲴสᵜ
䲀ࡦᡰࡦ㓖˛ㆄṸᱟ㛟ᇊⲴˈਚ㾱ᡁԜ㜭䟽ᯠ㘳㲁алᆖҐ䰞仈ⲴᖒᡀDŽа⿽࣎⌅ᱟ֯ᆖҐ㇇
⌅㜭᧕ਇᱮᔿⲴ‫ݸ‬傼⸕䇶ˈ࣐к䇝㓳ᮠᦞⲴа਼֌Ѫ䗃‫ޕ‬DŽสҾ䀓䟺ⲴᆖҐᱟ䘉ṧⲴа⿽ᯩ
⌅DŽᆳ֯⭘‫ݸ‬傼⸕䇶ᶕ࠶᷀ᡆ䀓䟺⇿њ䇝㓳ṧֻˈԕ᧘⨶ࠪṧֻⲴଚӋ⢩ᖱоⴞḷ࠭ᮠ⴨‫ˈޣ‬
ଚӋн⴨‫ޣ‬DŽ䘉Ӌ䀓䟺㜭֯ᆖҐಘ∄অ⤜‫׍‬䶐ᮠᦞ䘋㹼⌋ॆᴹᴤ儈Ⲵ㋮ᓖDŽྲࡽаㄐᡰ㿱ࡠⲴ
䛓ṧˈᖂ㓣䙫䗁㌫㔏˄ྲ Cigol˅֯⭘‫ݸ‬傼㛼Ჟ⸕䇶ᶕᤷሬᆖҐDŽ❦㘼ᆳԜ֯⭘㛼Ჟ⸕䇶᧘⨶
ࠪⲴ⢩ᖱᢙབྷҶ䗃‫ޕ‬ᇎֻⲴ᧿䘠ˈഐ↔໎࣐Ҷᖵᩌ㍒‫ٷ‬䇮オ䰤Ⲵ༽ᵲᓖDŽ⴨৽ˈสҾ䀓䟺Ⲵᆖ
Ґ֯⭘‫ݸ‬傼⸕䇶ᶕ߿ሿᖵᩌ㍒‫ٷ‬䇮オ䰤Ⲵ༽ᵲᓖˈഐ↔߿ሿҶṧᵜ༽ᵲᓖᒦᨀ儈ҶᆖҐಘⲴ⌋
ॆ㋮ᓖDŽ

Ѫ⨶䀓สҾ䀓䟺ⲴᆖҐⲴⴤ㿲᜿ѹˈ㘳㲁лഭ䱵䊑ỻⲴᆖҐԫ࣑DŽ⺞࠷ൠ䇢ˈ‫ٷ‬ᇊᡁԜᐼ
ᵋ〻ᒿᆖҐ䇶࡛ỻተս㖞Ⲵ䟽㾱㊫࡛ˈ∄ྲⴞḷᾲᘥĀ唁ỻሶ൘є↕޵ђਾⲴỻⴈ⣦ᘱāDŽമ
11-1 ᱮ⽪Ҷ↔ⴞḷᾲᘥⲴањ↓ֻDŽᖃ❦ˈᖂ㓣䙫䗁ᯩ⌅ҏ㜭⭘ҾᆖҐ↔ⴞḷᾲᘥDŽ❦㘼ˈ⭡
Ҿỻⴈ⴨ᖃ༽ᵲ˄ᴹ 32 њᆀˈਟԕ൘ 64 њᯩṬѝ˅ˈ㘼ф↔ᾲᘥᡰ᧿䘠Ⲵ⢩ᇊ⁑ᔿ⴨ᖃᗞ࿉
˄वਜ਼Ҷỻⴈкн਼ᆀⲴ⴨ሩս㖞˅ˈᡁԜ䴰㾱ᨀ‫׋‬ᡀॳкзⲴ㊫լҾമ 11-1 䘉ṧⲴ䇝㓳ṧ
ֻˈ᡽㜭ᵏᵋᖂ㓣ᆖҐࡠⲴ‫ٷ‬䇮㻛↓⺞ൠ⌋ॆDŽ

插图——原书页码:308
മ 11-1 ⴞḷᾲᘥĀ唁ỻ൘є↕޵ђਾⲴỻⴈ⣦ᘱāⲴањ↓ֻDŽ

⌘᜿ⲭ傜਼ᰦ᭫ࠫ唁⦻઼唁ਾDŽ唁ỻᗵ享〫ࣘަ⦻ˈӾ㘼ⲭỻ㜭ਲ਼ᦹ唁ਾDŽ

ᆖҐлỻԫ࣑Ⲵᴹ䏓ѻ༴൘ҾˈӪ㊫ਚ㾱ቁᮠⲴ䇝㓳ṧֻቡਟᆖҐࡠ䘉ṧⲴⴞḷᾲᘥDŽᇎ
䱵кˈཊᮠӪ൘ⴻҶമ 11-1 䘉ṧањṧֻѻਾቡਟᨀࠪањⴞḷᾲᘥⲴа㡜‫ٷ‬䇮ˈྲĀ唁ਾ
઼唁⦻਼ᰦ㻛᭫ࠫⲴᛵߥāˈ㘼нՊᗇࡠ䈨ྲ䘉ṧⲴ‫ٷ‬䇮˄նҏ਼ṧᱟа㠤‫ٷ‬䇮˅˖Āഋњⲭ
‫ޥ‬䘈൘৏սⲴỻⴈ⣦ᘱāDŽӪ㊫ᱟᘾṧӾӵӵањṧֻѝᡀ࣏ൠ⌋ॆⲴ઒˛

എㆄᱟӪ㊫䶎ᑨ‫׍‬䎆ҾԕԆԜ‫ޣ‬Ҿỻᆀਸ⌅〫ࣘⲴ‫ݸ‬傼⸕䇶ᶕ䀓䟺ᡆ࠶᷀䇝㓳ṧֻDŽྲ᷌
䰞ѪӰѸമ 11-1 Ⲵ䇝㓳ṧֻᱟĀ唁ỻ൘є↕޵ђਾāⲴ↓ֻˈཊᮠӪՊ㔉ࠪ㊫լҾл䶒Ⲵ䀓
䟺˖ĀഐѪⲭ傜਼ᰦ᭫ࠫ唁⦻઼唁ਾˈ唁ᗵ享᩶㝡㻛ሶߋⲴຳ䙷ˈӾ㘼䇙ⲭਲ਼ᦹਾDŽā䈕䀓䟺
Ⲵ䟽㾱ᙗ൘Ҿᆳᨀ‫׋‬Ҷᡰ䴰Ⲵؑ᚟ԕӾ䇝㓳ṧֻⲴ㓶㢲ѝਸ⨶⌋ॆࡠ↓⺞Ⲵа㡜‫ٷ‬䇮DŽ↔䀓䟺
ѝᨀࡠⲴṧֻ⢩ᖱ˄ྲⲭ傜ǃ唁⦻ǃ唁ਾⲴս㖞˅ᱟоⴞḷᾲᘥ⴨‫ˈⲴޣ‬ᒦфᓄ䈕㻛वਜ਼൘а
㡜‫ٷ‬䇮ѝDŽ⴨৽ˈ䀓䟺ѝ⋑ᴹᨀࡠⲴṧֻ⢩ᖱ˄ྲⲭỻⲴ‫Ⲵޥ‬⣦ᘱ˅ਟ㻛䇔Ѫᱟн⴨‫Ⲵޣ‬㓶
㢲DŽ

൘↔лỻֻᆀѝˈᆖҐಘѪᔪ・‫ٷ‬䇮ˈᆳ䴰㾱Ⲵ‫ݸ‬傼⸕䇶ウㄏᱟӰѸ઒˛ᖸㆰঅˈᱟлỻ
Ⲵਸ⌅㿴ࡉ˖ণ傜ԕ৺ަԆᆀⲴਸ⌅〫ࣘ˗ሩᔸ㘵ᗵ享Ӕᴯ〫ᆀ˗ԕ৺㾱䎒ỻᗵ享᥹տሩᯩⲴ
⦻DŽ⌘᜿ਚ㔉ᇊ䘉ṧⲴ‫ݸ‬傼⸕䇶ˈ൘৏ࡉкቡᴹਟ㜭ሩԫ᜿ỻⴈ⣦ᘱ䇑㇇ࠪᴰՈⲴỻᆀ〫ࣘDŽ
❦㘼ˈᇎ䐥ѝ䘉ṧⲴ䇑㇇ਟ㜭ᶱѪ༽ᵲˈ㘼фণ֯ᡁԜӪ㊫൘ᦼᨑҶ↔ᆼᮤⲴлỻ⸕䇶ˈӽн
㜭䗮ࡠᴰՈⲴሩᔸDŽഐ↔ˈ൘лỻ˄ԕ৺ަԆᩌ㍒ᇶ䳶Ⲵ䰞仈ˈྲ䈳ᓖ઼㿴ࡂ˅䘉ṧⲴӪ㊫ᆖ
Ґѝˈवਜ਼Ҷањᖸ䮯Ⲵਁ⧠‫ݸ‬傼⸕䇶Ⲵ䗷〻ˈᆳᱟ⭡ᡁԜ൘лỻᰦ䙷ࡠⲴ⢩ᇊṧֻᡰᕅሬ
ⲴDŽ

ᵜㄐ᧿䘠Ҷ㜭㠚ࣘᔪ・઼ᆖҐ䘉ṧⲴ䀓䟺ⲴᆖҐ㇇⌅DŽᵜㄐⲴ࢙։䜘࠶ሶᴤ㋮⺞ൠᇊѹ࠶
᷀ᆖҐ䰞仈DŽла㢲㔉ࠪҶањ⢩ᇊⲴสҾ䀓䟺ⲴᆖҐ㇇⌅ˈ〠Ѫ Prolog-EBGDŽਾ㔝ࠐ㢲㘳
ḕҶ䘉⿽㇇⌅Ⲵа㡜⢩ᙗˈԕ৺ᆳоࡽ䶒ㄐ㢲ѝ䇘䇪Ⲵᖂ㓣ᆖҐ㇇⌅ѻ䰤Ⲵ㚄㌫DŽᴰਾа㢲᧿
䘠Ҷᓄ⭘สҾ䀓䟺ⲴᆖҐԕᨀ儈བྷ⣦ᘱオ䰤ᩌ㍒Ⲵᙗ㜭DŽᵜㄐᡁԜ㘳㲁Ҷа⿽⢩↺ᛵߥˈণ⭏
ᡀ䀓䟺ᡰสҾⲴ‫ݸ‬傼⸕䇶ᱟᆼ‫ྲˈⲴ⺞↓ޘ‬൘лỻֻᆀѝӪ㊫ᴹ↓⺞⸕䇶ⲴᛵᖒDŽㅜ 12 ㄐሶ
㘳㲁ᴤа㡜ⲴᆖҐᛵߥˈণ‫ݸ‬傼⸕䇶ਚᱟ䘁լ↓⺞ⲴᛵߥDŽ

11.1.1 ᖈ㓩ૂ࠼᷆ᆜҖ䰤从

࠶઼᷀ᖂ㓣ᆖҐ䰞仈Ⲵ䟽㾱४࡛൘ҾˈᆳԜ䇮ᜣⲴᆖҐ䰞仈Ⲵᖒᔿн਼˖
x ൘ᖂ㓣ᆖҐѝˈᆖҐಘ㻛㔉Ҹањ‫ٷ‬䇮オ䰤Hˈᆳᗵ享Ӿѝ䘹ᤙањ䗃ࠪ‫ٷ‬䇮DŽ䘈
ᴹањ䇝㓳ṧֻ䳶ਸD={<x1, f(x1)>, …<xn, f(xn)>}ˈަѝf(xi)ѪᇎֻxiⲴⴞḷ٬DŽᆖ
ҐಘᡰᐼᵋⲴ䗃ࠪѪHѝо䘉Ӌ䇝㓳ṧֻа㠤Ⲵ‫ٷ‬䇮hDŽ
x ൘࠶᷀ᆖҐѝˈᆖҐಘⲴ䗃‫ޕ‬वਜ਼оᖂ㓣ᆖҐ਼ṧⲴ‫ٷ‬䇮オ䰤 H ઼䇝㓳ṧֻ DDŽ
ᆖҐಘ䘈ᴹਖа䗃‫˖ޕ‬ањ亶 亶ฏ⨶䇪(domain theory)Bˈᆳ⭡ਟ⭘Ҿ䀓䟺䇝㓳ṧֻ
Ⲵ㛼Ჟ⸕䇶㓴ᡀDŽᆖҐಘⲴᐼᵋⲴ䗃ࠪѪ H ѝⲴ‫ٷ‬䇮 hˈᆳᰒо䇝㓳ṧֻ D а
㠤ˈҏо亶ฏ⨶䇪 B а㠤DŽ

Ѫ䈤᰾䘉а⛩ˈ൘лỻⲴֻᆀѝ⇿њᇎֻxiਟ᧿䘠а⢩ᇊỻⴈ⣦ᘱˈf(xi)Ⲵ٬൘xiᱟ唁ỻ൘
є↕޵ђਾⲴỻⴈ⣦ᘱᰦѪⵏˈ੖ࡉѪ‫ٷ‬DŽᡁԜਟྲㅜ 10 ㄐ䛓ṧᇊѹ‫ٷ‬䇮オ䰤HѪHornᆀਕ
䳶˄ণif-then 㿴ࡉ˅ˈަѝ㿴ࡉᡰ֯⭘Ⲵ䉃䇽㺘⽪ỻⴈк⢩ᇊᆀⲴս㖞ᡆ⴨ሩս㖞DŽ亶ฏ⨶䇪
Bਟ⭡ᖒᔿॆⲴлỻ㿴ࡉ㓴ᡀˈ᧿䘠Ҷਸ⌅Ⲵ䎠ỻǃሩᔸ㘵䖞⍱㹼ỻǃԕ৺᥹տտሩᯩ⦻ᰦ㧧
㜌ㅹDŽ

⌘᜿൘࠶᷀ᆖҐѝˈᆖҐಘᗵ享䗃ࠪа‫ٷ‬䇮ˈᰒо䇝㓳ᮠᦞа㠤ˈ৸о亶ฏ⨶䇪а㠤DŽᖃ
B н⏥㮤 h Ⲵ੖ᇊᰦ˄ণ Bƅ/™ h˅ˈᡁԜ〠 h о亶ฏ⨶䇪 B а㠤˄consistent˅DŽ↔䱴࣐Ⲵа㠤
ᙗ㓖ᶏˈ߿ቁҶᖃᮠᦞн㜭অ⤜൘ H ѝߣᇊ h ᰦᆖҐಘ䶒ѤⲴ↗ѹᙗDŽྲ᷌亶ฏ⨶䇪↓⺞ˈަ
ᴰਾ᭸᷌ቡᱟᨀ儈Ҷ䗃ࠪ‫ٷ‬䇮Ⲵ㋮ᓖDŽ

⧠䈖㓶ӻ㓽алᵜㄐਾ䶒аⴤ⭘ࡠⲴ࠶᷀ᆖҐ䰞仈ⲴਖањֻᆀDŽ㘳㲁аᇎֻオ䰤 Xˈަ
ѝ⇿њᇎֻ䜭ᱟаሩ⢙⨶ሩ䊑DŽ⇿ሩ⢙⨶ሩ䊑⭡䉃䇽 Color, Volume, Owner, Material, Type ઼
Density ᧿䘠ˈ㘼єњሩ䊑ѻ䰤Ⲵ‫ޣ‬㌫⭘䉃䇽 On ᧿䘠DŽ൘↔‫ٷ‬䇮オ䰤ѝˈᆖҐԫ࣑ᱟᆖҐⴞḷ
ᾲᘥĀєњ⢙⨶ሩ䊑ˈањਟ㻛ᆹ‫ޘ‬ൠਐ᭮൘ਖањкāˈ㺘⽪Ѫ䉃䇽 SafeToStack(x,y)DŽᆖҐ
↔ⴞḷᾲᘥᴹᇎ⭘Ⲵԧ٬ˈֻྲањᵪಘӪ㌫㔏㾱൘аᴹ䲀オ䰤ѝᆈ᭮н਼Ⲵ⢙⨶ሩ䊑DŽ↔࠶
᷀ᆖҐⲴᆼᮤᇊѹ൘㺘 11-1 ѝ㔉ࠪDŽ

㺘 11-1 ањ࠶᷀ᆖҐ䰞仈˖SafeToStack(x, y)

ᐢ⸕˖
 ᇎֻオ䰤 X˖⇿њᇎֻ᧿䘠Ҷаሩሩ䊑ˈ᧿䘠Ѫ䉃䇽 Type, Color, Volume, Owner, Material, Density ઼
OnDŽ
 ‫ ٷ‬䇮 オ 䰤 H˖ ⇿ њ ‫ٷ‬䇮 ᱟа 㓴 Horn ᆀਕ 㿴 ࡉ DŽ⇿њ Horn ᆀ ਕⲴ ཤ 䜘 Ѫа њव ਜ਼ ⴞ ḷ䉃 䇽
SafeToStack Ⲵ᮷ᆇDŽHorn ᆀਕփѪ᮷ᆇⲴਸਆˈ䘉Ӌ᮷ᆇสҾ᧿䘠ᇎֻⲴ䉃䇽ˈԕ৺䉃䇽 LessThan,
Equal, GreaterThan ઼࠭ᮠ plus, minus ઼ timesDŽֻྲл䶒Ⲵ Horn ᆀਕᱟ‫ٷ‬䇮オ䰤ѝⲴаઈ˖
SafeToStack(x, y)ĕVolume(x, vx)ġVolume(y, vy) ġLessThan(vx, vy)
 ⴞḷᾲᘥ˖SafeToStack(x,y)
 䇝㓳ṧֻ˖л䶒ᱮ⽪ҶањިරⲴ↓ֻ SafeToStack(Obj1, Obj2)˖
On(Obj1, Obj2) Owner(Obj1, Fred)
Type(Obj1, Box) Owner(Obj2, Louise)
Type(Obj2, Endtable) Density(Obj1, 0.3)
Color(Obj1, Red) Material(Obj1, Cardboard)
Color(Obj2, Blue) Material(Obj2, Wood)
Volume(Obj1, 2)
 亶ฏ⨶䇪 B˖
SafeToStack(x, y)ĕ™Fragile(y)
SafeToStack(x, y) ĕLighter(x, y)
Lighter(x, y) ĕWeight(x, wx) ġWeight(y, wy) ġLessThan(wx, wy)
Weight(x, w) ĕVolume(x, v) ġDensity(x, d)ġEqual(w, times(v, d))
Weight(x, 5) ĕType(x, Endtable)
Fragile(x) ĕMaterial(x, Glass)

≲䀓˖
 H ѝањ‫ٷ‬䇮ˈо䇝㓳ṧ઼ֻ亶ฏ⨶䇪а㠤DŽ

ྲ㺘 11-1 ᡰ⽪ˈᡁԜ䘹ᇊⲴ‫ٷ‬䇮オ䰤 H ѝ⇿њ‫ٷ‬䇮Ѫања䱦 if-then 㿴ࡉ䳶ˈᡆ〠 Horn


ᆀਕ˄ᵜㄐѝ䚥ᗚ㺘 10-3 ѝࡇࠪⲴа䱦 Horn ᆀਕⲴ䇠ਧ઼ᵟ䈝˅DŽֻྲˈ㺘ѝᱮ⽪Ⲵ Horn
ᆀਕ‫ٷ‬䇮Ⲵֻᆀᯝ䀰˖ᖃ x Ⲵփ〟 Volume ሿҾ˄LessThan ˅y Ⲵփ〟 Volume ᰦ˄൘ Horn ᆀਕ
ѝਈ䟿 vx ઼ vy ࠶࡛㺘⽪ x ઼ y Ⲵփ〟٬˅ˈࡉሩ䊑 x ਟᆹ‫ึޘ‬ਐ˄SafeToStack˅൘ሩ䊑 y кDŽ
⌘᜿ Horn ᆀਕ‫ٷ‬䇮ਟवਜ਼⭘Ҿ᧿䘠ᇎֻⲴԫ᜿䉃䇽ˈԕ৺ࠐњ䱴࣐Ⲵ䉃䇽઼࠭ᮠDŽ㺘ѝ䘈ᱮ
⽪ҶањިරⲴ↓ֻ SafeToStack(obj1, obj2)DŽ

Ѫ᰾⺞ൠ㺘䗮↔࠶᷀ᆖҐ䰞仈ˈ䘈ᗵ享ᨀ‫׋‬亶ฏ⨶䇪ˈԕ‫࠶ݵ‬䀓䟺ѪӰѸ㿲ሏࡠⲴ↓ֻ┑
䏣ⴞḷᾲᘥDŽ൘ࡽ䶒Ⲵлỻֻᆀ䟼ˈ亶ฏ⨶䇪Ѫỻᆀ䎠⌅Ⲵ⸕䇶ˈӾѝᡁԜᔪ・ࠪѪӰѸ唁ỻ
ՊђਾⲴ䀓䟺DŽ൘ᖃࡽֻᆀѝˈ亶ฏ⨶䇪ᗵ享ᖸᇩ᱃䀓䟺ѪӰѸањሩ䊑ਟ᭮൘ਖањѻкDŽ
㺘ѝᱮ⽪Ⲵ亶ฏ⨶䇪वᤜᯝ䀰˖Āਟሶ x ᆹ‫ޘ‬ൠਐ᭮൘ y кˈྲ᷌ y нᱟ᱃⺾Ⲵ˄Fragile˅ā
ԕ৺Āሩ䊑 x ᱟ᱃⺾Ⲵ(Fragile)ˈᖃ x Ⲵᶀ䍘(Material)ᱟ⧫⪳˄Glass˅ᰦDŽāྲᆖҐࡠⲴ‫ٷ‬䇮
аṧˈ亶ฏ⨶䇪⭡а㓴 Horn ᆀਕ᧿䘠ˈᆳ֯㌫㔏৏ࡉкਟԕ࣐‫ޕ‬ԫօᆖҐࡠⲴ‫ٷ‬䇮㠣ਾ㔝Ⲵ
亶ฏ⨶䇪ѝDŽ⌘᜿亶ฏ⨶䇪वᤜྲ Lighter ઼ Fragile 䘉ṧⲴ䱴࣐䉃䇽ˈᆳԜн൘䇝㓳ṧֻⲴ᧿
䘠ѝˈնᱟ⭡ᴤ৏ᆀⲴᇎֻ኎ᙗྲ Material, Density ઼ Volume ֯⭘亶ฏ⨶䇪ѝަԆ㿴ࡉ᧘⨶ᗇ
ࠪDŽᴰਾˈ⌘᜿㺘ѝᱮ⽪Ⲵ亶ฏ⨶䇪‫࠶ݵ‬䇱᰾䘉䟼ᱮ⽪Ⲵ↓ֻ┑䏣ⴞḷᾲᘥ SafeToStackDŽ

11.2 ⭞ᇂ㗄Ⲻ亼ต⨼䇰ᆜҖφProlog-EBG

ྲࡽᡰ䘠ˈᵜㄐѫ㾱㘳㲁ⲴสҾ䀓䟺ⲴᆖҐᱟ൘亶ฏ⨶䇪ᖸᆼ㖾ⲴᛵߥлⲴˈণ亶ฏ⨶䇪
ᱟ↓⺞ⲴᒦфᆼᮤⲴDŽањ亶ฏ⨶䇪㻛〠Ѫ↓⺞Ⲵˈᖃަѝ⇿њᯝ䀰䜭ᱟц⭼Ⲵⵏᇎ᧿䘠DŽа
њ亶ฏ⨶䇪㻛〠ѪᆼᮤⲴ˄ሩᓄ㔉ᇊⲴⴞḷᾲᘥ઼ᇎֻオ䰤˅ˈᖃ亶ฏ⨶䇪㾶ⴆҶᇎֻオ䰤ѝ
ᡰᴹ↓ֻDŽᦒ䀰ѻˈަᆼᮤᙗ䈤᰾⇿њ┑䏣ⴞḷᾲᘥⲴᇎֻ䜭ਟ⭡亶ฏ⨶䇪䇱᰾ަ┑䏣ᙗDŽ⌘
᜿ࡽ䶒ሩᆼᮤᙗⲴᇊѹн㾱≲亶ฏ⨶䇪ਟ䇱᰾৽ֻн┑䏣ⴞḷᾲᘥDŽ❦㘼ˈྲ᷌䚥ᗚ䙊ᑨ
Prolog ᜟֻˈн㜭䇱᰾Ⲵᯝ䀰ਟ䇔ᇊᱟ‫ٷ‬DŽഐ↔䈕ᆼᮤᙗᇊѹਟवਜ਼‫ޘ‬䜘↓઼ֻ৽ֻDŽ

䈫㘵൘↔ਟ㜭Պ䰞ˈሩҾᆖҐಘ‫ٷ‬ᇊᴹ䘉ṧⲴᆼ㖾亶ฏ⨶䇪ᱟ੖ਸ⨶˛㘼фˈᰒ❦ᆖҐಘ
ᴹҶањᆼ㖾Ⲵ亶ฏ⨶䇪ˈ䘈ᴹօᗵ㾱޽৫ᆖҐ˛ሩҾ↔䰞仈ਟ᤹ԕлє⛩എㆄ˖
x 俆‫ˈݸ‬ḀӋᛵᖒлᱟᴹਟ㜭ᨀ‫׋‬ᆼ㖾亶ฏ⨶䇪ⲴDŽࡽ䶒ⲴлỻⲴ䰞仈ቡᱟ䘉ṧⲴ
ањֻᆀˈަѝỻᆀⲴਸ⌅䎠ᆀᖒᡀҶањᆼ㖾Ⲵ亶ฏ⨶䇪ˈ˄৏ࡉк˅ਟ⭘ᆳ
ᶕ᧘⨶ᴰՈⲴлỻㆆ⮕DŽᴤ䘋а↕ˈ㲭❦ᖸᇩ᱃߉ࠪᶴᡀ亶ฏ⨶䇪Ⲵỻᆀਸ⌅↕
ᆀˈ㾱߉ࠪᴰՈлỻㆆ⮕ӽ❦ᖸ䳮DŽ൘䘉⿽ᛵߥлˈᡁԜᴤᐼᵋሶ䘉ṧⲴ亶ฏ⨶
䇪ᨀ‫׋‬㔉ᆖҐಘˈᒦᐼᵋᆖҐಘᖒᡀⴞḷᾲᘥⲴᴹᑞࣙⲴ᧿䘠˄ྲ˖Āਟ㜭ђਾ
Ⲵỻተ⣦ᘱā˅DŽᯩ⌅ᱟ䙊䗷ሩ⢩↺䇝㓳ṧֻ䘋㹼㘳ḕ઼⌋ॆDŽ11.4 㢲᧿䘠Ҷ֯⭘
ᆼ㖾亶ฏ⨶䇪ⲴสҾ䀓䟺ⲴᆖҐᡀ࣏ൠᓄ⭘ࡠࠐњᩌ㍒ᇶ䳶Ⲵ䇑ࡂ઼Ոॆ䰞仈
ѝˈԕ㠚ࣘ᭩䘋ᙗ㜭DŽ
x ㅜҼˈ൘䇨ཊᛵߥлн㜭ཏ‫ٷ‬ᇊᴹᆼ㖾Ⲵ亶ฏ⨶䇪DŽ∄ྲᖸ䳮Ѫࡽ䶒䘉њ⴨ሩㆰ
অⲴ SafeToStack 䰞仈㔉ࠪᆼᮤ㘼↓⺞Ⲵ亶ฏ⨶䇪DŽᴤᇎ䱵Ⲵᯩ⌅ᱟ‫ٷ‬ᇊᗵ享֯⭘
สҾнᆼ㖾亶ฏ⨶䇪Ⲵ䘁լਸ⨶Ⲵ䀓䟺ˈ㘼нᱟสҾᆼ㖾⸕䇶֌ࠪ⺞࠷䇱᰾DŽᰐ
䇪ᘾṧˈᡁԜਟԕ䙊䗷㘳㲁⨶ᜣᛵߥлⲴᆼ㖾亶ฏ⨶䇪ˈᔰ࿻Ҷ䀓൘ᆖҐѝ֯⭘
䀓䟺ⲴⴞⲴDŽㅜ 12 ㄐᡁԜሶ㘳㲁Ӿнᆼ㖾亶ฏ⨶䇪ѝᆖҐDŽ

ᵜ㢲ኅ⽪Ҷањ〠Ѫ Prolog-EBG Ⲵ㇇⌅ (Kedar-Cabelli & McCarty 1987)ˈ֯⭘ᆳ֌Ѫࠐ⿽


สҾ䀓䟺ⲴᆖҐⲴԓ㺘DŽProlog-EBG ᱟаᒿࡇ㾶ⴆ㇇⌅˄㿱ㅜ 10 ㄐ˅DŽᦒ䀰ѻˈᆳⲴ䗷〻ᱟ
ᆖҐঅњ Horn ᆀਕ㿴ࡉˈ〫৫↔㿴ࡉ㾶ⴆⲴ↓ֻˈ޽൘࢙։↓ֻк䟽༽䘉а䗷〻ˈⴤࡠ⋑ᴹ
ᵚ㾶ⴆⲴ↓ֻѪ→DŽ㤕㔉ᇊаᆼᮤᒦ↓⺞Ⲵ亶ฏ⨶䇪ˈProlog-EBG ‫؍‬䇱䗃ࠪањ‫ٷ‬䇮˄㿴ࡉ
䳶˅ˈᆳᵜ䓛ᱟ↓⺞Ⲵᒦ㜭㾶ⴆ㿲ሏࡠⲴ↓ֻDŽሩԫ᜿↓ֻ䳶ਸˈ⭡ Prolog-EBG 䗃ࠪⲴ‫ٷ‬䇮
वਜ਼а㓴ሩᓄҾ亶ฏ⨶䇪ⲴⴞḷᾲᘥⲴ䙫䗁‫࠶ݵ‬ᶑԦDŽProlog-EBG ᱟ Mitchell et al.˄1986˅ӻ
㓽Ⲵ EBG ㇇⌅Ⲵ᭩䘋ˈᒦф㊫լҾ Dejong & Mooney˄1986˅᧿䘠Ⲵ EGGS ㇇⌅DŽProlog-
EBG ㇇⌅൘㺘 11-2 ѝࡇࠪDŽ

11.2.1 䘆㺂⽰ׁ

Ѫ䈤᰾䈕㇇⌅ˈ޽⅑㘳㲁㺘 11-1 㔉ࠪⲴ䇝㓳ṧ઼ֻ亶ฏ⨶䇪DŽ㺘 11-2 ࡇࠪⲴ Prolog-EBG


㇇⌅ᱟаᒿࡇ㾶ⴆ㇇⌅ˈᆳ⑀䘋ൠ㘳㲁䇝㓳ᮠᦞDŽሩ⇿њᯠ↓ֻˈ㤕ᆳ䘈⋑㻛аᆖࡠⲴ Horn
ᆀਕ㾶ⴆˈ㇇⌅䙊䗷лࡇ↕僔⭏ᡀаᯠⲴ Horn ᆀਕ˖˄1˅䀓䟺ᯠⲴ↓ֻˈ˄2˅࠶᷀䈕䀓䟺
ԕ⺞ᇊаਸ䘲Ⲵ⌋ॆˈ˄3˅䙊䗷࣐‫ޕ‬аᯠⲴ Horn ᆀਕԕ㾶ⴆ䈕↓ֻԕ৺ަԆ⴨լᇎֻ᭩䘋ᖃ
ࡽ‫ٷ‬䇮DŽл䶒ᡁԜ‫⅑׍‬㘳ḕ䘉йњ↕僔DŽ

11.2.1.1 䀙䠀䇣㓹ṭׁ

༴⨶⇿њᯠṧֻⲴㅜа↕ᱟ᤹➗亶ฏ⨶䇪ᔪ・а䀓䟺ˈԕ䈤᰾䈕↓ֻྲօ┑䏣ⴞḷᾲᘥDŽ
ᖃ亶ฏ⨶䇪↓⺞фᆼᮤᰦˈ↔䀓䟺㓴ᡀҶ䇝㓳ṧֻ┑䏣ⴞḷᾲᘥⲴањ䇱᰾˄proof˅DŽྲ᷌
‫ݸ‬傼⸕䇶нᆼ㖾ˈ䀓䟺ѝⲴ䇠ਧᗵ享㻛ᢙኅԕ‫ݱ‬䇨䘁լⲴ৲ᮠˈ㘼нᱟᆼ㖾Ⲵ䇱᰾DŽ

㺘 11-2 สҾ䀓䟺ⲴᆖҐ㇇⌅ Prolog-EBG

ሩ⇿њ䘈⋑㻛ᆖҐࡠⲴ Horn ᆀਕ䳶(LearnedRules)㾶ⴆⲴ↓ֻˈᔪ・ањᯠ Horn ᆀਕDŽ䈕ᯠⲴ


Horn ᆀਕⲴࡋᔪᱟ䙊䗷˄1˅᤹亶ฏ⨶䇪䀓䟺䇝㓳ṧֻˈ˄2˅࠶᷀↔䀓䟺ԕ⺞ᇊṧֻⲴ⴨‫ޣ‬⢩ᖱˈ
˄3˅ᔪ・аᯠⲴ Horn ᆀਕˈᆳ൘䈕㓴⢩ᖱ┑䏣ᰦᗇࡠⴞḷᾲᘥDŽ

Prolog-EBG(TargetConcept, TrainingExamples, DomainTheory)


 LearnedRulesĕ{}
 PosĕTrainingExamples ѝⲴ↓ֻ
 ሩ Pos ѝ⋑ᴹ㻛 LearnedRules 㾶ⴆⲴ⇿њ PositiveExampleˈ‫ڊ‬ԕл᫽֌˖
1. 䀓䟺
z Explanation ĕ а њ ԕ DomainTheory 㺘 ⽪ Ⲵ 䀓 䟺 ˄ 䇱 ᰾ ˅ ˈ 䈤 ᰾ Ѫ օ PositiveExample ┑ 䏣
TargetConcept
2. ࠶᷀
z SuffcientConditionsĕ᤹➗ Explanationˈ㜭ཏ‫┑࠶ݵ‬䏣 TargetConcept Ⲵ PositiveExample Ⲵᴰа㡜
⢩ᖱ䳶ਸ
3. ᭩䘋
z LearnedRulesĕLearnedRules+NewHornClauseˈަѝ NewHornClause ᖒᔿѪ˖
TargetConceptĕSufficientConditions
 䘄എ LearnedRules

ሩ ᖃ ࡽ ṧ ֻ Ⲵ 䀓 䟺 㿱 മ 11-2 DŽ ⌘ ᜿ ަ ѝ ᓅ 䜘 Ⲵ മ ᖒ ԓ 㺘 Ҷ 㺘 11-1 ѝ Ⲵ ↓ ֻ
SafeToStack(Obj1, Obj2)DŽമѝк䜘Ѫሩ↔ṧֻᶴ䙐Ⲵ䀓䟺DŽ⌘᜿↔䀓䟺˄ᡆ〠䇱᰾˅䈤᰾ഐѪ
Obj1 ∄ Obj2 ᴤ 䖫˄Lighter˅ˈᡰԕ Obj1 ਟԕᆹ‫ึޘ‬ਐ˄SafeToStack˅൘ Obj2 кDŽᴤ䘋а
↕ˈ⸕䚃 Obj1 ᴤ䖫ᱟഐѪᆳⲴ䟽䟿˄Weight˅ਟԕ⭡ަᇶᓖ˄Density˅઼փ〟˄Volume˅᧘
ᗇˈ㘼ф Obj2 Ⲵ 䟽䟿˄Weight˅ਟӾ㥦ࠐ˄Endtable˅Ⲵ唈䇔Ⲵ䟽䟿˄Weight˅٬ᗇࠪDŽ↔䀓
䟺สҾⲴ⢩ᇊ Horn ᆀਕ൘㺘 11-1 Ⲵ亶ฏ⨶䇪ѝᱮ⽪ࠪDŽ⌘᜿↔䀓䟺ਚᨀࡠҶ Obj1 ઼ Obj2 Ⲵ
኎ᙗѝⲴаሿ䜘࠶˄ণሩᓄҾമѝ䱤ᖡ४ฏⲴ኎ᙗ˅DŽ

㲭❦䘉䟼ሩҾ䇝㓳ṧ઼ֻ亶ฏ⨶䇪ਚᴹа⿽䀓䟺ˈа㡜ᛵߥлਟ㜭ᴹཊ⿽䀓䟺DŽ䘉ṧˈ䘉
Ӌ䀓䟺ѝԫ᜿ⲴᡆᡰᴹⲴ䜭ਟ㻛֯⭘DŽ⇿њ䀓䟺ਟሩ䇝㓳ṧֻᖒᡀн਼Ⲵ⌋ॆˈնᡰᴹ䀓䟺䜭
ሶ㻛㔉ᇊⲴ亶ฏ⨶䇪䇪䇱DŽ൘ Prolog-EBG ѝˈ䀓䟺Ⲵ⭏ᡀ֯⭘Ҷྲ Prolog ѝⲴਾੁ䬮ᔿᩌ
㍒DŽProlog-EBG ྲ Prolog аṧˈ൘ᆳ᢮ࡠㅜањᴹ᭸䇱᰾ᰦ㓸→DŽ

11.2.1.2 ࠼᷆䀙䠀

൘⌋ॆ䇝㓳ṧֻᰦ䶒ѤⲴ‫ޣ‬䭞䰞仈ᱟĀ൘ᖃࡽṧֻѝ䇨ཊ↓ྭѪⵏⲴ⢩ᖱѝˈଚањᱟ൘
а㡜ᛵߥлоⴞḷᾲᘥ⴨‫˛Ⲵޣ‬ā⭡ᆖҐಘᶴ䙐Ⲵ䀓䟺ሩ↔䰞仈֌ࠪҶⴤ᧕Ⲵഎㆄ˖↓ྭᱟ䛓
Ӌ൘䀓䟺ѝᨀ৺Ⲵ⢩ᖱDŽֻྲˈമ 11-2 Ⲵ䀓䟺वਜ਼Ҷ Obj1 Ⲵ Densityˈն⋑ᴹᆳⲴ Owner ኎
ᙗDŽഐ↔ˈSafeToStack(x,y)Ⲵ‫ٷ‬䇮ᓄवਜ਼ Density(x,0.3)ˈ㘼нवਜ਼ Owner(x,Fred)DŽ䙊䗷᭦䳶മ
11-2 ѝ䀓䟺Ⲵਦ㔃⛩ѝᨀ৺Ⲵ⢩ᖱˈᒦሶ Obj1 ઼ Obj2 ᴯᦒѪ x ઼ yˈਟᖒᡀањ⭡亶ฏ⨶䇪
䇪䇱Ⲵа㡜㿴ࡉDŽ

SafeToStac k ( x, y ) m Volume ( x,2) š Density ( x,0.3) š Type ( y , Endtable )

插图——原书页码:315

Explanation: 䀓䟺

Training Example: 䇝㓳ṧֻ

മ 11-2 䇝㓳ṧֻⲴ䀓䟺

л䜘Ⲵ㖁㔌ԕമᖒ㔈ࠪҶ㺘 11-1 ѝⲴ䇝㓳ṧֻ SafeToStack(Obj1,Obj2)DŽമк䶒䜘࠶㔈ࠪҶ↔ṧ


ֻᘾṧ┑䏣ⴞḷᾲᘥ SafeToStack Ⲵ䀓䟺DŽ䇝㓳ṧֻѝⲴ䱤ᖡ䜘࠶㺘⽪൘䀓䟺ѝ⭘ࡠⲴṧֻ኎ᙗDŽަԆ
н⴨‫Ⲵޣ‬ṧֻ኎ᙗሶӾᖒᡀⲴ⌋ॆ‫ٷ‬䇮ѝ৫ᦹDŽ
к 䶒 Ⲵ 㿴 ࡉ փ व ਜ਼ Ҷ 䇱 ᰾ ṁ ѝ ⇿ њ ਦ 㔃 ⛩ ˈ 䲔 Ҷ Ā Equal(0.6, times(2,0.3)) ā ઼
ĀLessThan(0.6, 5)āѻཆDŽ৫ᦹ䘉єњᱟഐѪṩᦞᇊѹᆳԜᙫᱟ㻛┑䏣Ⲵˈо x ઼ y ᰐ‫ޣ‬DŽ

䘎਼↔ᆖࡠⲴ㿴ࡉа䎧ˈ〻ᒿ䘈ਟԕᨀ‫ަ׋‬䇪䇱˖ሩ䇝㓳ṧֻⲴ䀓䟺ᖒᡀҶሩ↔㿴ࡉ↓⺞
ᙗⲴ䇱᰾DŽ㲭❦↔䀓䟺ᱟѪҶ㾶ⴆ㿲ሏࡠⲴ䇝㓳ṧֻ㘼ᖒᡀˈ਼ṧⲴ䀓䟺ሶ䘲⭘Ҿԫօо↔а
㡜㿴ࡉ३䝽ⲴᇎֻDŽ

к䶒Ⲵ㿴ࡉᶴᡀҶ↔䇝㓳ṧֻⲴањᖸᴹ᜿ѹⲴ⌋ॆˈഐѪᆳ৫䲔ҶṧֻⲴ䇨ཊоⴞḷᾲ
ᘥᰐ‫ޣ‬኎ᙗ˄ྲєњሩ䊑Ⲵ Color˅ˈ❦㘼䙊䗷ሩ䀓䟺ᴤԄ㓶ൠ࠶᷀ਟԕᗇࡠᴤа㡜Ⲵ㿴ࡉDŽ
Prolog-EBG ਟ䇑㇇㜭⭡䀓䟺䇪䇱Ⲵᴰа㡜Ⲵ㿴ࡉˈᯩ⌅䙊䗷䇑㇇䀓䟺Ⲵᴰᕡࡽ‫˄ۿ‬weakest
preimage˅ˈᇊѹྲл˖

定义: 㔃䇪 C ሩᓄҾ䇱᰾ P Ⲵᴰ ᴰᕡࡽ‫˄ۿ‬weakest preimage˅Ѫᴰа㡜Ⲵࡍ࿻ᯝ䀰䳶


ਸ Aˈ֯ᗇ A ᤹➗ P ⏥㮤 CDŽ

ֻྲˈⴞḷᾲᘥ SafeToStack(x,y)ሩᓄ㺘 11-1 䀓䟺Ⲵᴰᕡࡽ‫⭡ۿ‬л䶒㿴ࡉⲴփ㔉ࠪDŽ䘉ᱟ㜭


⭡മ 11-2 Ⲵ䀓䟺䇪䇱Ⲵᴰа㡜㿴ࡉ˖

SafeToStack(x, y)ĕVolume(x, vx)ġDensity(x,dx) ġ


Equal(wx, times(vx, dx)) ġLessThan(wx,5) ġ
Type(y, Endtable)
⌘᜿䘉њᴤа㡜Ⲵ㿴ࡉн㾱≲㔉ࠪ Volume ઼ Density Ⲵ⢩ᇊ٬ˈ㘼ࡽањ㿴ࡉ䴰㾱DŽᆳਚ
ᱟሩ䘉↔䘉Ӌ኎ᙗⲴ٬䘋㹼ᴤа㡜Ⲵ㓖ᶏDŽ

Prolog-EBG 䇑㇇ⴞḷᾲᘥⲴ‫ޣ‬Ҿ䀓䟺Ⲵᴰᕡࡽ‫Ⲵۿ‬䗷〻ˈ֯⭘Ⲵᱟа〠Ѫഎᖂ (regression)


Ⲵ䗷〻˄Waldinger 1977˅DŽഎᖂ䗷〻䪸ሩⲴᱟ⭡ԫ᜿ Horn ᆀਕ䳶㺘⽪Ⲵ亶ฏ⨶䇪DŽᆳⲴᐕ֌
ᯩᔿᱟ൘䀓䟺ѝ৽༽ൠਾ䘰ˈ俆‫ݸ‬ሩᓄҾ䀓䟺ѝᴰᵛ䇱᰾↕䇑㇇ⴞḷᾲᘥⲴᴰᕡࡽ‫❦ˈۿ‬ਾሩ
ᓄҾަࡽа↕僔䇑㇇㔃᷌㺘䗮ᔿⲴᴰᕡࡽ‫↔׍ˈۿ‬㊫᧘DŽ䈕䗷〻൘䙽শ䗷䀓䟺ѝᡰᴹ↕僔ਾ㓸
→ˈᗇࡠሩᓄҾ䀓䟺Ⲵਦ㢲⛩кⲴ᮷ᆇⲴⴞḷᾲᘥⲴᴰᕡࡽԦDŽ

↔എᖂ䗷〻Ⲵ䘀㹼↕僔㿱മ 11-3 ᡰ⽪DŽ൘↔മѝˈമ 11-2 ѝࠪ⧠䗷Ⲵ䀓䟺ԕḷ߶ᆇփ


˄䶎ᯌփ˅䟽⭫ࠪDŽ㘼൘⇿а↕⭡എᖂ䗷〻ࡋᔪⲴ䗩㕈എᖂ㺘䗮ᔿԕᑖлࡂ㓯Ⲵᯌփᆇᱮ⽪DŽ
↔䗷〻ᔰ࿻ҾṁⲴṩ䜘ˈަ䗩㕈㻛ࡍ࿻ॆѪа㡜ⴞḷᾲᘥ SafeToStack(x,y)DŽㅜа↕ᱟ䇑㇇↔䗩
㕈㺘䗮ᔿሩᓄҾ䀓䟺ѝᴰᵛ˄ᴰк䶒Ⲵ˅᧘⨶㿴ࡉⲴᴰᕡࡽ‫ۿ‬DŽ൘↔ᛵᖒл㿴ࡉѪ
SafeToStack(x, y) ĕLighter(x, y)ˈഐ↔ᗇࡠⲴᴰᕡࡽ‫ۿ‬Ѫ Lighter(x,y)DŽ❦ਾˈ䙊䗷↔䀓䟺ѝла
Horn ᆀਕˈ䈕䗷〻㔗㔝ሩ↔ᯠ䗩㕈{Lighter(x, y)}䘋㹼എᖂˈᗇࡠഎᖂ㺘䗮ᔿ{Weight(x, wx),
LessThan(wx, wy), Weight(y, wy)}DŽ↔ᔿ᜿ણ⵰ˈሩҾԫ᜿Ⲵ x ઼ yˈ㤕 x Ⲵ䟽䟿 wx བྷҾ y Ⲵ䟽
䟿 wy ˈ䀓䟺ᡀ・DŽ↔䗩㕈Ⲵഎᖂԕ↔а↕↕Ⲵᯩᔿ䘰എࡠ䀓䟺Ⲵਦ㔃⛩ˈᴰ㓸ᗇࡠṁⲴਦ㔃
⛩кⲴа㓴⌋ॆ᮷ᆇDŽ↔ᴰ㓸Ⲵ⌋ॆ᮷ᆇ䳶ਸˈྲമ 11-3 ᓅ䜘ᡰ⽪ˈᖒᡀҶᴰ㓸㿴ࡉⲴ㿴ࡉ
փDŽ

插图——原书页码:317
മ 11-3 䇑㇇ SafeToStack(Obj1,Obj2)‫ޣ‬Ҿ䀓䟺Ⲵᴰᕡࡽ‫ۿ‬

ⴞḷᾲᘥӾ䀓䟺Ⲵṩ䜘˄㔃䇪˅ᔰ࿻എᖂˈл䱽ࡠਦ㔃⛩DŽ൘⇿а↕˄⭡㲊㓯㺘⽪˅ˈᖃࡽ᮷ᆇ
䳶ਸ䗩㕈˄ᑖлࡂ㓯Ⲵᯌփ˅൘䀓䟺Ⲵањ㿴ࡉк㻛ਾੁഎᖂDŽᖃ↔䗷〻ᆼᡀᰦˈ㔃᷌᮷ᆇਸਆᶴᡀ
ҶሩᓄҾ䀓䟺ⲴⴞḷᾲᘥⲴᴰᕡࡽ‫ۿ‬DŽ↔ᴰᕡࡽ‫ۿ‬൘മⲴᓅ䜘ԕᯌփⲴ᮷ᆇᱮ⽪DŽ

എᖂ䗷〻ⲴṨᗳᱟˈ൘⇿а↕䙊䗷亶ฏ⨶䇪Ⲵаᶑ Horn ᆀਕഎᖂᖃࡽ䗩㕈㺘䗮ᔿⲴ㇇


⌅DŽ↔㇇⌅൘㺘 11-3 ѝ᧿䘠ᒦֻ⽪DŽ㺘ѝⲴ㤳ֻሩᓄҾമ 11-3 ѝᴰᓅ䜘Ⲵഎᖂ↕DŽྲ㺘ѝᱮ
⽪ⲴˈRegress ㇇⌅Ⲵ᫽֌䗷〻ᱟˈራ᢮ањ㖞ᦒ֯ Horn ᆀਕⲴཤо䗩㕈ѝⲴ⴨ᓄ᮷ᆇਸаˈ
⭘㿴ࡉփᴯᦒ䗩㕈ѝⲴ↔㺘䗮ᔿˈ޽ᓄ⭘ањਸа㖞ᦒࡠᮤњ䗩㕈DŽ

⭡Prolog-EBG䗃ࠪⲴᴰ㓸Hornᆀਕᖒᔿྲл˖ᆀਕփ㻛ᇊѹѪк䘠䗷〻䇑㇇ࠪⲴᴰᕡࡽ
ԦDŽᆀਕཤѪⴞḷᾲᘥᵜ䓛ˈԕ৺ᓄ⭘ࡠᆳкⲴ⇿аഎᖂ↕ѝⲴ⇿њ㖞ᦒ˄ྲ㺘 11-3 ѝⲴ㖞
ᦒ©hl˅DŽᓄ⭘↔㖞ᦒᱟѪҶ൘ࡋᔪࠪⲴᆀਕཤ઼ᆀਕփѝ‫؍‬ᤱа㠤ਈ䟿਽ˈԕ৺ᖃ↔䀓䟺ਚ
ᓄ⭘ҾⴞḷᾲᘥⲴ⢩↺ᛵߥᰦ⢩ॆᆀਕཤDŽྲࡽᤷࠪⲴˈሩҾᖃࡽⲴֻᆀˈᴰ㓸㿴ࡉѪ˖

SafeToStack(x, y)ĕVolume(x, vx)ġDensity(x,dx) ġ


Equal(wx, times(vx, dx)) ġLessThan(wx,5) ġ
Type(y, Endtable)

㺘 11-3 䙊䗷ањ Horn ᆀਕഎᖂа㓴᮷ᆇⲴ㇇⌅

⭡䗩㕈˄Frontier˅㔉ࠪⲴ᮷ᆇ䳶ਸ䙊䗷Rule㻛എᖂDŽLiteralѪ↔䀓䟺ѝ⭡Rule᧘⨶ⲴFrontierᡀ
ઈDŽ㖞ᦒ ©hi 㔉ࠪҶӾRuleⲴཤࡠ䀓䟺ѝሩᓄ᮷ᆇⲴਈ䟿㓖ᶏDŽ↔㇇⌅俆‫ݸ‬䇑㇇ањ㜭֯RuleⲴཤо
LiteralਸаⲴ㖞ᦒ © hl ˈަᯩ⌅ᱟ֯ަо㖞ᦒ © hi а㠤DŽ❦ਾ↔㖞ᦒ © hl 㻛ᓄ⭘Ҿᔪ・‫ޣ‬ҾRuleⲴ
FrontierⲴࡽ‫ۿ‬DŽ㇇⌅ѝㅖਧĀˇā઼Āˉā㺘⽪䳶ਸᒦ઼䳶ਸᐞDŽ䇠ਧ{z/y}㺘⽪⭘y㖞ᦒzDŽ㺘ѝ䘈㔉
ࠪҶ࠶↕䘀㹼ⲴֻᆀDŽ

Regress(Frontier, Rule, Literal, ©hi)


Frontier˖䙊䗷㿴ࡉ㻛എᖂⲴ᮷ᆇ䳶ਸ
Rule˖ањ Horn ᆀਕ
Literal˖൘ Frontier ѝⲴањ᮷ᆇˈᆳ⭡䀓䟺ѝⲴ Rule ᧘ᗇ
©hi˖֯RuleⲴཤо䀓䟺ѝⲴ⴨ᓄ᮷ᆇਸаⲴ㖞ᦒ
䘄എᶴᡀ Frontier Ⲵ‫ޣ‬Ҿ Rule Ⲵᴰᕡࡽ‫Ⲵۿ‬᮷ᆇ䳶ਸ
 headĕRule Ⲵཤ
 bodyĕRule Ⲵփ
 ©hlĕheadоLiteralⲴᴰа㡜ਸаˈ֯ᗇᆈ൘㖞ᦒ©li┑䏣˖
©li (©hl (head))= ©hi (head)
 䘄എ©hl(Frontier-head+body)
⽪ֻ˄മ 11-3 ѝᴰл䶒Ⲵഎᖂ↕˅˖
Regress(Frontier, Rule, Literal, ©hi)ˈަѝ
Frontier = {Volume(x, vx), Density(x, dx), Equal(wx, times(vx, dx)), LessThan(wx, wy), Weight(y, wy)}
Rule = Weight(z, 5) ĕType(z, Endtable)
Literal = Weight(y, wy)
©hi = {z/Obj2}
 headĕWeight(z, 5)
 bodyĕType(z, Endtable)
 ©hlĕ{z/y, wy/5}ˈަѝ©li={y/Obj2}
 䘄എ{Volume(x, vx), Density(x, dx), Equal(wx, times(vx, dx)), lessThan(wx, 5), Type(y, Endtable)}

11.2.1.3 ᭯䘑ᖉࢃ‫ٽ‬䇴

൘⇿а䱦⇥Ⲵᖃࡽ‫ٷ‬䇮⭡ᖃᰦᆖҐࡠⲴ Horn ᆀਕ䳶㓴ᡀDŽ൘⇿а䱦⇥ˈᒿࡇ㾶ⴆ㇇⌅䘹


ਆањ䘈ᵚ㻛ᖃࡽ Horn ᆀਕ㾶ⴆⲴᯠ↓ֻˈ䀓䟺䈕↓ֻˈᒦ᤹➗к䶒Ⲵ䗷〻ᖒᡀᯠ㿴ࡉDŽ⌘
᜿ᡁԜᐢᇊѹⲴ㇇⌅ѝਚᴹ↓ֻ㻛㾶ⴆˈ㘼фᆖҐࡠⲴ Horn ᆀਕ䳶ਚ亴⍻↓ֻDŽሩҾањᯠ
ᇎֻˈྲ᷌ᖃࡽ㿴ࡉ亴⍻ަ↓ֻཡ䍕ˈࡉᆳ㻛࠶㊫Ѫ৽ֻDŽ䘉ᱟо Prolog 䘉ṧⲴ Horn ᆀਕ᧘
⨶㌫㔏ѝḷ߶Ⲵཡ䍕੖ᇊᯩ⌅⴨੫ਸⲴDŽ

11.3 ሯะӄ䀙䠀ⲺᆜҖⲺ䈪᱄

ྲᡁԜ൘кֻѝⴻࡠⲴ Prolog-EBG ሩঅњ䇝㓳ṧֻ䘋㹼䈖㓶࠶᷀ˈԕ⺞ᇊྲօᴰྭൠӾ


⢩↺ṧֻ⌋ॆࡠа㡜 Horn ᆀਕ‫ٷ‬䇮DŽл䶒Ѫ↔㇇⌅Ⲵ㾱⛩˖
x Prolog-EBG н‫ۿ‬ᖂ㓣Ⲵᯩ⌅ˈᆳ䙊䗷䘀⭘‫ݸ‬傼⸕䇶࠶᷀অњṧֻԕӗ⭏ਸ⨶Ⲵ
˄justified˅а㡜‫ٷ‬䇮DŽ
x ሩṧֻྲօ┑䏣ⴞḷᾲᘥⲴ䀓䟺ˈ⺞ᇊҶṧֻⲴଚӋ኎ᙗᱟ⴨‫˖Ⲵޣ‬ণ൘䀓䟺ѝ
ᨀ৺Ⲵ኎ᙗDŽ
x ሩ䀓䟺Ⲵ䘋а↕࠶᷀ˈণഎᖂⴞḷᾲᘥԕ⺞ᇊަሩᓄ䀓䟺Ⲵᴰᕡࡽ‫ˈۿ‬ਟ᧘ሬࠪ
⴨‫ޣ‬⢩ᖱ٬Ⲵа㡜㓖ᶏDŽ
x ⇿њᆖҐࡠⲴ Horn ᆀਕሩᓄҾ┑䏣ⴞḷᾲᘥⲴањ‫࠶ݵ‬ᶑԦDŽᆖҐࡠⲴ Horn ᆀ
ਕ䳶㾶ⴆҶᆖҐಘ䙷ࡠⲴ↓ֻˈԕ৺ަԆо↔‫ޡ‬ӛ਼ṧ䀓䟺ⲴᇎֻDŽ
x ᆖҐࡠⲴ Horn ᆀਕⲴ⌋ᙗሶ‫׍‬䎆Ҿ亶ฏ⨶䇪Ⲵᖒᔿԕ৺䇝㓳ṧֻ㻛㘳㲁ⲴᒿࡇDŽ
x Prolog-EBG 䳀ਜ਼‫ٷ‬ᇊҶ亶ฏ⨶䇪ᱟ↓⺞фᆼᮤⲴˈྲ᷌亶ฏ⨶䇪н↓⺞ᡆнᆼ
ᮤˈᆖࡠⲴᾲᘥҏሶн↓⺞DŽ

൘สҾ䀓䟺ⲴᆖҐѝᴹаӋ⴨‫Ⲵޣ‬㿲⛩ˈਟᴹࣙҾ⨶䀓ަ㜭઼࣋䲀ࡦ˖
x EBL ֌Ѫ⨶ ⨶䇪ᕅሬⲴṧֻ⌋ॆ˄theory-guided generalization of examples˅DŽEBL ֯
⭘㔉ᇊⲴ亶ฏ⨶䇪ԕӾṧֻѝਸ⨶ൠ⌋ॆˈ४࠶ࠪ⴨‫઼ޣ‬н⴨‫Ⲵޣ‬ṧֻ኎ᙗˈഐ
↔ਟԕ䚯‫⭘ݽ‬Ҿ㓟ᖂ㓣᧘⨶ѝⲴṧᵜ༽ᵲᓖ⭼䲀DŽ䘉ᱟањ䳀ਜ਼൘к䶒᧿䘠Ⲵ
Prolog-BEG ㇇⌅ѝⲴ㿲⛩DŽ
x EBL ֌Ѫṧ ṧֻᕅሬⲴ⨶䇪䟽ᔪ˄example-guided reformulation of theories˅DŽProlog-
EBG ㇇⌅㻛ⴻ֌ᱟа⿽䟽ᔪ亶ฏ⨶䇪ࡠа⿽ਟ᫽֌ᖒᔿⲴᯩ⌅DŽ⺞࠷ൠ䇢ˈ䟽ᔪ
亶ฏ⨶䇪ᱟ䙊䗷ࡋᔪ䘉ṧⲴ㿴ࡉ˖˄a˅㜭Ӿ亶ฏ⨶䇪ѝ╄㓾⍮⭏ˈԕ৺˄b˅൘а
њ᧘⨶↕޵࠶㊫㿲ሏࡠⲴ䇝㓳ṧֻDŽ䘉ṧˈᆖҐࡠⲴ㿴ࡉਟ㻛ⴻ֌ሶ亶ฏ⨶䇪䟽
ᔪѪа㓴⢩↺ᛵߥлⲴ㿴ࡉˈᆳ㜭൘ањ᧘⨶↕޵ሩⴞḷᾲᘥⲴᇎֻ࠶㊫DŽ
x EBL ֌ѪĀ Āӵӵā䟽䘠ᆖҐಘᐢ㓿Ā⸕䚃āⲴ˄“just” restating what the learner
already “knows”˅DŽ൘Ḁ⿽〻ᓖкˈ൘ SafeToStack ֻᆀѝⲴᆖҐಘᔰ࿻Ҿަⴞḷ
ᾲᘥⲴ‫ޘ‬䜘⸕䇶DŽҏቡᱟ䈤ˈྲ᷌ᆳⲴࡍ࿻亶ฏ⨶䇪‫࠶ݵ‬䀓䟺Ҷԫօ䇝㓳ṧֻˈ
䛓Ѹᆳҏ㜭‫࠶ݵ‬亴⍻ަ࠶㊫DŽ䛓ѸᆖҐⲴ᜿ѹ൘ଚ‫ݯ‬઒˛а⿽എㆄᱟˈ൘䇨ཊԫ
࣑ѝˈ৏ࡉкᐢ⸕Ⲵ઼ᇎ䐥кਟᴹ᭸䇑㇇Ⲵѻ䰤Ⲵ४࡛ᖸབྷˈഐ↔䘉⿽Ā⸕䇶䟽
ᔪāѪᆖҐⲴ䟽㾱ᖒᔿDŽֻྲ൘лỻⲴֻᆀѝˈሩᔸⲴ㿴ࡉᶴᡀҶањᆼ㖾Ⲵ亶
ฏ⨶䇪ˈ৏ࡉк䏣ԕ䘋㹼ᆼ㖾ⲴሩᔸDŽণ֯ྲ↔ˈӪԜӽ❦䴰㾱བྷ䟿Ⲵ㓿傼ᶕᆖ
ҐྲօᖸྭൠлỻDŽ䘉↓ᱟ䘉ṧа⿽ᛵᖒˈ˄Ӫ㊫Ⲵ˅ᆖҐಘᐢ㓿⸕䚃Ҷᆼ㖾Ⲵ
亶ฏ⨶䇪ˈ㘼䘋а↕ᆖҐਚᱟĀㆰঅൠāሶ↔⸕䇶䟽ᔪѪਖа⿽ᖒᔿˈԕ⭘Ҿᴤ
ᴹ᭸Ⲵᤷሬ䘲ᖃⲴ㹼ѪDŽᴹ਼ṧ኎ᙗⲴਖањֻᆀᱟᆖҐ⢋亯࣋ᆖ䈮〻˖สᵜⲴ
⢙⨶ᇊᖻᐢ㻛ㆰঅൠ䱸䘠ˈնᆖ⭏ӽᰗ䴰㾱൘ᆖᵏѝ㣡аབྷ䜘࠶ᰦ䰤ᆖҐ䘉а䈮
〻ˈԕᤕᴹᴤਟ᫽֌ᖒᔿⲴ⸕䇶ˈ❦ਾቡн䴰㾱൘ᴰਾⲴ㘳䈅ѝ⭘ᴰสᵜⲴᇊᖻ
ᶕ᧘ሬ⇿њ䰞仈Ⲵ䀓DŽProlog-EBG ᢗ㹼Ⲵቡᱟ䘉⿽ᖒᔿⲴ⸕䇶䟽ᔪˈᆳᆖҐࡠⲴ
㿴ࡉਟӾਟ㿲ሏⲴᇎֻ⢩ᖱ᱐ሴࡠ‫ޣ‬ҾⴞḷᾲᘥⲴ࠶㊫ˈᯩ⌅ᱟ֯ަоสᵜ亶ฏ
⨶䇪а㠤DŽ֯⭘৏࿻Ⲵ亶ฏ⨶䇪ਟ㜭䴰㾱䇨ཊ᧘⨶↕઼ᖸਟ㿲Ⲵᩌ㍒᡽㜭ሩԫ᜿
ᇎֻ࠶㊫ˈ㘼ᆖҐࡠⲴ㿴ࡉਟ൘ањ᧘⨶↕޵࠶㊫㿲ሏࡠⲴᇎֻDŽ

ഐ↔ˈ㓟㋩Ⲵ EBL 㠤࣋Ҿ䟽ᔪ亶ฏ⨶䇪ԕӗ⭏ਟঅ↕᧘⨶ࠪṧֻ࠶㊫Ⲵа㡜㿴ࡉDŽ䘉⿽


⸕䇶䟽ᔪⲴ䗷〻ᴹᰦ㻛〠Ѫ⸕䇶≷㕆˄knowledge compilation˅ˈ㺘⽪䘉⿽䖜ᦒᱟѪҶ໎࣐᭸
⦷ˈ㘼н᭩ਈ㌫㔏⸕䇶Ⲵ↓⺞ᙗDŽ

11.3.1 ਇ⧦᯦⢯ᖷ

Prolog-EBG ањᴹ䏓Ⲵ㜭࣋ᱟᖒᡀ൘䇝㓳ṧֻⲴ᧿䘠ѝ⋑ᴹᱮᔿࠪ⧠Ⲵᯠ⢩ᖱˈն䘉Ӌ
⢩ᖱᱟ൘᧿䘠䇝㓳ṧֻѝⲴа㡜㿴ࡉᰦᗵ䴰ⲴDŽ䘉⿽㜭࣋൘ࡽа㢲Ⲵ࠶↕㇇⌅઼ᆖࡠⲴ㿴ࡉѝ
ֻ⽪DŽ⺞࠷ൠ䈤ˈᆖࡠⲴ㿴ࡉᯝ䀰ሩ x Ⲵ Volume ઼ Density Ⲵᗵ㾱㓖ᶏѪަ҈〟ሿҾ 5DŽᇎ䱵
кˈ䇝㓳ṧֻᒦнवਜ਼↔҈〟ԕ৺ᆳᓄਆⲴ٬Ⲵ᧿䘠DŽ↔㓖ᶏᱟ⭡ᆖҐಘ㠚ࣘᖒᡀⲴDŽ

⌘᜿↔ᆖҐࡠⲴĀ⢩ᖱā㊫լҾ⭡⾎㓿㖁㔌Ⲵ䳀㯿অ‫ݳ‬㺘⽪Ⲵ⢩ᖱ㊫රDŽҏቡᱟ䈤ˈ䘉њ
⢩ᖱᱟਟ⭡ᐢᴹᇎֻ኎ᙗ䇑㇇ࠪⲴǃབྷ䟿▌൘Ⲵ⢩ᖱѻаDŽ઼ਾੁՐ᫝㇇⌅аṧˈProlog-EBG
൘ަቍ䈅ᤏਸ䇝㓳ᮠᦞⲴ䗷〻ѝˈ㠚ࣘᖒᡀ䘉ṧⲴ⢩ᖱDŽ❦㘼ˈн‫⾎ۿ‬㓿㖁㔌ѝ֯⭘㔏䇑䗷〻
Ӿཊњ䇝㓳ṧֻѝ᧘ሬࠪ䳀㯿অ‫ݳ‬⢩ᖱˈProlog-EBG ᓄ⭘Ҷањ࠶᷀䗷〻สҾঅњ䇝㓳ṧֻ
Ⲵ ࠶ ᷀ ᧘ ሬ ᯠ Ⲵ ⢩ ᖱ DŽ к 䶒 Ⲵ ֻ ᆀ ѝ Prolog-EBG ⭘ ࠶ ᷀ Ⲵ ᯩ ⌅ ᧘ ሬ ࠪ ⢩ ᖱ
Volume · Density>5 ˈᆳᶕ㠚Ҿ⭘Ҿ䀓䟺অњ䇝㓳ṧֻⲴ亶ฏ⨶䇪Ⲵ⢩ᇊᇎֻॆDŽֻྲˈ
ĀVolumn ઼ Density Ⲵ҈〟ᖸ䟽㾱ā䘉аᾲᘥᱟᶕ㠚Ҿᇊѹ Weight Ⲵ亶ฏ⨶䇪㿴ࡉDŽ䈕҈〟ᗵ
享ሿҾ 5 Ⲵᾲᘥᶕ㠚Ҿਖཆєᶑ亶ฏ⨶䇪㿴ࡉˈᆳԜᯝ䀰 Obj1 ᗵ享∄㥦ࠐ˄EndTable˅ᴤ䖫
˄Lighter˅ˈԕ৺㥦ࠐ˄Endtable˅Ⲵ䟽䟿˄Weight˅ㅹҾ 5DŽഐ↔ˈ↓ᱟ䘉Ӌ亶ฏ⨶䇪ѝⲴ৏
ᆀ亩Ⲵ⢩ᇊਸᡀ઼ᇎֻॆ᡽ሬ㠤Ҷ↔ᯠ⢩ᖱⲴᇊѹDŽ

㠚ࣘᆖҐᴹ⭘⢩ᖱԕᢙབྷᇎֻ㺘⽪Ⲵ䰞仈ᱟᵪಘᆖҐⲴањ䟽㾱䰞仈DŽ൘สҾ䀓䟺ⲴᆖҐ
ѝ࠶᷀᧘ሬᯠ⢩ᖱˈ઼൘⾎㓿㖁㔌Ⲵ䳀㯿অ‫ݳ‬ѝᖂ㓣᧘ሬᯠ⢩ᖱᨀ‫׋‬Ҷє⿽н਼Ⲵ䙄ᖴDŽഐ
↔ˈᆳԜ‫׍‬䎆Ⲵؑ᚟ᶕⓀн਼˄ањᱟ൘䇨ཊṧֻкⲴ㔏䇑㿴ࡉˈਖањᱟ֯⭘亶ฏ⨶䇪Ⲵঅ
њṧֻ࠶᷀˅ˈᴹਟ㜭㔃ਸє⿽ᶕⓀ᧒㍒ࠪᯠⲴᯩ⌅DŽ
11.3.2 ╊㔄ᆜҖ

㓟㋩Ⲵ Prolog-EBG ᱟањ╄㓾Ⲵ㘼нᱟᖂ㓣ⲴᆖҐ䗷〻DŽҏቡᱟ䈤ˈ䙊䗷䇑㇇䀓䟺Ⲵᴰ


ᕡࡽ‫ˈۿ‬ᆳӗ⭏ањਟӾ亶ฏ⨶䇪 B ѝ╄㓾⍮⭏Ⲵ‫ٷ‬䇮 hˈ㘼ф㾶ⴆ䇝㓳ᮠᦞ DDŽᴤ㋮⺞ൠ
䇢ˈProlog-EBG 䗃ࠪањ‫ٷ‬䇮 h ┑䏣л䶒Ⲵ㓖ᶏ˖

(¢ xi , f ( xi )²  D)(h š xi ) ƅf(xi) ˄11ˊ1˅

DġBƅh ˄11ˊ2˅

ަѝ䇝㓳ᮠᦞD⭡а㓴䇝㓳ṧֻ㓴ᡀˈxiѪㅜiњ䇝㓳ᇎֻˈf(xi)ѪᆳⲴⴞḷ٬˄fѪⴞḷ࠭
ᮠ˅DŽ⌘᜿ㅜањ㓖ᶏਚᱟㆰঅൠሶᵪಘᆖҐⲴ䙊ᑨⲴ䴰≲ᖒᔿॆˈণ‫ٷ‬䇮h㜭ሩ䇝㓳ᮠᦞѝ
⇿њᇎֻxi↓⺞亴⍻ⴞḷ٬f(xi)*DŽᖃ❦а㡜ᛵߥлᴹཊ⿽‫ٷ‬䇮┑䏣䘉а㓖ᶏDŽㅜҼњ㓖ᶏ᧿䘠
ҶProlog-EBLѝ亶ฏ⨶䇪Ⲵ֌⭘˖䗃ࠪ‫ٷ‬䇮㻛䘋а↕㓖ᶏԕ֯ަ⍮⭏Ҿ亶ฏ⨶䇪઼ᮠᦞDŽ䘉ㅜ
Ҽњ㓖ᶏ߿ቁҶᆖҐಘ൘ᗵ享䘹ᤙ‫ٷ‬䇮ᰦ䶒ѤⲴ↗ѹᙗDŽഐ↔ˈ亶ฏ⨶䇪Ⲵ֌⭘ᱟ߿ቁ‫ٷ‬䇮オ
䰤Ⲵᴹ᭸㿴⁑ᒦ䱽վᆖҐⲴṧᵜ༽ᵲᓖDŽ

֯⭘⴨լⲴ䇠ਧˈᡁԜਟ᧿䘠ࠪ Prolog-EBG ᡰ䴰Ⲵ亶ฏ⨶䇪Ⲵ⸕䇶㊫රDŽ⺞࠷ൠ䇢ˈ


Prolog-EBG ‫ٷ‬ᇊ亶ฏ⨶䇪 B ⏥㮤䇝㓳ᮠᦞѝᇎֻⲴ࠶㊫DŽ

(¢ xi , f ( xi )²  D)( B š xi ) ƅf(xi) ˄11ˊ3˅

䘉њሩ亶ฏ⨶䇪 B Ⲵ㓖ᶏ‫؍‬䇱Ҷሩ⇿њ↓ֻਟᶴ䙐ࠪ䀓䟺DŽ

ሶ Prolog-EBG ᆖҐ䰞仈઼ᖂ㓣䙫䗁㕆〻˄ㅜ 10 ㄐ˅ⲴᆖҐ䰞仈֌а∄䖳ᖸᴹ᜿ѹDŽ൘ㅜ


10 ㄐᡁԜ䇘䇪Ҷа㡜ॆⲴᖂ㓣ᆖҐԫ࣑ˈަѝሩᆖҐಘᨀ‫׋‬Ҷ㛼Ჟ⸕䇶 B´DŽᡁԜ֯⭘ B´㘼н
ᱟ B ᶕԓ㺘 ILP ᡰ֯⭘Ⲵ㛼Ჟ⸕䇶ˈഐѪᆳа㡜н┑䏣ᔿ 11.3 Ⲵ㓖ᶏDŽILP ᱟањᖂ㓣ᆖҐ㌫
㔏ˈ㘼 Prolog-EBG ᱟ╄㓾ᆖҐ㌫㔏DŽILP ֯⭘ަ㛼Ჟ⸕䇶 B´ᶕᢙབྷᖵ㘳㲁Ⲵ‫ٷ‬䇮䳶ਸˈ㘼
Prolog-EBG ֯⭘ަ亶ฏ⨶䇪 B ᶕ߿ሿਟ᧕ਇ‫ٷ‬䇮Ⲵ䳶ਸDŽྲᔿ 10.2 㺘⽪ⲴˈILP ㌫㔏䗃ࠪⲴ h
┑䏣л䶒Ⲵ㓖ᶏ˖

(¢ xi , f ( xi )²  D)( B'š h š xi ) ƅf(xi)

⌘᜿↔㺘䗮ᔿоProlog-EBGሩhӗ⭏Ⲵ㓖ᶏ˄⭡ᔿ 11.2 ઼ 11.3 㔉ࠪ˅ѻ䰤Ⲵ㚄㌫DŽ䘉њ൘


hкⲴILP㓖ᶏᱟᔿ 11.1 ѝ㓖ᶏⲴᕡॆᖒᔿDŽILP㓖ᶏਚ㾱≲ ( B'š h š xi ) ƅf(xi)ˈ㘼Prolog-EBG
㾱≲ᴤѕṬⲴ (h š xi ) ƅf(xi)DŽ䘈㾱⌘᜿ILPѝ⋑ᴹሩᓄᔿ 11.2 ѝProlog-EBG㓖ᶏDŽ

*
䘉䟼൘⏥㮤˄ƅ˅Ⲵᇊѹѝवਜ਼ҶPrologṧᔿⲴཡ䍕੖ᇊˈഐ↔ྲ᷌ṧֻн㜭㻛䇱᰾Ѫ↓ֻˈࡉᆳԜ㻛
⏥㮤Ѫ৽ֻDŽ
11.3.3 ะӄ䀙䠀ⲺᆜҖⲺᖈ㓩‫څ‬㖤

എᗶㅜ 2 ㄐⲴਉ䘠ˈањᆖҐ㇇⌅Ⲵᖂ㓣‫ٿ‬㖞Ѫа㓴ᯝ䀰ˈᆳԜо䇝㓳ṧֻа䎧╄㓾⏥㮤
ᆖҐಘⲴਾ㔝亴⍻DŽᖂ㓣‫ٿ‬㖞Ⲵ䟽㾱ᙗ൘Ҿᆳ࡫⭫ࠪᆖҐಘᱟᘾṧӾ㿲ሏࡠⲴ䇝㓳ṧֻ⌋ॆ
ⲴDŽ

Prolog-EBG Ⲵᖂ㓣‫ٿ‬㖞ᱟӰѸ˛൘ Prolog-EBG ѝˈྲᔿ 11.2 ᡰ᧿䘠Ⲵˈ䗃ࠪⲴ‫ٷ‬䇮 h Ӿ


DġB ѝ╄㓾⍮⭏DŽഐ↔亶ฏ⨶䇪 B Ѫа㓴ᯝ䀰ˈᆳԜо䇝㓳ṧֻа䎧⏥㮤䗃ࠪ‫ٷ‬䇮DŽ⭡Ҿᆖ
ҐಘⲴ亴⍻Ӿ↔‫ٷ‬䇮 h ѝ⍮⭏ˈլѾ Prolog-EBG Ⲵᖂ㓣‫ٿ‬㖞ቡᱟ䗃‫ޕ‬ᆖҐಘѝⲴ亶ฏ⨶䇪
BDŽᇎ䱵кਟԕ䘉ṧ䇔ᇊˈ䲔Ҷ䘈䴰㘳㲁ਖཆањ㓶㢲˖亶ฏ⨶䇪ਟ⏥㮤ཊњਟ䘹Ⲵ Horn ᆀਕ
䳶DŽഐ↔ˈᖂ㓣‫ٿ‬㖞䘈䴰वਜ਼ Prolog-EBG ൘䘉Ӌਟ䘹Ⲵ Horn ᆀਕ䳶ѝ֌ࠪ䘹ᤙ䘉䜘࠶޵ᇩDŽ
ྲк䶒ᡰ㿱ࡠⲴˈProlog-EBG ֯⭘ᒿࡇ㾶ⴆ㇇⌅нᯝᖒᡀ䱴࣐Ⲵ Horn ᆀਕⴤࡠᡰᴹⲴ↓ֻ㻛
㾶ⴆDŽᴤ䘋а↕ˈ⇿њঅ⤜Ⲵ Horn ᆀਕᱟᖃࡽ䇝㓳ṧֻⲴ䀓䟺ᡰ䇨ਟⲴᴰа㡜ᆀਕ˄ণᴰᕡ
ࡽ‫˅ۿ‬DŽഐ↔൘亶ฏ⨶䇪⏥㮤Ⲵ਴ Horn ᆀਕ䳶ѻѝˈᡁԜਟԕሶ Prolog-EBG Ⲵ‫ٿ‬㖞࡫⭫Ѫሩ
ᶱབྷа㡜ॆ Horn ᆀਕⲴሿ䳶ਸⲴ‫ྭٿ‬DŽᇎ䱵к Prolog-EBG Ⲵ䍚ႚ㇇⌅ਚᱟѪራ᢮ᶱབྷа㡜ॆ
Horn ᆀਕⲴⵏ↓ᴰ⸝䳶ਸᡰ䴰Ⲵᖫᓅᩌ㍒㇇⌅Ⲵањ੟ਁᔿⲴ䘁լDŽᰐ䇪ᘾṧˈProlog-EBG
ᖂ㓣‫ٿ‬㖞ӽਟ⭘䘉⿽ᯩᔿ䘁լ࡫⭫DŽ

䘁լⲴ Prolog-EBG ᖂ㓣‫ٿ‬㖞˖亶ฏ⨶䇪 Bˈ࣐кሩᶱབྷа㡜ॆ Horn ᆀਕⲴሿ䳶ਸⲴ‫ྭٿ‬DŽ

䘉䟼ᴰ䟽㾱Ⲵ㾱⛩൘ҾˈProlog-EBG Ⲵᖂ㓣‫ٿ‬㖞˄ণᆳӾ䇝㓳ᮠᦞѝ⌋ॆⲴㆆ⮕˅൘ᖸ
བྷ〻ᓖк⭡䗃‫Ⲵޕ‬亶ฏ⨶䇪⺞ᇊDŽᆳоᡁԜᡰ䇘䇪䗷ⲴཊᮠᆖҐ㇇⌅ᆼ‫ޘ‬н਼DŽཊᮠᆖҐ㇇⌅
˄ྲ⾎㓿㖁㔌ˈߣㆆṁᆖҐ˅ѝᖂ㓣‫ٿ‬㖞ᱟᆖҐ㇇⌅Ⲵањപᇊ኎ᙗˈа㡜ᱟ⭡ަ‫ٷ‬䇮㺘⽪Ⲵ
䈝⌅ᡰ⺞ᇊⲴDŽѪӰѸᢺᖂ㓣‫ٿ‬㖞֌Ѫањ䗃‫ޕ‬৲ᮠ㘼нᱟᆖҐಘⲴപᇊ኎ᙗॱ࠶䟽㾱˛䘉ᱟ
ഐѪˈྲᡁԜ൘ㅜ 2 ㄐ৺ަԆൠᯩ䇘䇪䗷Ⲵˈнᆈ൘ањ‫ޘ‬ተᴹ᭸Ⲵᖂ㓣‫ٿ‬㖞ˈ㘼фᰐ‫ٿ‬ᆖҐ
ᱟᰐ⭘ⲴDŽഐ↔ԫօᔰਁ䙊⭘ᆖҐᯩ⌅Ⲵቍ䈅ˈ䜭㠣ቁՊ‫ݱ‬䇨ᖂ㓣‫ٿ‬㖞㜭ཏ䪸ሩᖵ䀓ߣⲴᆖҐ
䰞仈ᴹᡰн਼DŽ൘ањᴤᇎ䐥ᙗⲴቲ⅑кˈ䇨ཊᆖҐԫ࣑ᴤᐼᵋ䗃‫ޕ‬亶ฏ⢩ᇊⲴ⸕䇶˄ྲ
SafeToStack ֻᆀѝⲴᴹ‫ ޣ‬Weight Ⲵ⸕䇶˅ԕᖡ૽ᆖҐಘӾ䇝㓳ᮠᦞѝ⌋ॆⲴᯩ⌅DŽ⴨৽ˈ䙊
䗷䲀ࡦ‫ٷ‬䇮Ⲵ䈝⌅ᖒᔿ˄ྲ‫ߣ⸝ྭٿ‬ㆆṁ˅ᶕĀᇎ⧠āḀ䘲ᖃⲴ‫ٿ‬㖞ᙗࡉнཚ㠚❦DŽᴰਾˈྲ
᷌㘳㲁ањᴤབྷⲴ䰞仈ˈањ㠚⋫ agent ྲօ䲿⵰ᰦ䰤᭩䘋ᆳⲴᆖҐ㜭࣋ˈ䛓Ѹᴰྭᱟᴹањ
ᆖҐ㇇⌅ˈᆳⲴ⌋ॆ㜭࣋ਟ൘ަ㧧ᗇࡠᴤཊⲴ亶ฏ⸕䇶ਾ໎ᕪDŽ

11.3.4 ⸛䇼ቸ⅗ⲺᆜҖ

ྲᔿ 11.2 ᤷࠪⲴˈ⭡ Prolog-EBG 䗃ࠪⲴ‫ٷ‬䇮 h Ӿ亶ฏ⨶䇪 B ઼䇝㓳ᮠᦞ D ѝ╄㓾⍮⭏DŽ


ᇎ䱵кˈ䙊䗷㘳ḕ Prolog-EBG ㇇⌅ˈᖸᇩ᱃ⴻࠪ h ⴤ᧕Ӿঅ⤜Ⲵ B ѝ⍮⭏ˈ㘼о D ᰐ‫ޣ‬DŽѪ
Ҷ⨶䀓䘉а⛩ˈᡁԜਟԕ‫ٷ‬ᜣᴹањ〠Ѫᶑⴞ᷊Ѯಘ˄Lemma-enumerator˅Ⲵ㇇⌅DŽ䘉њ㇇⌅
สҾ亶ฏ⨶䇪 B ѝⲴᯝ䀰ㆰঅൠ᷊Ѯ㜭ᗇࡠⴞḷᾲᘥⲴᡰᴹ䇱᰾ṁDŽሩ⇿њ䇱᰾ṁˈLemma-
enumerator ⭘о Prolog-EBG ⴨լⲴᯩ⌅䇑㇇ᴰᕡࡽ‫ۿ‬ᒦᶴ䙐ањ Horn ᆀਕDŽ൘ Lemma-
enumerator ઼ Prolog-EBG ѻ䰤ᜏаⲴн਼ᱟˈLemma-enumerator ᘭ⮕䇝㓳ᮠᦞᒦ᷊Ѯࠪᡰᴹ
Ⲵ䇱᰾ṁDŽ

⌘᜿ Lemma-enumerator 䗃ࠪⲴᱟ Prolog-EBG 䗃ࠪ Horn ᆀਕⲴ䎵䳶DŽ⭡Ҿ䘉а⛩ˈӗ⭏


Ҷࠐњ䰞仈DŽ俆‫ྲˈݸ‬᷌ᆳⲴ‫ٷ‬䇮অ⤜Ӿ亶ฏ⨶䇪ѝ⍮⭏ˈ䛓Ѹ Prolog-EBG ѝ䇝㓳ᮠᦞᴹӰ
Ѹ֌⭘˛ㆄṸ൘Ҿˈ䇝㓳ṧֻ֯ Prolog-EBG ‫⌘ޣ‬Ҿ⭏ᡀ㿴ࡉԕ㾶ⴆᇎ䱵ࠪ⧠ⲴṧֻⲴ࠶ᐳDŽ
ֻྲˈ൘৏ᶕⲴлỻֻᆀѝˈᡰᴹਟ㜭Ⲵᶑⴞᮠᖸབྷˈ㘼൘䙊ᑨሩᔸѝࠪ⧠Ⲵỻⴈ⣦ᘱਚᱟ䈝
⌅кਟ㜭ࠪ⧠Ⲵỻⴈ⣦ᘱⲴаሿ䜘࠶DŽഐ↔ˈ䙊䗷ਚ‫⌘ޣ‬ᇎ䱵кՊ䙷ࡠⲴ䇝㓳ṧֻˈ∄ቍ䈅᷊
ѮỻⴈⲴᡰᴹਟ㜭ᶑⴞˈ〻ᒿᴤਟ㜭ᗇࡠᴤሿⲴǃᴤ⴨‫Ⲵޣ‬㿴ࡉ䳶DŽ

ӗ⭏ⲴㅜҼњ䰞仈ᱟˈProlog-EBG ᱟ੖㜭ᆖҐࡠањ䎵ࠪ䳀ਜ਼൘亶ฏ⨶䇪ѝⲴ⸕䇶Ⲵ‫ٷ‬
䇮˛ᦒ䀰ѻˈᆳᱟ੖㜭ᆖҐࡠањᇎֻⲴ࠶㊫ˈ䘉њᇎֻн㜭⭘৏࿻Ⲵ亶ฏ⨶䇪䘋㹼࠶㊫˄‫ٷ‬
ᇊᇊ⨶䇱᰾ಘᴹᰐ䲀Ⲵ䇑㇇䍴Ⓚ˅˛нᒨⲴᱟˈᆳн㜭‫ࡠڊ‬DŽྲ᷌ Bƅhˈ䛓Ѹԫօ⭡ h ⏥㮤
Ⲵ࠶㊫ҏሶ⭡ B ⏥㮤DŽ䘉ᱟ੖ᱟ࠶᷀ᆖҐᡆ╄㓾ᆖҐⲴപᴹ㕪䲧˛ᒦ䶎ྲ↔ˈྲлֻᡰ⽪DŽ

ѪҶѮањ╄㓾ᆖҐⲴֻᆀˈަѝᆖҐࡠⲴ‫ٷ‬䇮 h ਟ⏥㮤ࠪ B н㜭⏥㮤Ⲵ㔃䇪ˈᡁԜᗵ享


ࡋᔪањ Bƅ/ h ն DġBƅh Ⲵֻᆀ˄എᗶᔿ 11.2 㔉ࠪⲴ㓖ᶏ˅DŽਟԕ㘳㲁 B वਜ਼䘉ṧⲴᯝ
䀰˖Ā㤕 x ┑䏣ⴞḷᾲᘥˈ䛓Ѹ g(x)ҏ┑䏣DŽāঅ⤜䘉њᯝ䀰н㜭⏥㮤ࠪԫօᇎֻⲴ࠶㊫DŽ❦
㘼ˈаնᡁԜ㿲ሏࡠа↓ֻˈᆳ‫ݱ‬䇨╄㓾⌋ॆࡠަԆᵚ㿱ᇎֻDŽֻྲˈ㘳㲁ᆖҐ PlayTennis Ⲵ
ⴞḷᾲᘥˈᆳ᧿䘠Ҷ Ross ᐼᵋᢃ㖁⨳ⲴᰕᆀDŽ‫⇿ྲٷ‬њᰕᆀਚ㻛᧿䘠Ѫঅњ኎ᙗ Humidityˈ
ᒦф亶ฏ⨶䇪वਜ਼অњᯝ䀰Āྲ᷌ Ross ௌ⅒൘⒯ᓖ˄Humidity˅Ѫ x Ⲵᰕᆀᢃ㖁⨳ˈ䛓ѸԆҏ
ௌ⅒൘⒯ᓖሿҾ x Ⲵᰕᆀᢃ㖁⨳āˈਟ㻛ᖒᔿॆൠ᧿䘠Ѫ˖

(x ) IF((PlayTennis=Yes)ĕ(Humidity=x))

THEN ((PlayTennis=Yes) ĕ(Humidityİx))

⌘᜿↔亶ฏ⨶䇪нՊሩ PlayTennis ⲴᇎֻѝଚӋᱟ↓ֻˈଚӋᱟ䍏ֻ⏥㮤ࠪԫօ㔃䇪DŽ❦


㘼ˈаնᆖҐಘ㿲ሏࡠањ↓ֻѝ Humidity=0.3ˈ亶ฏ⨶䇪䘎਼↔↓ֻа䎧⏥㮤ࡠл䶒Ⲵа㡜
‫ٷ‬䇮 h˖

(PlayTennis=Yes) ĕ(Humidityİ0.30)

ᾲᤜ䎧ᶕˈ↔ֻᆀ᧿䘠Ҷа⿽ᛵᖒަѝ Bƅ/ hˈն BġDƅhDŽ䘉䟼ᆖࡠⲴ‫ٷ‬䇮⏥㮤Ⲵ亴⍻


н㜭㻛অ⤜Ⲵ亶ฏ⨶䇪⏥㮤DŽᵟ䈝Ā⸕䇶ቲ⅑ⲴᆖҐā˄knowledge-level learning˅ᴹᰦ㻛⭘
Ҿ〠䘉⿽㊫රⲴᆖҐˈަѝᆖҐࡠⲴ‫ٷ‬䇮⏥㮤Ⲵ亴⍻䎵ࠪҶ㜭㻛亶ฏ⨶䇪⏥㮤Ⲵ㤳തDŽ⭡ᯝ䀰
䳶ਸ Y ⏥㮤Ⲵᡰᴹ亴⍻Ⲵ䳶ਸᑨ〠Ѫ Y Ⲵ╄㓾䰝व˄deductive closure˅DŽ䘉䟼Ⲵ‫ޣ‬䭞४࡛൘
Ҿˈ⸕䇶ቲ⅑ⲴᆖҐѝ B Ⲵ╄㓾䰝वᱟ Bˇh ╄㓾䰝वⲴⵏᆀ䳶DŽ

⸕䇶ቲ⅑Ⲵ࠶᷀ᆖҐⲴਖањֻᆀᱟˈ㘳㲁а⿽㊫රⲴᯝ䀰ˈ䙊ᑨ〠Ѫ determinationˈᆳ
Ⲵ㓶㢲⹄ウ㿱 Russel˄1989˅ԕ৺ަԆаӋᐕ֌DŽDetermination ᯝ䀰ˈᇎֻⲴḀ኎ᙗᆼ‫ޘ‬ਆߣ
ҾḀӋ⢩ᇊ኎ᙗˈնнᗵᤷ᰾䘉⿽‫׍‬䎆ᙗⲴ⺞࠷ᙗ䍘DŽֻྲˈ㘳㲁ᆖҐањⴞḷᾲᘥĀ䈤㪑㨴
⢉䈝ⲴӪāˈᒦф‫ٷ‬ᇊ亶ฏ⨶䇪Ѫঅњ determination ᯝ䀰ĀḀӪ䈤Ⲵ䈝䀰⭡ԆⲴഭ㉽ߣᇊDŽā
ਚᴹ䘉ᶑ亶ฏ⨶䇪ˈн㜭ཏ⭘ᶕ࠶㊫↓઼ֻ৽ֻDŽ❦㘼ˈྲ᷌ᡁԜ㿲ሏࡠĀJoeˈ23 ኱ˈᐖ᪷
ᆀˈᐤ㾯Ӫˈ䈤㪑㨴⢉䈝āˈ䛓ѸᡁԜቡਟԕ↔↓઼ֻ亶ฏ⨶䇪ѝᗇࡠ˖ĀᡰᴹⲴᐤ㾯Ӫ䜭䈤
㪑㨴⢉䈝āDŽ
䘉Ӌֻᆀ䜭╄⽪Ҷ࠶᷀ᆖҐྲօӗ⭏н㜭⭡亶ฏ⨶䇪অ⤜⏥㮤Ⲵ‫ٷ‬䇮DŽަѝⲴ䗃ࠪ‫ٷ‬䇮 h
䜭┑䏣 DġBƅhˈնн┑䏣 BƅhDŽ൘є⿽ᛵߥлˈᆖҐಘ䜭╄㓾˄deduce˅ࠪањਸ⨶Ⲵ‫ٷ‬
䇮ˈᆳᰒн㜭Ӿ亶ฏ⨶䇪ѝঅ⤜⍮⭏ˈҏн㜭Ӿ䇝㓳ᮠᦞѝঅ⤜⍮⭏DŽ

11.4 ᩒ㍘᧝࡬⸛䇼Ⲻะӄ䀙䠀ⲺᆜҖ

ྲк䘠ᤷࠪⲴˈProlog-EBG ㇇⌅Ⲵᇎ䱵㜭࣋ਇ亶ฏ⨶䇪ᗵ享↓⺞фᆼᮤ䘉а㾱≲ᡰ䲀
ࡦDŽ㜭ཏ┑䏣䘉а㾱≲ⲴᆖҐ䰞仈Ⲵањ䟽㾱㊫࡛Ѫ䙊䗷ᆖҐ֯༽ᵲⲴᩌ㍒〻ᒿ䙏ᓖ࣐ᘛDŽᇎ
䱵кˈᓄ⭘สҾ䀓䟺ⲴᆖҐⲴᴰབྷ㿴⁑Ⲵቍ䈅ᐢ㓿ᔰ࿻䀓ߣᆖҐ᧗ࡦᩌ㍒Ⲵ䰞仈ˈᆳᴹᰦ৸㻛
〠ѪĀ࣐䙏ā˄speedup˅ᆖҐDŽֻྲˈ‫ۿ‬ỻ㊫䘉ṧⲴሩᔸѝˈሩਸ⌅ᩌ㍒᫽֌Ⲵᇊѹԕ৺ᩌ
㍒ⴞḷⲴᇊѹᨀ‫׋‬ҶᆖҐᩌ㍒᧗ࡦ⸕䇶Ⲵањᆼᮤф↓⺞Ⲵ亶ฏ⨶䇪DŽ

ྲօ⺞࠷ൠᇊѹᆖҐᩌ㍒᧗ࡦ䰞仈Ⲵᖒᔿԕ֯⭘สҾ䀓䟺ⲴᆖҐ˛㘳㲁ања㡜ᩌ㍒䰞
仈ˈަѝSѪਟ㜭ᩌ㍒⣦ᘱⲴ䳶ਸˈOѪਸ⌅ᩌ㍒㇇ᆀⲴ䳶ਸˈᆳሶа⿽ᩌ㍒⣦ᘱ䖜ᦒᡀਖа
⿽ᩌ㍒⣦ᘱˈ㘼фGѪ൘SкᇊѹⲴ䉃䇽ˈᆳ㺘⽪ଚ⿽⣦ᘱѪⴞⲴ⣦ᘱDŽ䰞仈а㡜ᱟራ᢮а㌫
ࡇⲴ㇇ᆀˈᆳሶԫ᜿ࡍ࿻⣦ᘱsi䖜ॆѪḀᴰ㓸⣦ᘱsfˈ֯ⴞⲴ䉃䇽Gᗇࡠ┑䏣DŽᇊѹᆖҐ䰞仈ᖒ
ᔿⲴа⿽࣎⌅ᱟ䇙㌫㔏ሩOѝ⇿њ㇇ᆀᆖҐањ࠶・ⲴⴞḷᾲᘥDŽ⺞࠷ൠ䇢ˈሩOѝ⇿њ㇇ᆀ
oˈᆳਟቍ䈅ᆖҐⴞḷᾲᘥĀ㜭⭘Oሬ㠤ⴞⲴ⣦ᘱⲴ⣦ᘱ䳶ਸāDŽᖃ❦ウㄏ䘹ᤙଚањ֌Ѫᖵ
ᆖҐⲴⴞḷ⣦ᘱˈ‫׍‬䎆Ҿᗵ享֯⭘↔ᆖҐࡠⲴ⸕䇶Ⲵ䰞仈≲䀓ಘⲴ޵䜘㔃ᶴˈֻྲˈྲ᷌䰞仈
≲䀓ಘᱟањmeans-ends㿴ࡂ㌫㔏ˈᆳⲴᐕ֌䗷〻ᱟ䙊䗷ᔪ・઼䀓ߣᆀⴞⲴˈ䛓ѸᡁԜᐼᵋᆖ
ҐⲴⴞḷᾲᘥਟԕᱟĀA㊫රⲴᆀⴞⲴᗵ享൘B㊫රⲴᆀⴞⲴѻࡽ䀓ߣⲴ㿴ࡂ⣦ᘱ䳶ਸDŽā

֯⭘สҾ䀓䟺ⲴᆖҐԕ᭩䘋ަᩌ㍒Ⲵањ㌫㔏ᱟProdigy˄Carbonell et al. 1990˅DŽ Prodigy


ᱟањ亶ฏᰐ‫Ⲵޣ‬㿴ࡂ㌫㔏ˈᆳ᧕ਇԕ⣦ᘱオ䰤S઼㇇ᆀ䳶ਸOᇊѹⲴ䰞仈亶ฏDŽ❦ਾᆳ䀓ߣ
䘉ṧᖒᔿⲴ䰞仈˖Āራ᢮ањ㇇ᆀᒿࡇ֯ࡍ࿻⣦ᘱsi䖜ᦒࡠ┑䏣ⴞⲴ䉃䇽GⲴ⣦ᘱDŽā Prodigy
֯⭘ањmeans-ends㿴ࡂಘሶ䰞仈࠶䀓ѪᆀⴞⲴˈ䀓ߣ䘉ӋᆀⴞⲴˈ❦ਾਸᒦ䎧ᶕᡀѪᮤњ䰞
仈Ⲵ䀓DŽ䘉ṧˈ൘ަᩌ㍒䰞仈䀓Ⲵ䗷〻ѝ Prodigy 䟽༽䶒Ѥ䘉ṧⲴ䰞仈˖Āла↕㾱䀓ߣⲴᱟ
ଚњᆀⴞⲴ˛āԕ৺ĀѪ䀓ߣ↔ᆀⴞⲴ㾱⭘ଚњ᫽֌˛DŽā Minton˄1988˅᧿䘠ҶሶสҾ䀓
䟺ⲴᆖҐ䳶ᡀࡠ ProdigyⲴ䗷〻ˈᯩ⌅ᱟᇊѹа㓴䘲ਸҾ䘉⿽нᯝ䙷ࡠⲴ᧗ࡦߣㆆⲴⴞḷᾲ
ᘥDŽֻྲˈањⴞḷᾲᘥᱟĀᆀⴞḷAᗵ享൘ᆀⴞḷBѻࡽ䀓ߣⲴ⣦ᘱ䳶ਸDŽāሩ䘉њⴞḷᾲ
ᘥˈ⭡ProdigyᆖࡠⲴ㿴ࡉ൘ㆰঅⲴ⢙փึਐ䰞仈ѝⲴањֻᆀѪ˖

IF ᖵ䀓ߣⲴᆀⴞḷѻаѪ On(x,y)ˈᒦф

ᖵ䀓ߣⲴᆀⴞḷѻаѪ On(y,z)

THEN ൘ On(x,y)ѻࡽ䀓ߣ On(y,z)

Ѫ⨶䀓↔㿴ࡉˈ޽⅑㘳㲁മ 9-3 ѝ⽪ֻⲴㆰঅⲴඇ⣦⢙փึਐ䰞仈DŽ൘മ⽪Ⲵ䰞仈ѝˈⴞ


Ⲵᱟሶ⢙ඇึਐᡀѪঅ䇽 universalDŽProdigy ሶᢺ↔䰞仈࠶䀓Ѫࠐњ㾱䗮ࡠⲴᆀⴞⲴˈवᤜ
ON(U, N)ˈON(N, I)ㅹDŽ⌘᜿к䶒Ⲵ㿴ࡉ३䝽ᆀⴞⲴ ON(U, N)઼ ON(N, I)ˈᒦфᔪ䇞൘䀓ߣᆀ
䰞仈 ON(U,N)ѻࡽ䀓ߣ ON(N, I)DŽ↔㿴ࡉⲴ⨶⭡˄ԕ৺ Prodigy ⭘ҾᆖҐ↔㿴ࡉⲴ䀓䟺˅൘Ҿ
ྲ᷌ᡁԜԕ䘶ᒿ䀓ߣ䘉єњᆀⴞⲴˈሶՊ䙷ࡠߢケˈӾ㘼ᗵ享᫔⎸ ON(U, N)Ⲵ䀓ԕ䗮ࡠਖа
ᆀⴞⲴ ON(N, I)DŽProdigy ᆖҐ䗷〻俆‫ݸ‬䙷ࡠ䘉ṧањߢケˈ❦ਾ㠚ᡁ䀓䟺ߢケⲴ৏ഐˈᒦࡋ
ᔪањ㊫լҾԕкⲴ㿴ࡉDŽަ᭸᷌൘Ҿ Prodigy ֯⭘‫ޣ‬Ҿਟ㜭ⲴᆀⴞⲴߢケⲴ亶ฏᰐ‫⸕Ⲵޣ‬
䇶ˈԕ৺‫ޣ‬Ҿ⢩ᇊ᫽֌Ⲵ亶ฏ⢩ᇊⲴ⸕䇶˄ྲᵪಘӪਚ㜭а⅑Ѯ䎧ањ⢙ඇ˅ˈԕᆖҐࡠᴹ⭘
Ⲵ亶ฏ⢩ᇊⲴ㿴ࡂ㿴ࡉˈྲк䶒ֻ⽪Ⲵ䛓њ㿴ࡉDŽ

֯⭘สҾ䀓䟺ⲴᆖҐԕ㧧ਆ Prodigy Ⲵ᧗ࡦ⸕䇶ˈᐢ㓿൘н਼Ⲵ䰞仈亶ฏѝֻ⽪DŽवᤜк


䶒ㆰঅⲴ⢙ඇึਐ䰞仈ˈԕ৺ަԆᴤ༽ᵲⲴ䈳ᓖ઼㿴ࡂ䰞仈 DŽMinton˄1988˅ᣕ੺Ҷ 3 њ亶
ฏѝⲴᇎ傼ˈަѝᆖҐࡠⲴ᧗ࡦ㿴ࡉᢺ䰞仈≲䀓Ⲵ᭸⦷ᨀ儈Ҷ 2 ࡠ 4 ‫ؽ‬DŽᴤ䘋а↕ˈ䘉Ӌᆖࡠ
Ⲵ㿴ࡉⲴᙗ㜭൘䘉 3 њ䰞仈ѝо᡻߉㿴ࡉᴹਟ∄ᙗDŽMinton ҏ᧿䘠ҶሩสᵜⲴสҾ䀓䟺ᆖҐⲴ
㤕ᒢᢙኅˈᆳԜᨀ儈ҶᆖҐ᧗ࡦ⸕䇶Ⲵ᭸⦷DŽᯩ⌅वᤜㆰॆᆖҐࡠⲴ㿴ࡉԕ৺৫䲔䛓Ӌ᭦⳺ሿ
Ҿᔰ䬰Ⲵ㿴ࡉDŽ

ਖањ㔃ਸҶḀ⿽ᖒᔿⲴสҾ䀓䟺ᆖҐⲴа㡜䰞仈≲䀓ṶᷦѪ Soar ㌫㔏˄Laird et al.


1986˗Newell 1990˅DŽSoar ᭟ᤱ㤳ത䖳ᇭⲴ䰞仈≲䀓ㆆ⮕ˈवਜ਼Ҷ Prodigy Ⲵ means-ends 㿴ࡂ
ㆆ⮕൘޵DŽ❦㘼ˈ‫ ۿ‬Prodigy аṧˈSoar ѝⲴᆖҐᱟ䙊䗷䀓䟺ᖃࡽⲴ᧗ࡦㆆ⮕ѪӰѸሬ㠤վ
᭸DŽᖃᆳ䙷ࡠањᩌ㍒䘹ᤙˈަѝ⋑ᴹањ⺞ᇊᰐ⯁ⲴㆄṸᰦ˄ྲла↕䈕ᓄ⭘ଚањ᫽֌
ㅖ˅ˈSoar ᙍ㘳䘉њᩌ㍒‫ܥ‬ተˈ֯⭘ྲ⭏ᡀ޽⍻䈅䘉⿽ᕡॆⲴᯩ⌅ᶕߣᇊ↓⺞Ⲵ㹼ࣘᯩੁDŽ⭘
ᶕ䀓ߣ䘉⿽‫ܥ‬ተⲴ᧘⨶ਟ㻛⨶䀓Ѫሩሶᶕᘾṧ䀓ߣ㊫լ‫ܥ‬ተⲴ䀓䟺DŽSoar ֯⭘ਖа⿽н਼Ⲵส
Ҿ䀓䟺ᆖҐ〠Ѫ chunkingˈԕᣭਆࠪਟᓄ⭘⴨਼Ⲵ䀓䟺Ⲵа㡜ᶑԦDŽSoar ᐢ㻛ᓄ⭘ҾཊᮠⲴ䰞
仈亶ฏˈᒦ㻛ᨀ䇞ѪӪ㊫ᆖҐ䗷〻ѝа⿽ᗳ⨶ᆖкਟ㹼Ⲵ⁑ර˄㿱 Newell 1990 ˅DŽ

Prodigy ઼ Soar ╄⽪ҶสҾ䀓䟺ⲴᆖҐᯩ⌅ਟ㻛ᡀ࣏ᓄ⭘Ҿ൘н਼䰞仈亶ฏѝ㧧ਆᩌ㍒᧗


ࡦ⸕䇶DŽ❦㘼ˈབྷཊᮠ੟ਁᔿᩌ㍒〻ᒿӽ❦֯⭘㊫լҾㅜ 1 ㄐ᧿䘠Ⲵᮠ٬䇴ՠ࠭ᮠˈ㘼нᱟ⭡
สҾ䀓䟺ⲴᆖҐ㧧ਆⲴ㿴ࡉDŽ৏ഐᱟӰѸ˛ᇎ䱵кᴹаӋ䟽㾱Ⲵᇎ䐥䰞仈ᓄ⭘Ҷ EBL ᆖҐᩌ
㍒᧗ࡦDŽ俆‫ˈݸ‬൘䇨ཊᛵߥлᗵ享ᆖҐⲴ᧗ࡦ㿴ࡉⲴᮠⴞ䶎ᑨབྷ˄ྲᮠॳњ㿴ࡉ˅DŽᖃ㌫㔏ᆖ
Ґࡠ䎺ᶕ䎺ཊⲴ᧗ࡦ㿴ࡉԕ᭩䘋ᩌ㍒ˈ㾱㣡৫䎺ᶕ䎺བྷⲴᔰ䬰൘⇿↕ѝ३䝽䘉㓴㿴ࡉࡠᖃࡽᩌ
㍒⣦ᘱѝDŽ⌘᜿䘉њ䰞仈ᒦнਚተ䲀ҾสҾ䀓䟺ⲴᆖҐˈᆳ൘⭘໎䮯Ⲵ㿴ࡉ䳶㺘⽪ަᆖࡠ⸕䇶
Ⲵԫ᜿㌫㔏ѝ䜭Պࠪ⧠DŽᴹ᭸Ⲵ३䝽㿴ࡉ㇇⌅ਟ㕃઼䘉а䰞仈ˈնн㜭ᆼ‫⎸ޘ‬䲔ᆳDŽMinton
˄1988˅䇘䇪Ҷ㓿傼ൠՠ䇑⇿њ㿴ࡉⲴ䇑㇇ᔰ䬰઼᭦⳺Ⲵㆆ⮕ˈਚ൘ՠ䇑Ⲵ᭦⳺䎵䗷ՠ䇑Ⲵᔰ
䬰ᰦ᡽ᆖҐ䘉Ӌ㿴ࡉˈᒦ൘ḀӋ㿴ࡉᴹ䍏᭸⭘ᰦࡐ䲔ᆳԜDŽԆ᧿䘠Ҷྲօ֯⭘䘉⿽᭸⭘࠶᷀
˄utility analysis˅ᶕ⺞ᇊଚӋᓄ㻛ᆖҐଚӋ䈕ᘈ䇠ˈᖸབྷൠ໎ᕪҶ Prodigy ѝสҾ䀓䟺ᆖҐⲴ
ᴹ᭸ᙗDŽֻྲˈ൘а㌫ࡇᵪಘӪⲴ⢙ඇึਐ䰞仈ѝˈProdigy 䙷ࡠҶ 328 њᵪՊਟᆖҐањᯠ
㿴ࡉˈնਚ࡙⭘Ҷަѝ 69 њˈᒦфᴰ㓸৫䲔Ҷվ᭸⭘Ⲵ㿴ࡉਾ࢙։ 19 њ㿴ࡉDŽ Tambe et al.
˄1990˅઼ Doorenbos˄1993˅䇘䇪Ҷᘾṧ⺞ᇊ㿴ࡉѝ३䝽ᔰ䬰⢩࡛བྷⲴ㊫රˈᒦ䇘䇪Ҷሶ䘉
Ӌ㿴ࡉ䟽ᯠ㺘⽪Ѫᴤᴹ᭸Ⲵᖒᔿ઼Ոॆ㿴ࡉ३䝽Ⲵ㇇⌅DŽ Doorenbos˄1993˅᧿䘠Ҷ䘉Ӌᯩ⌅
ᘾṧ֯ Soar ൘ањ䰞仈亶ฏѝᴹ᭸३䝽 100,000 ᶑ㿴ࡉˈ㘼нՊሩ⇿⣦ᘱ३䝽㿴ࡉⲴᔰ䬰ᴹབྷ
Ⲵ໎䮯DŽ

ᓄ⭘ EBL ԕᆖҐᩌ㍒᧗ࡦਖањᇎ䐥кⲴ䰞仈൘Ҿˈཊᮠᛵߥлণ֯ሩᐼᵋⲴⴞḷᾲᘥ
ᔪ・䀓䟺ҏᴹ⴨ᖃབྷⲴ䇑㇇䟿DŽֻྲˈ൘ỻ㊫䰞仈ѝᡁԜਟ㜭ᐼᵋᆖҐањⴞḷᾲᘥ˖Ā᫽֌
A ሬ㠤ᴰՈ䀓Ⲵ⣦ᘱDŽāнᒨⲴᱟˈѪ䇱᰾ᡆ䀓䟺ѪӰѸ A ሬ㠤ᴰՈ䀓䴰㾱䀓䟺ަԆⲴ᫽֌Պ
ሬ㠤нྲ A Ⲵ䀓DŽ䘉 а㡜䴰㾱ᩌ ㍒␡ᓖⲴᤷ ᮠ㓗Ⲵ䇑㇇ 䟿DŽChien˄1993 ˅઼ Tadepalli
˄1990˅᧒㍒ҶĀ⎸ᶱāᆖҐ઼Ā໎䟿āᆖҐⲴᯩ⌅ˈަѝ੟ਁᔿ㿴ࡉ㻛⭘Ҿӗ⭏䜘࠶Ⲵǃ䘁
լⲴǃն᱃䇑㇇Ⲵ䀓䟺DŽо䀓䟺ᱟᆼ㖾ⲴᛵߥаṧˈаӋ㿴ࡉ㻛Ӿ䘉Ӌнᆼ㖾Ⲵ䀓䟺ѝᣭਆࠪ
ᶕDŽᖃ❦䘉ӋᆖࡠⲴ㿴ࡉՊ⭡Ҿ䀓䟺Ⲵнᆼᮤᙗ㘼н↓⺞DŽ㌫㔏䙊䗷ⴁ㿶൘ਾ㔝ᛵߥл㿴ࡉⲴ
ᙗ㜭ᶕ༴⨶↔䰞仈DŽྲ᷌㿴ࡉਾᶕࠪ䭉ˈ䛓Ѹ৏࿻Ⲵ䀓䟺㻛໎䟿ൠᆼழԕ㾶ⴆᯠⲴᛵߥˈᒦф
Ӿ↔䀓䟺ѝᣭਆࠪᴤྭⲴ㿴ࡉDŽ

ަԆᴹ䇨ཊ⹄ウᐕ֌᧒㍒ҶสҾ䀓䟺ⲴᆖҐⲴᓄ⭘ԕ᭩䘋สҾᩌ㍒Ⲵ䰞仈≲䀓ಘⲴ᭸⦷
˄ֻྲ Mitchell 1981; Silver 1983; Shavlik 1990; Mahadevan et al.1993; Gervasio & Dejong 1994;
Dejong 1994˅DŽBennett & Dejong ˄1996˅⹄ウҶสҾ䀓䟺ᆖҐ൘ᵪಘӪ㿴ࡂ㌫㔏Ⲵᓄ⭘ˈަ
㌫㔏ѝ᧿䘠ަц⭼઼㹼ѪⲴ亶ฏ⨶䇪ᱟнᆼ㖾ⲴDŽDietterich & Flann ˄1995˅᧒㍒ҶสҾ䀓䟺
ᆖҐ઼໎ᕪᆖҐ˄㿱ㅜ 13 ㄐ˅Ⲵ䳶ᡀDŽMitchell & Thrun˄1993˅᧿䘠ҶሶањสҾ䀓䟺Ⲵ⾎
㓿㖁㔌ᆖҐᯩ⌅˄㿱ㅜ 12 ㄐ䇘䇪Ⲵ EBNN ㇇⌅˅ᓄ⭘ࡠ໎ᕪᆖҐ䰞仈ѝDŽ

11.5 ቅ㔉ૂ㺛‫ݻ‬䈱⢟

ᵜㄐⲴ㾱⛩वᤜ
x 㓟㋩Ⲵᖂ㓣ᆖҐᯩ⌅ራ᢮ањ‫ٷ‬䇮ԕᤏਸ䇝㓳ᮠᦞˈо↔н਼ˈ㓟㋩Ⲵ࠶᷀ᆖҐ
ᯩ⌅ᩌራањ‫ٷ‬䇮ᤏਸᆖҐಘⲴ‫ݸ‬傼⸕䇶ᒦ㾶ⴆ䇝㓳ṧֻDŽӪ㊫㓿ᑨ֯⭘‫ݸ‬傼⸕
䇶ᤷሬᯠ‫ٷ‬䇮ⲴᖒᡀDŽᵜㄐ㘳ḕҶ㓟㋩Ⲵ࠶᷀ᆖҐᯩ⌅DŽлаㄐӻ㓽ᖂ㓣-࠶᷀ᆖ
ҐⲴ㔃ਸDŽ
x สҾ䀓䟺ⲴᆖҐᱟ࠶᷀ᆖҐⲴа⿽ᖒᔿˈަѝᆖҐಘ༴⨶⇿њᯠ䇝㓳ṧֻⲴᯩ⌅
ᱟ˄1˅᤹➗亶ฏ⨶䇪䀓䟺䈕ṧֻѝ㿲ሏࡠⲴⴞḷ٬ˈ˄2˅࠶᷀↔䀓䟺ԕ⺞ᇊ䀓
䟺ᡀ・Ⲵа㡜ᶑԦ˗˄3˅᭩䘋ަ‫ٷ‬䇮ԕਸᒦ䘉Ӌа㡜ᶑԦDŽ
x Prolog-EBG ᱟањสҾ䀓䟺ⲴᆖҐ㇇⌅ˈᆳ֯⭘а䱦 Horn ᆀਕᶕ㺘⽪ަ亶ฏ⨶䇪
઼ᆖࡠⲴ‫ٷ‬䇮DŽ൘ Prolog-EBG ѝˈ䀓䟺ণѪ Prolog 䇱᰾ˈ㘼Ӿ䀓䟺ѝᣭਆⲴ‫ٷ‬䇮
ᱟ↔䇱᰾Ⲵᴰᕡࡽ‫ۿ‬DŽ֌Ѫ㔃᷌ˈ⭡ Prolog-EBG 䗃ࠪⲴ‫ٷ‬䇮Ӿަ亶ฏ⨶䇪ѝ╄㓾
⍮⭏DŽ
x ྲ Prolog-EBG 䘉ṧⲴ࠶᷀ᆖҐᯩ⌅ᔪ・ᴹ⭘Ⲵѝ䰤⢩ᖱ֌Ѫ࠶᷀অ⤜䇝㓳ṧֻⲴ
ањ࢟᭸⭘DŽ䘉⿽⭏ᡀ⢩ᖱⲴ࠶᷀䙄ᖴ㺕‫ݵ‬ҶྲਾੁՐ᫝䘉ṧⲴᖂ㓣ᯩ⌅ѝสҾ
㔏䇑ᯩ⌅Ⲵѝ䰤⢩ᖱ⭏ᡀ˄ྲ䳀㯿অ‫ݳ‬⢩ᖱ˅DŽ
x 㲭❦ Prolog-EBG нՊӗ⭏㜭ᢙኅަ亶ฏ⨶䇪Ⲵ╄㓾䰝वⲴ‫ٷ‬䇮ˈަԆ╄㓾ᆖҐ䗷
〻ᴹ䘉њ㜭࣋DŽֻྲˈањवਜ਼ determination ᯝ䀰˄ྲĀഭ㉽⺞ᇊ䈝䀰ā˅Ⲵ亶
ฏ⨶䇪ਟ㻛⭘Ҿо䇝㓳ᮠᦞа䎧╄㓾᧘⨶䎵ࠪ亶ฏ⨶䇪Ⲵ╄㓾䰝वⲴ‫ٷ‬䇮DŽ
x ਟᓄ⭘↓⺞фᆼᮤⲴ亶ฏ⨶䇪Ⲵа㊫䟽㾱䰞仈Ѫབྷ⣦ᘱオ䰤ᩌ㍒Ⲵ䰞仈DŽྲ
Prodigy ઼ Soar 䘉ṧⲴ㌫㔏ᐢֻ⽪ҶสҾ䀓䟺ⲴᆖҐᯩ⌅Ⲵ᭸⭘ˈᆳԜ㠚ࣘ㧧ਆᴹ
᭸Ⲵᩌ㍒㿴ࡉԕ࣐䙏ਾ㔝Ⲵ䰞仈≲䀓DŽ
x 㲭❦สҾ䀓䟺ⲴᆖҐᯩ⌅ሩӪ㊫ᶕ䈤ᖸᴹ⭘ˈն㓟㋩Ⲵ╄㓾ᇎ⧠˄ྲ Prolog-
EBG˅ᴹа㕪⛩൘Ҿᆳ䗃ࠪⲴ‫ٷ‬䇮Ⲵ↓⺞ᙗਚ൘亶ฏ⨶䇪↓⺞ᰦ᡽㜭‫؍‬䇱DŽ൘л
аㄐˈᡁԜ㘳ḕҶ㔃ਸᖂ㓣઼࠶᷀ᆖҐᯩ⌅Ⲵ䙄ᖴԕӾнᆼ㖾Ⲵ亶ฏ⨶䇪઼ᴹ䲀
䇝㓳ᮠᦞѝᴹ᭸ᆖҐDŽ

࠶᷀ᆖҐᯩ⌅ⲴṩⓀਟ䘭ⓟࡠ Fikes et al.˄1972˅ᰙᵏⲴᐕ֌ˈᆳਟ䙊䗷ሩ ABSTRIPS ѝ


Ⲵ᫽֌ㅖⲴ࠶᷀ᆖҐᆿ᫽֌ㅖ (macro-operator)DŽ䖳䘏аӋⲴᱟ Soloway(1977)Ⲵ⹄ウˈԆ൘ᆖ
Ґѝ֯⭘᰾⺞Ⲵ‫ݸ‬傼⸕䇶DŽ㊫լҾᵜㄐ䇘䇪ⲴสҾ䀓䟺ⲴᆖҐᯩ⌅俆‫⧠ࠪݸ‬Ҿࠐњ 80 ᒤԓᰙ
ᵏ ᔰ ਁ Ⲵ ㌫ 㔏 ˈ व ᤜ DeJong(1981); Mitchell(1981); Winston et al.(1983); ઼ Silver(1983) DŽ
DeJong & Mooney(1986)઼ Mitchell et al.(1986)ᨀ‫׋‬ҶሩสҾᴹ䀓䟺ᆖҐᯩ⌅Ⲵа㡜᧿䘠ˈ䘉Ӌ
ᕅਁҶ 80 ᒤԓᲊᵏሩ䘉њѫ仈Ⲵ⹄ウ✝▞DŽ⭡‫׍‬䟼䈪ᯟབྷᆖᡰ‫Ⲵڊ‬а㌫ࡇสҾ䀓䟺ⲴᆖҐⲴ
⹄ウ⭡ DeJong(1993)᧿䘠ˈަѝवᤜ‫؞‬᭩䀓䟺Ⲵ㔃ᶴӾᗚ⧟Ⲵ઼ѤᰦⲴ䀓䟺ѝ↓⺞⌋ॆDŽᴤཊ
ᴰ䘁Ⲵ⹄ウ⵰䟽ҾᢙኅสҾ䀓䟺Ⲵᯩ⌅ԕ֯⭘нᆼ㖾Ⲵ亶ฏ⨶䇪ˈԕ৺㔃ਸᖂ㓣ᆖҐ઼࠶᷀ᆖ
Ґ˄㿱ㅜ 12 ㄐ˅DŽ‫ޣ‬ҾⴞⲴ઼‫ݸ‬傼⸕䇶൘Ӫ㊫઼ᵪಘᆖҐѝⲴ֌⭘ˈRam & Leake(1995)ᨀ‫׋‬
Ҷањ㔬ਸⲴਉ䘠ˈ㘼䘁ᵏสҾ䀓䟺ⲴᆖҐⲴᾲ㿸㿱 DeJong(1997)DŽ

ᓄ⭘ᑖᴹᆼ㖾亶ฏ⨶䇪Ⲵᴰѕ㚳Ⲵቍ䈅ᱟ൘ᆖҐᩌ㍒᧗ࡦⲴ亶ฏˈᡆĀ࣐䙏āᆖҐDŽ⭡
Laird et al.(1986)ᨀࠪⲴ Soar ㌫㔏઼ Carbonell et al.˄1990˅᧿䘠Ⲵ Prodigy ㌫㔏ᱟ֯⭘สҾ䀓
䟺ⲴᆖҐԕᆖҐ䰞仈≲䀓Ⲵєњᴰᡀ⟏Ⲵ㌫㔏DŽ Rosenbloom & Laird(1986)䇘䇪Ҷ Soar ⲴᆖҐ
ᯩ⌅˄〠Ѫ chunking˅઼ަԆสҾ䀓䟺ᆖҐᯩ⌅ѻ䰤Ⲵ㍗ᇶ㚄㌫DŽᴰ䘁 Dietterich & Flann
˄1995˅᧒㍒Ҷ㔃ਸสҾ䀓䟺ⲴᆖҐ઼໎ᕪᆖҐԕᆖҐᩌ㍒᧗ࡦⲴᯩ⌅DŽ

㲭❦ᡁԜ䘉䟼Ⲵѫ㾱ⴞⲴᱟ⹄ウᵪಘᆖҐ㇇⌅ˈӽ䴰⌘᜿ࡠሩӪ㊫ᆖҐⲴᇎ傼ᙗ⹄ウѪӪ
㊫ᆖҐᱟสҾ䀓䟺䘉а⥌ᜣᨀ‫׋‬Ҷ᭟ᤱDŽֻྲˈAhn et al.˄1987˅઼ Qin et al.˄1992˅ᾲ䘠Ҷ
᭟ᤱӪ㊫ᓄ⭘สҾ䀓䟺ᆖҐ䗷〻䘉а᧘ᜣⲴ䇱ᦞDŽWisniewski & Medin˄1995˅᧿䘠ҶሩӪ㊫
ᆖҐⲴᇎ傼ᙗ⹄ウˈᆳᔪ䇞൘‫ݸ‬傼⸕䇶઼㿲ሏᮠᦞѻ䰤䘋㹼ѠᇼⲴ⴨ӂ֌⭘ԕᖡ૽ᆖҐ䗷〻DŽ
Kotovsky & Baillargeon˄1994˅᧿䘠Ⲵᇎ傼䈤᰾ণ֯ 11 њᴸབྷⲴႤ‫ݯ‬൘ަᆖҐᰦҏᱟสҾަ
‫ݸ‬傼⸕䇶ⲴDŽ

สҾ䀓䟺ⲴᆖҐѝᢗ㹼Ⲵ࠶᷀㊫լҾ Prolog 〻ᒿѝ֯⭘Ⲵࠐ㊫〻ᒿՈॆᯩ⌅ˈ∄ྲ䜘࠶䇴


ՠ˄partial evaluation˅DŽvan Harmelen & Bundy ˄1988˅ᨀ‫׋‬Ҷሩ↔‫ޣ‬㌫Ⲵ䇘䇪DŽ
Ґ仈

11.1 㘳 㲁 ᆖ Ґ 䰞 仈 Ѫ ᆖ Ґ ⴞ ḷ ᾲ ᘥ Ā ት տ ൘ ਼ а ᡯ ቻ ޵ Ⲵ є њ Ӫ ˈ ā 㺘 ⽪ Ѫ 䉃 䇽
HouseMates(x,y)DŽл䶒Ѫ↔ᾲᘥⲴањ↓ֻ˖

HouseMates(Joe, Sue)

Person(Joe) Person(Sue)

Sex(Joe, Male) Sex(Sue, Female)

HairColor(Joe, Black) HairColor(Sue, Brown)

Height(Joe, Short) Height(Sue, Short)

Nationality(Joe, US) Nationality(Sue, US)

Mother(Joe, Mary) Mother(Sue, Mary)

Age(Joe, 8) Age(Sue, 6)

л䶒Ⲵ亶ฏ⨶䇪ᴹࣙҾ㧧ਆ HouseMates ᾲᘥ˖

HouseMates(x, y)ĕInSameFamily(x, y)

HouseMates(x, y) ĕFraternityBrothers(x, y)

InSameFamily(x, y) ĕMarried(x, y)

InSameFamily(x, y) ĕYoungster(x) ġYoungster(y) ġSameMother(x,y)

SameMother(x,y) ĕMother(x,z) ġMother(y,z)

Youngster(x) ĕAget(x,a)ġLessThan(a,10)

ᓄ⭘ Prolog-EBG ㇇⌅ࡠ⌋ॆк䘠ᇎֻⲴԫ࣑ѝˈ֯⭘к䶒Ⲵ亶ฏ⨶䇪DŽ⺞࠷ൠ䇢˖

˄a˅᡻ࣘᢗ㹼 Prolog-EBG ㇇⌅ᓄ⭘Ҿ↔䰞仈ˈҏቡᱟ䈤ˈ߉ࠪሩ↔ᇎֻ⭏ᡀⲴ䀓䟺ˈ߉


ࠪ↔䀓䟺ѝഎᖂⴞḷᾲᘥⲴ㔃᷌ˈԕ৺ᗇࡠⲴ Horn ᆀਕ㿴ࡉDŽ

˄b˅‫ٷ‬ᇊⴞḷᾲᘥѪĀо Joe տ൘а䎧ⲴӪā㘼нᱟĀտ൘а䎧ⲴєњӪDŽā⭘к䶒Ⲵ


⴨਼ⲴᖒᔿॆⲴᯩ⌅߉ࠪⴞḷᾲᘥDŽ‫ٷ‬ᇊ䇝㓳ᇎ઼ֻ亶ฏ⨶䇪оԕࡽ⴨਼ˈProlog-EBG ሩ↔
ᯠⴞḷᾲᘥӗ⭏Ⲵ Horn ᆀਕᱟӰѸ˛

11.2 ྲ 11.3.1 㢲ᤷࠪⲴ, Prolog-EBG ਟᶴ䙐ࠪᒦ䶎ᇎֻⲴᱮᔿ⢩ᖱⲴᴹ⭘Ⲵᯠ⢩ᖱˈնᆳ


Ԝᱟ⭘ᱮᔿ⢩ᖱᇊѹⲴˈᒦфᴹࣙҾ᧿䘠ਸ䘲Ⲵ⌋ॆDŽ䘉Ӌ⢩ᖱⲴ᧘ሬᱟ࠶᷀䇝㓳ṧֻ䀓䟺Ⲵ
ањ࢟᭸ᓄDŽ᧘ሬᴹ⭘⢩ᖱⲴਖаᯩ⌅ᱟሩཊቲ⾎㓿㖁㔌֯⭘৽ੁՐ᫝㇇⌅ˈަѝᯠ⢩ᖱᱟส
Ҿབྷ䟿ṧֻⲴ㔏䇑኎ᙗ⭡䳀㯿অ‫ݳ‬ᆖҐࡠⲴDŽ㜭੖᧘㦀а⿽ᯩ⌅ˈਟԕ㔃ਸ䘉Ӌ࠶᷀Ⲵ઼ᖂ㓣
Ⲵ䙄ᖴᶕ⭏ᡀᯠ⢩ᖱ˛˄⌘᜿˖䘉ᱟањᖵ䀓ߣⲴ⹄ウ䰞仈DŽ˅
ㅢ12ㄖ ᖈ㓩ૂ࠼᷆ᆜҖⲺ㔉ਾ

㓟㋩Ⲵᖂ㓣ᆖҐᯩ⌅䙊䗷൘䇝㓳ṧֻѝራ᢮㓿傼ॆⲴ㿴ᖻᶕᖒᡀа㡜‫ٷ‬䇮DŽ㓟㋩Ⲵ࠶᷀ᯩ
⌅֯⭘‫ݸ‬傼⸕䇶╄㓾᧘ሬа㡜‫ٷ‬䇮DŽᵜㄐ㘳㲁ሶᖂ㓣઼࠶᷀Ⲵᵪࡦ㔃ਸ䎧ᶕⲴᯩ⌅ˈԕ㧧ᗇє
㘵ⲴՈ⛩˖ᴹ‫ݸ‬傼⸕䇶ᰦᴤ儈Ⲵ⌋ॆ㋮ᓖˈ઼‫׍‬䎆䇝㓳ᮠᦞ‫ݻ‬ᴽ‫ݸ‬傼⸕䇶Ⲵн䏣DŽᡰᗇࡠⲴ㔃
ਸⲴᯩ⌅∄㓟㋩Ⲵᖂ㓣ᆖҐᯩ⌅઼㓟㋩Ⲵ࠶᷀ᆖҐᯩ⌅ᙗ㜭䜭㾱儈DŽᵜㄐ㘳㲁Ⲵᖂ㓣-࠶᷀ᆖ
Ґᯩ⌅਼ᰦสҾㅖਧ㺘⽪઼Ӫᐕ⾎㓿㖁㔌㺘⽪DŽ

12.1 ࣞᵰ

൘ࡽࠐㄐᡁԜᐢ㓿㿱ࡠҶє⿽㊫රⲴᵪಘᆖҐ˖ᖂ㓣ᆖҐ઼࠶᷀ᆖҐDŽᖂ㓣ᯩ⌅ྲߣㆆṁ
ᖂ㓣઼⾎㓿㖁㔌৽ੁՐ᫝ㅹˈᆳራ᢮ᤏਸ䇝㓳ᮠᦞⲴа㡜‫ٷ‬䇮DŽ࠶᷀Ⲵᯩ⌅ྲ Prolog-EBGˈ
ᆳራ᢮ᤏਸ‫ݸ‬傼⸕䇶Ⲵа㡜‫ٷ‬䇮ˈ਼ᰦ֯ᆳ㾶ⴆ䇝㓳ᮠᦞDŽ䘉є⿽ᆖҐ㤳රᡰสҾⲴሩᆖҐࡠ
Ⲵ‫ٷ‬䇮Ⲵ䇪䇱ᯩ⌅ᴹṩᵜⲴн਼ˈഐ↔ˈՈ㕪⛩ӂѪ㺕‫ݵ‬DŽሶᆳԜ㔃ਸ䎧ᶕᴹਟ㜭ᗇࡠᴤᕪᴹ
࣋ⲴᆖҐᯩ⌅DŽ

㓟㋩Ⲵ࠶᷀ᆖҐᯩ⌅Ո⛩൘Ҿˈਟ⭘‫ݸ‬傼⸕䇶Ӿ䖳ቁⲴᮠᦞѝᴤ㋮⺞ൠ⌋ॆԕᕅሬᆖҐˈ
❦㘼ᖃ‫ݸ‬傼⸕䇶н↓⺞ᡆн䏣ᰦˈ䘉аᯩ⌅ਟ㜭Պ䘋‫↗ޕ‬䙄DŽ㓟㋩Ⲵᖂ㓣ᯩ⌅ާᴹⲴՈ⛩ᱟн
䴰㾱ᱮᔿⲴ‫ݸ‬傼⸕䇶ˈᒦфѫ㾱สҾ䇝㓳ᮠᦞᆖҐࡠ㿴ᖻDŽ❦㘼ˈ㤕䇝㓳ᮠᦞн䏣ᰦᆳ㜭Պཡ
䍕ˈᒦфՊ㻛ަѝ䳀ᔿⲴᖂ㓣‫ٿ‬㖞ᡰ䈟ሬˈ㘼ᖂ㓣‫ٿ‬㖞ᱟӾ㿲ሏᮠᦞѝ⌋ॆᡰᗵ䴰ⲴDŽ㺘 12-1
ᾲ䘠Ҷє㘵Ⲵӂ㺕ⲴՈ⛩઼㕪䲧DŽᵜㄐ㘳㲁Ⲵ䰞仈ᱟᘾṧሶҼ㘵㔃ਸᡀањঅ⤜Ⲵ㇇⌅ˈԕ㧧
ᗇᆳԜ਴㠚ⲴՈ⛩DŽ

ᖂ㓣઼࠶᷀ᆖҐᯩ⌅ѻ䰤Ⲵн਼ਟӾᆳԜሩᆖҐࡠⲴ‫ٷ‬䇮䘋㹼Ⲵ䇪䇱˄justification˅Ⲵᙗ
䍘ѝⴻࠪDŽ⭡㓟㋩Ⲵ࠶᷀ᆖҐ˄ྲ Prolog-EBG˅䗃ࠪⲴ‫ٷ‬䇮ᢗ㹼Ⲵᱟ䙫䗁˄logical˅䇪䇱˖䗃
ࠪⲴ‫ٷ‬䇮Ӿ亶ฏ⨶䇪઼䇝㓳ᮠᦞѝ╄㓾⍮⭏DŽሩ㓟㋩Ⲵᖂ㓣ᆖҐᯩ⌅˄ྲ৽ੁՐ᫝˅䗃ࠪⲴ‫ٷ‬
䇮ᢗ㹼Ⲵᱟ㔏䇑䇪䇱˖䗃ࠪⲴ‫ٷ‬䇮Ӿ㔏䇑䇪ᦞѝ⍮⭏ˈᆳ䈤᰾䇝㓳ṧᵜ䏣ཏབྷӾ㘼ਟ㜭ԓ㺘ṧ
ֻⲴส߶࠶ᐳDŽᖂ㓣Ⲵ㔏䇑䇪䇱൘ㅜ 7 ㄐ䇘䇪Ⲵ PAC ᆖҐѝᐢ㻛␵Რൠ䱀᰾DŽ

ᰒ❦࠶᷀Ⲵᯩ⌅ᨀࠪ䙫䗁䇪䇱Ⲵ‫ٷ‬䇮ˈ㘼ᖂ㓣ᯩ⌅ᨀ‫׋‬㔏䇑䇪䇱Ⲵ‫ٷ‬䇮ˈᖸᇩ᱃ⴻࠪѪӰ
Ѹਟԕሶє㘵㔃ਸ䎧ᶕDŽ䙫䗁Ⲵ䇪䇱Ⲵᕪᓖਚ⴨ᖃҾᆳԜᡰสҾⲴ‫ٷ‬ᇊᡆ‫ݸ‬傼⸕䇶DŽྲ᷌‫ݸ‬傼
⸕䇶н↓⺞ᡆнਟᗇˈ䙫䗁䇪䇱ᱟнਟؑⲴфᰐ࣋ⲴDŽ㔏䇑䇪䇱Ⲵᕪᓖ‫׍‬䎆ҾᆳԜสҾⲴᮠᦞ
઼㔏䇑‫ٷ‬ᇊDŽᖃส߶࠶ᐳнਟؑᡆᮠᦞ〰㕪ᰦˈ㔏䇑䇪䇱ҏᱟнਟؑфᰐ࣋ⲴDŽㆰ㘼䀰ѻˈє
⿽ᯩ⌅䪸ሩн਼Ⲵ㊫රⲴ䰞仈ᰦ᡽ᴹ᭸DŽ䙊䗷є㘵Ⲵ㔃ਸˈᴹᵋᔰਁࠪᴤ䙊⭘ⲴᆖҐᯩ⌅ˈਟ
ԕ㾶ⴆ䖳ᒯⲴᆖҐԫ࣑DŽ

㺘 12-1 㓟㋩Ⲵ࠶᷀ᆖҐ઼㓟㋩ᖂ㓣ᆖҐⲴ∄䖳

ᖂ㓣ᆖҐ ࠶᷀ᆖҐ
ⴞḷ ᤏਸᮠᦞⲴ‫ٷ‬䇮 ᤏਸ亶ฏ⨶䇪Ⲵ‫ٷ‬䇮
䇪䇱 㔏䇑᧘⨶ ╄㓾᧘⨶
Ո⛩ 䴰㾱ᖸቁ‫ݸ‬傼⸕䇶 Ӿ〰㕪ⲴᮠᦞѝᆖҐ
㕪䲧 〰㕪Ⲵᮠᦞˈн↓⺞Ⲵ‫ٿ‬㖞 нᆼ㖾Ⲵ亶ฏ⨶䇪

插图——原书页码:336
Inductive learning: ᖂ㓣ᆖҐ
Plentiful data: ѠᇼⲴᮠᦞ
No prior knowledge:ᰐ‫ݸ‬傼⸕䇶
Analytical learning: ࠶᷀ᆖҐ
Perfect prior knowledge:ᆼ㖾Ⲵ‫ݸ‬傼⸕䇶
Scarce data: 〰㕪Ⲵᮠᦞ

മ 12-1 ᆖҐԫ࣑Ⲵ࠶ᐳ㤳തDŽ

൘ᴰᐖㄟˈ⋑ᴹਟ⭘Ⲵ‫ݸ‬傼⸕䇶ˈഐ↔䴰㾱㓟㋩Ⲵᖂ㓣ᆖҐᯩ⌅ԕ৺䖳儈Ⲵṧᵜ༽ᵲᓖDŽ൘ᴰਣ
ㄟˈᴹᆼ㖾Ⲵ亶ฏ⨶䇪ˈਟԕ֯⭘ྲ Prolog-EBG 䘉ṧⲴ㓟㋩࠶᷀ᯩ⌅DŽᴤཊⲴᇎ䱵䰞仈սҾ䘉єњᶱ
ㄟѻ䰤DŽ

മ 12-1 ᾲ䘠ҶᆖҐ䰞仈Ⲵ࠶ᐳ㤳തˈᆳ䲿⵰ਟ㧧ᗇⲴ‫ݸ‬傼⸕䇶઼䇝㓳ᮠᦞн਼㘼ਈॆDŽ
൘ањᶱㄟˈᴹབྷ䟿Ⲵ䇝㓳ᮠᦞˈն⋑ᴹ‫ݸ‬傼⸕䇶DŽ൘ਖаᶱㄟˈᴹᖸᕪⲴ‫ݸ‬傼⸕䇶ˈն䇝㓳
ᮠᦞᖸቁDŽཊᮠᇎ䱵ᆖҐ䰞仈սҾ䘉єњᶱㄟѻ䰤DŽֻྲˈ࠶᷀५⯇䇠ᖅⲴᮠᦞᓃԕᆖҐĀ⭘
⋫⯇᡻⇥ x ∄⋫⯇᡻⇥ y ᴤᴹ᭸Ⲵ⯵⯷āˈ䙊ᑨਟԕᔰ࿻Ҿ䘁լⲴ‫ݸ‬傼⸕䇶˄ྲ⯮⯵ѝ޵൘Ⲵ
ഐ᷌ᵪࡦⲴᇊᙗ⁑ර˅ˈ∄ྲ䇔ᇊᛓ㘵Ⲵփ⑙∄ԆⲴဃ਽ᴤ⴨‫ޣ‬DŽ㊫լൠˈ൘࠶᷀ањ㛑⾘ᐲ
൪ᮠᦞᓃԕᆖҐⴞḷᾲᘥĀ㛑⾘٬൘ਾ 10 њᴸՊ㘫⮚Ⲵ‫ޜ‬ਨāѝˈྲ᷌ᐢᴹҶ㓿⍾ᆖⲴབྷᾲ
⸕䇶ˈਟԕᨀࠪ‫ޜ‬ਨⲴᙫ࡙⏖∄‫ޜ‬ਨḷᘇⲴ仌㢢ᴤ⴨‫ޣ‬DŽ൘䘉є⿽䰞仈ѝˈᡁԜⲴ‫ݸ‬傼⸕䇶ᱟ
нᆼᮤⲴˈնᱮ❦ˈᆳᴹࣙҾ४࠶⴨‫઼ޣ‬н⴨‫Ⲵޣ‬⢩ᖱDŽ

ᵜㄐ㘳㲁Ⲵ䰞仈ᱟ˖ĀᡁԜਟԕ䇮䇑ࠪᘾṧⲴ㇇⌅ˈ֯⭘䘁լⲴ‫ݸ‬傼⸕䇶㔃ਸਟ⭘ᮠᦞᶕ
ᖒᡀа㡜‫ٷ‬䇮˛ā⌘᜿ˈণ֯൘֯⭘㓟㋩Ⲵᖂ㓣ᆖҐ㇇⌅ᰦˈӽᴹᵪՊสҾ⢩ᇊᆖҐԫ࣑Ⲵ‫ݸ‬
傼⸕䇶ᶕ䘹ᤙ䇮䇑ᯩṸDŽֻྲˈᖃᓄ⭘৽ੁՐ᫝ᶕ䀓ߣ䈝丣䇶࡛䘉ṧⲴ䰞仈ᰦˈ䇮䇑㘵ᗵ享䘹
ᤙ䗃‫઼ޕ‬䗃ࠪᮠᦞⲴ㕆⸱ᯩᔿǃ൘ởᓖл䱽ѝ㻛ᴰሿॆⲴ䈟ᐞ࠭ᮠǃ䳀㯿অ‫Ⲵݳ‬ᮠ䟿ǃ㖁㔌Ⲵ
ᤃᢁ㔃ᶴǃᆖҐ䙏⦷઼ߢ䟿ㅹDŽ൘‫ڊ‬䘉Ӌ䘹ᤙᰦˈ䇮䇑㘵ਟԕሶ亶ฏ⢩ᇊⲴ⸕䇶፼‫ࡠޕ‬ᆖҐ㇇
⌅ѝDŽ❦㘼㔃᷌ӽ❦ᱟ㓟㋩Ⲵᖂ㓣㇇⌅৽ੁՐ᫝Ⲵањᇎ⧠ˈ⭡䇮䇑㘵⢩↺ॆਾ䪸ሩ䈝丣䇶࡛
ԫ࣑DŽᡁԜⲴᝏ‫ޤ‬䏓Ⲵн൘Ҿ↔ˈ㘼൘Ҿањ㌫㔏㜭ሶ‫ݸ‬傼⸕䇶֌ѪᱮᔿⲴ䗃‫ޕ‬㔉ᆖҐಘˈ䇝
㓳ᮠᦞҏ਼ṧ֌Ѫᱮᔿ䗃‫ޕ‬DŽ䘉ṧᆳԜӽѪ䙊⭘Ⲵ㇇⌅ˈն࡙⭘Ҷ亶ฏ⢩ᇊⲴ⸕䇶DŽㆰ㾱ൠᾲ
ᤜалˈᡁԜᝏ‫ޤ‬䏓Ⲵᱟ֯⭘ᱮᔿ䗃‫Ⲵޕ‬亶ฏ⴨‫⸕ޣ‬䇶Ⲵ亶ฏᰐ‫ޣ‬㇇⌅DŽ

ሩҾ㔃ਸҶᖂ㓣઼࠶᷀ᆖҐⲴн਼ᯩ⌅ˈᓄ֯⭘ӰѸṧⲴ߶ࡉᶕ∄䖳ᆳԜ઒˛⭡ҾᆖҐಘ
а㡜н㜭亴‫⸕ݸ‬䚃亶ฏ⨶䇪઼䇝㓳ᮠᦞⲴ䍘䟿DŽᡁԜᝏ‫ޤ‬䏓Ⲵᱟ㜭ሩമ 12-1 ᮤњ䰞仈㌫ࡇ䜭
ਟ᫽֌Ⲵа㡜ᯩ⌅DŽ䘉ṧⲴᆖҐᯩ⌅ᓄާᴹԕлⲴ⢩↺኎ᙗ˖
x ྲ᷌⋑ᴹ亶ฏ⨶䇪ˈᆳ㠣ቁ㜭‫ۿ‬㓟㋩Ⲵᖂ㓣ᯩ⌅аṧᴹ᭸ᆖҐDŽ
x ྲ᷌ᴹᆼ㖾Ⲵ亶ฏ⨶䇪ˈᆳ㠣ቁ㜭‫ۿ‬㓟㋩Ⲵ࠶᷀ᯩ⌅ṧᴹ᭸ᆖҐDŽ
x ྲ᷌亶ฏ⨶䇪઼䇝㓳ᮠᦞ䜭нᆼ㖾ˈᆳᓄ㜭㔃ਸє㘵Ⲵ䮯༴ˈ∄অ㓟Ⲵᖂ㓣ᡆ࠶
᷀ᯩ⌅Ⲵᙗ㜭䜭㾱ྭDŽ
x ᆳᓄ㜭༴⨶䇝㓳ᮠᦞѝᵚ⸕〻ᓖⲴᐞ䭉DŽ
x ᆳᓄ㜭༴⨶亶ฏ⨶䇪ѝᵚ⸕〻ᓖⲴᐞ䭉DŽ

⌘᜿䘉䟼ࡇࠪⲴᵏᵋⴞḷᖸ䳮䗮ࡠDŽֻྲˈ༴⨶䇝㓳ᮠᦞѝⲴᐞ䭉ˈণ֯൘สҾ㔏䇑Ⲵᖂ
㓣ᯩ⌅ѝˈྲ᷌⋑ᴹḀӋ‫ݸ‬傼⸕䇶઼ሩᐞ䭉࠶ᐳⲴ‫ٷ‬ᇊˈ䘉ӽᱟ٬ᗇ⹄ウⲴ䰞仈DŽ㔃ਸᖂ㓣઼
࠶᷀ᆖҐⲴᯩ⌅ᱟᖃࡽ⍫䏳Ⲵ⹄ウ亶ฏDŽ㲭❦к䶒ࡇࠪⲴᱟᡁԜᐼᵋ㇇⌅㜭䗮ࡠⲴ㖾ྭᙗ䍘ˈ
ⴞࡽ⋑ᴹ㇇⌅㜭ԕᆼ‫ޘ‬а㡜ॆⲴᯩᔿ┑䏣ᡰᴹ䘉Ӌ㓖ᶏDŽ

ла㢲ሩ㔃ਸᖂ㓣-࠶᷀ᆖҐⲴ䰞仈֌ࠪҶᴤ䈖㓶Ⲵ䇘䇪DŽਾ䶒ࠐ㢲᧿䘠Ҷ 3 ⿽н਼Ⲵ䙄
ᖴˈ㔃ਸ䘁լⲴ‫ݸ‬傼⸕䇶઼ਟ⭘ᮠᦞᶕᤷሬᆖҐಘᩌ㍒ਸ䘲Ⲵ‫ٷ‬䇮DŽ⇿⿽䙄ᖴ䜭ᐢ൘ཊњ䰞仈
亶ฏѝᱮ⽪ࠪᴹ䎵ࠪ㓟ᖂ㓣ᯩ⌅Ⲵᙗ㜭DŽѪᯩ‫∄ׯ‬䖳ˈᡁԜ֯⭘਼аֻᆀᶕ䈤᰾ 3 ⿽䙄ᖴDŽ

12.2 ᆜҖⲺᖈ㓩-࠼᷆䙊ᖺ

12.2.1 ᆜҖ䰤从

ᾲ㘼䀰ѻˈᵜㄐ㘳㲁ⲴᆖҐ䰞仈Ѫ˖

ᐢ⸕˖
x ањ䇝㓳ṧֻ䳶ਸ Dˈਟ㜭वਜ਼ᐞ䭉
x ањ亶ฏ⨶䇪 Bˈਟ㜭वਜ਼ᐞ䭉
x ‫ى‬䘹‫ٷ‬䇮Ⲵオ䰤 H

≲䀓˖
x ањᴰྭൠᤏਸ䇝㓳ṧ઼ֻ亶ฏ⨶䇪Ⲵ‫ٷ‬䇮

Āᴰྭൠᤏਸ䇝㓳ṧ઼ֻ亶ฏ⨶䇪ā䘉ਕ䈍⺞࠷ਜ਼ѹᱟӰѸ˛ᡆ㘵䈤ˈᱟ੖Պ䘹ᤙањᤏ
ਸᮠᦞ〻ᓖ䖳ྭ㘼ᤏਸ⨶䇪䖳ᐞⲴ‫ٷ‬䇮ˈᡆ৽ѻ˛ѪҶᴤ㋮⺞䎧㿱ˈ䴰㾱ᇊѹሩᓄᮠᦞ઼ሩᓄ
Ҿ亶ฏ⨶䇪Ⲵ‫ٷ‬䇮䭉䈟⦷ᓖ䟿ˈ❦ਾ⭘䘉Ӌ䭉䈟⦷ᶕ㺘⽪䘉њ䰞仈DŽഎᗶㅜ 5 ㄐѝerrorD(h)ᇊ
ѹѪDѝ㻛h䈟࠶㊫Ⲵṧֻᡰঐ∄ֻDŽਟᇊѹh‫ޣ‬Ҿ亶ฏ⨶䇪BⲴ䭉䈟⦷errorB(h)ѪˈhоB൘࠶㊫
ањ䲿ᵪᣭਆᇎֻᰦна㠤Ⲵᾲ⦷DŽ᧕лᶕቡਟቍ䈅⭘䘉Ӌ䭉䈟⦷Ⲵᖒᔿ࡫⭫ᡰᐼᵋⲴ䗃ࠪ‫ٷ‬
䇮DŽֻྲˈᡁԜਟԕ㾱≲‫ٷ‬䇮֯к䘠䭉䈟⦷ⲴḀ⿽㔬ਸᓖ䟿ᴰሿॆˈྲ˖

arg min k D errorD (h)  k B errorB (h)


hH

㲭❦㋇ⴻ䎧ᶕ䘉ᖸਸ⨶ˈն䘈н␵ᾊᘾṧ⺞ᇊkD઼kBⲴ٬ˈԕᤷᇊᤏਸᮠᦞ઼ᤏਸ⨶䇪є
㘵Ⲵ⴨ሩ䟽㾱〻ᓖDŽྲ᷌ᴹ䶎ᑨᐞⲴ⨶䇪ˈতᴹབྷ䟿ਟ䶐ᮠᦞˈᴰྭ֯errorD(h)Ⲵᵳ٬ᴤབྷDŽ
ྲ᷌ᴹᖸᕪⲴ⨶䇪ˈ㘼ᮠᦞṧᵜᖸሿфᆈ൘བྷ䟿ಚ༠ˈᢺerrorB(h)Ⲵᵳ٬໎བྷՊᗇࡠᴰྭⲴ㔃
᷌DŽᖃ❦ྲ᷌ᆖҐಘ亴‫ݸ‬н⸕䚃亶ฏ⨶䇪઼䇝㓳ᮠᦞⲴ䍘䟿ˈᆳቡн␵ᾊ䈕ᘾṧѪ䘉є䜘࠶䭉
䈟⦷࣐ᵳDŽ

ᘾṧ⺞ᇊ‫ݸ‬傼⸕䇶઼ᮠᦞᵳ٬䘉а䰞仈ˈਖа⿽䀓ߣᯩ⌅ᱟ֯⭘䍍ਦᯟⲴ㿲⛩ᶕ㘳㲁DŽഎ
ᗶалㅜ 6 ㄐˈ䍍ਦᯟᇊᖻ᧿䘠Ҷᘾṧ䇑㇇㔉ᇊ䇝㓳ᮠᦞ D ᰦ‫ٷ‬䇮 h Ⲵਾ傼ᾲ⦷ P(h|D)DŽ⺞࠷
ൠ䇢ˈ䍍ਦᯟᇊᖻ䇑㇇↔ਾ傼ᾲ⦷ᱟสҾ㿲ሏࡠⲴᮠᦞ D ԕ৺‫ݸ‬傼⸕䇶Ⲵˈԕ P(h)ǃP(D)઼
P(D|h)Ⲵᖒᔿ㺘⽪DŽഐ↔ᡁԜਟᢺ P(h)ǃP(D)઼ P(D|h)ⴻ֌ᱟḀ⿽ᖒᔿⲴ㛼Ჟ⸕䇶ᡆ亶ฏ⨶
䇪ˈ㘼фਟᢺ䍍ਦᯟ⨶䇪ⴻᡀа⿽Ѫ亶ฏ⨶䇪࣐ᵳⲴᯩ⌅ˈᆳо㿲ሏࡠⲴᮠᦞ D а䎧ˈ䍻Ҹ h
Ⲵਾ傼ᾲ⦷Ѫ P(h|D)DŽ᤹➗䍍ਦᯟⲴ㿲⛩ˈᡰ䘹ᤙⲴ‫ٷ‬䇮ᓄѪਾ傼ᾲ⦷ѝᴰབྷⲴањˈᒦф䍍
ਦᯟ‫ޜ‬ᔿᨀ‫׋‬ҶѪ↔‫ݸ‬傼⸕䇶઼㿲ሏࡠᮠᦞⲴ䍑⥞࣐ᵳⲴ㢟ྭᯩ⌅DŽнᒨⲴᱟˈ䍍ਦᯟ‫ޜ‬ᔿ䳀
ਜ਼‫ٷ‬ᇊҶᤕᴹ‫ޣ‬Ҿ P(h)ǃP(D)઼ P(D|h)ᾲ⦷࠶ᐳⲴᆼ㖾Ⲵ⸕䇶DŽᖃ䘉Ӌ䟿ਚᱟ䘁լᐢ⸕ᰦˈঅ
⤜䍍ਦᯟ‫ޜ‬ᔿ⋑ᴹ㿴ᇊྲօሶަо㿲ሏᮠᦞ㔃ਸ䎧ᶕDŽ˄൘↔ᛵߥла⿽ᯩ⌅ᱟ‫ٷ‬ᇊᴹ P(h)ˈ
P(D)઼ P(D|h)ѻкⲴ‫ݸ‬傼ᾲ⦷࠶ᐳˈ❦㘼ਾ䇑㇇ਾ傼ᾲ⦷ P(h|D)Ⲵᵏᵋ٬DŽ❦㘼䘉㾱≲ᴹ
P(h)ˈP(D)઼ P(D|h)ѻкⲴ‫ݸ‬傼࠶ᐳᯩ䶒Ⲵ䱴࣐⸕䇶ˈഐ↔ᒦ⋑ᴹⵏ↓䀓ߣ↔䰞仈DŽ˅

ᖃ㘳㲁⢩ᇊ㇇⌅ᰦˈᡁԜՊ޽⅑㘳㲁Āᴰ֣āᤏਸ‫ٷ‬䇮઼ᮠᦞᱟӰѸਜ਼ѹDŽ⧠൘ˈᡁԜਚ
ᱟㆰঅൠ〠ᆖҐ䰞仈ᱟѪҶ֯‫ٷ‬䇮൘ᮠᦞ઼亶ฏ⨶䇪к䭉䈟⦷ⲴḀ⿽㔬ਸᓖ䟿ᴰሿॆDŽ

12.2.2 ‫ٽ‬䇴グ䰪ᩒ㍘

ྲօሶ亶ฏ⨶䇪઼䇝㓳ᮠᦞᴰྭൠ㔃ਸ䎧ᶕˈԕ䲀ࡦਟ᧕ਇ‫ٷ‬䇮Ⲵᩌ㍒˛䘉൘ᵪಘᆖҐѝ
ӽᱟᖵ⹄ウⲴ䰞仈DŽᵜㄐ㘳ሏҶࠐ⿽ᐢᨀࠪⲴᯩ⌅ˈަѝ䇨ཊ㾱ሩᐢ䇘䇪䗷Ⲵᖂ㓣ᯩ⌅˄ྲ৽
ੁՐ᫝ˈFOIL˅䘋㹼ᢙኅDŽ

ѪҶ䀓ਟ㜭䙄ᖴⲴ㤳തˈа⿽࣎⌅ᱟഎࡠࡽ䶒ሩᆖҐⲴⴻ⌅ˈণሶަⴻ֌ᱟа⿽ᩌ㍒ཊњ
ਟ䘹‫ٷ‬䇮オ䰤Ⲵԫ࣑DŽѪҶሶབྷཊᮠᆖҐԫ࣑࡫⭫Ѫᩌ㍒㇇⌅ˈ䴰㾱ᇊѹᖵᩌ㍒Ⲵ‫ٷ‬䇮オ䰤
Hˈᩌ㍒Ⲵᔰ࿻⛩ࡍ࿻‫ٷ‬䇮h0ˈᇊѹঅњᩌ㍒↕Ⲵᩌ㍒㇇ᆀ䳶ਸOˈԕ৺ᤷᇊᩌ㍒ⴞḷⲴⴞⲴ
ࡔᦞGDŽᵜ䰤ѝ᧒㍒Ҷ 3 ⿽ᯩ⌅֯⭘‫ݸ‬傼⸕䇶ᶕ᭩ਈ㓟ᖂ㓣ᯩ⌅ѝᢗ㹼Ⲵᩌ㍒DŽ
x ֯⭘‫ݸ‬傼⸕䇶᧘ሬࠪᩌ㍒䎧↕Ⲵࡍ࿻‫ٷ‬䇮DŽ⭘䘉⿽ᯩ⌅ˈ亶ฏ⨶䇪B㻛⭘Ҿᔪ・а
њоBа㠤Ⲵࡍ࿻‫ٷ‬䇮h0DŽ❦ਾԕ䘉њࡍ࿻‫ٷ‬䇮h0Ѫ䎧⛩ᓄ⭘ḷ߶ᖂ㓣ᯩ⌅DŽֻ
ྲˈл䶒᧿䘠ⲴKBNN㌫㔏ᱟ᤹䘉⿽ᯩ⌅ᆖҐӪᐕ⾎㓿㖁㔌ⲴDŽᆳ֯⭘‫ݸ‬傼⸕䇶ᶕ
䇮䇑ࡍ࿻㖁㔌Ⲵӂ㚄㔃ᶴ઼ᵳ٬ˈ䘉ṧˈ↔ࡍ࿻㖁㔌о㔉ᇊⲴ亶ฏ⨶䇪ᆼ‫ޘ‬а
㠤DŽ❦ਾ↔ࡍ࿻㖁㔌‫ٷ‬䇮֯⭘৽ੁՐ᫝㇇⌅઼䇝㓳ᮠᦞ㻛ᖂ㓣ൠ㋮ॆDŽӾањо
亶ฏ⨶䇪а㠤Ⲵ‫ٷ‬䇮ᔰ࿻ᩌ㍒ˈ֯ᗇᴰ㓸䗃ࠪ‫ٷ‬䇮ᴤᴹਟ㜭ᤏਸ↔⨶䇪DŽ
x ֯⭘‫ݸ‬傼⸕䇶ᶕ᭩ਈ‫ٷ‬䇮オ䰤ᩌ㍒ⲴⴞḷDŽ൘䘉⿽ᯩ⌅ѝˈⴞⲴࡔᦞ G 㻛‫؞‬᭩ˈ
ԕ㾱≲䗃ࠪ‫ٷ‬䇮ᤏਸ䇝㓳ṧֻⲴ਼ᰦҏᤏਸ亶ฏ⨶䇪DŽֻྲˈл䶒᧿䘠Ⲵ EBNN
㌫㔏ԕ䘉⿽ᯩ⌅ᆖҐ⾎㓿㖁㔌DŽ⾎㓿㖁㔌Ⲵᖂ㓣ᆖҐᢗ㹼ởᓖл䱽ᶕ֯㖁㔌൘䇝
㓳ᮠᦞкⲴ䈟ᐞᒣᯩᴰሿॆˈ㘼 EBNN ѝᢗ㹼ởᓖл䱽ᶕՈॆਖањࡔᦞDŽ䘉њ
‫؞‬᭩Ⲵࡔᦞवਜ਼ањ䱴࣐亩ˈᆳ㺑䟿ҶᆖҐࡠⲴ㖁㔌⴨ሩҾ亶ฏ⨶䇪Ⲵ䈟ᐞDŽ
x ֯⭘‫ݸ‬傼⸕䇶᭩ਈਟ⭘Ⲵᩌ㍒↕DŽ൘↔ᯩ⌅ѝˈ亶ฏ⨶䇪‫؞‬᭩Ҷᩌ㍒㇇ᆀ䳶ਸ
ODŽֻྲˈл䶒᧿䘠Ⲵ FOCL ㌫㔏ԕ䘉⿽ᯩ⌅ᆖҐ Horn ᆀਕ䳶DŽᆳสҾᖂ㓣㌫㔏
FOILDŽFOIL ൘ਟ㜭Ⲵ Horn ᆀਕオ䰤кᢗ㹼䍚ႚᩌ㍒ˈ⇿↕䙊䗷࣐‫ޕ‬ањᯠ᮷ᆇ
ᶕ‫↓؞‬ᖃࡽ‫ٷ‬䇮DŽFOCL ൘‫ٷ↓؞‬䇮ѝ֯⭘亶ฏ⨶䇪ᶕᢙኅਟ⭘Ⲵ᮷ᆇ䳶ਸDŽᆳ‫ݱ‬
䇨൘অњᩌ㍒↕ѝ࣐‫ޕ‬ཊњ᮷ᆇˈਚ㾱ᆳԜ㜭⭡亶ฏ⨶䇪‫؍‬䇱ަ↓⺞ᙗDŽԕ䘉⿽
ᯩᔿˈFOCL ൘‫ٷ‬䇮オ䰤ѝ〫ࣘа↕⴨ᖃҾ֯⭘৏ᶕⲴ㇇⌅〫ࣘཊ↕DŽ䘉ӋĀᆿ〫
ࣘā˄macro-moves˅ਟᶱབྷൠ᭩ਈᩌ㍒Ⲵᯩੁˈ䘉ṧᴰ㓸Ⲵоᮠᦞа㠤Ⲵ‫ٷ‬䇮о
ਚ֯⭘ᖂ㓣ᩌ㍒↕ᰦ᢮ࡠⲴ‫ٷ‬䇮н਼DŽ

л䶒ࠐ㢲‫⅑׍‬ӻ㓽Ҷ䘉ࠐ⿽ᯩ⌅DŽ

12.3 ֵ⭞‫ݾ‬僂⸛䇼ᗍࡦࡓခ‫ٽ‬䇴

а⿽֯⭘‫ݸ‬傼⸕䇶Ⲵᯩ⌅ᱟˈሶ‫ٷ‬䇮ࡍ࿻ॆѪᆼ㖾ᤏਸ亶ฏ⨶䇪ˈ❦ਾ᤹➗䴰㾱ᖂ㓣ൠ㋮
ॆ↔ࡍ࿻‫ٷ‬䇮ԕᤏਸ䇝㓳ᮠᦞDŽ䘉⿽ᯩ⌅㻛⭘Ҿ KBANN˄Knowledge-Based Artificial Neural
NetworkˈสҾ⸕䇶ⲴӪᐕ⾎㓿㖁㔌˅㇇⌅ѝDŽ൘ KBANN ѝˈ俆‫ݸ‬ᔪ・Ҷањࡍ࿻Ⲵ㖁㔌DŽ
ሩ⇿њਟ㜭ᇎֻˈ㖁㔌䍻ҸᆳⲴ࠶㊫ㅹҾ亶ฏ⨶䇪䍻ҸⲴ࠶㊫DŽ❦ਾᓄ⭘Ҷ৽ੁՐ᫝㇇⌅ᶕ䈳
ᮤࡍ࿻㖁㔌ˈ֯ަᤏਸ䇝㓳ṧֻDŽ

ᖸᇩ᱃ⴻࠪˈ䈕ᢰᵟⲴࣘᵪ൘Ҿ˖ྲ᷌亶ฏ⨶䇪ᱟ↓⺞Ⲵˈࡍ࿻‫ٷ‬䇮ሶ↓⺞࠶㊫ᡰᴹ䇝㓳
ṧֻˈ㘼ᰐ䴰޽ሩަ‫↓؞‬DŽ❦㘼ˈྲ᷌ࡍ࿻‫ٷ‬䇮н㜭ᆼ㖾ൠ࠶㊫䇝㓳ṧֻˈ䛓Ѹᆳ䴰㾱㻛ᖂ㓣
㋮ॆˈԕ᭩䘋ަ൘䇝㓳ṧֻкⲴᤏਸᓖDŽഎᗶ൘㓟㋩ᖂ㓣Ⲵ৽ੁՐ᫝㇇⌅ѝˈᵳ٬а㡜㻛ࡍ࿻
ॆѪሿⲴ䲿ᵪ٬DŽKBANN 㛼ਾⲴⴤ㿲ਜ਼ѹ൘Ҿˈণ֯亶ฏ⨶䇪ᱟ䘁լ↓⺞Ⲵˈሶ㖁㔌ࡍ࿻ॆ
Ѫᤏਸ亶ฏ⨶䇪ˈ∄ࡍ࿻ॆѪ䲿ᵪᵳ٬ᴹᴤྭⲴ䘁լᔰㄟDŽ䘉ᓄ䈕ՊᗇࡠᴹᴤྭⲴ⌋ॆ㋮ᓖⲴ
ᴰ㓸‫ٷ‬䇮DŽ

䘉 ⿽ ֯ ⭘ 亶 ฏ ⨶ 䇪 ᶕ ࡍ ࿻ ॆ ‫ ٷ‬䇮 Ⲵ 䙄 ᖴ ᐢ 㓿 㻛 䇨 ཊ ⹄ ウ 㘵 ᧒ ㍒ 䗷 DŽ व ᤜ Shavlik &


Towell(1989)ˈTowell & Shavlik(1994), Fu (1989, 1993)઼ Pratt(1993a, 1993b)DŽᡁԜሶ ֯⭘
Shavlik & Towell˄1989˅᧿䘠Ⲵ KBANN ㇇⌅ᶕֻ⽪䘉а䙄ᖴDŽ

12.3.1 KBANN ㇍⌋

KBANN 䘀⭘亶ฏ⨶䇪ᶕࡍ࿻ॆ‫ٷ‬䇮DŽަѝ‫ٷ‬ᇊ亶ฏ⨶䇪⭘а㓴ભ仈ᖒᔿⲴ䶎䙂ᖂⲴ Horn


ᆀਕᶕ㺘⽪DŽભ仈ᖒᔿ Horn ᆀਕ㺘⽪ᆳнवਜ਼ਈ䟿DŽKBANN Ⲵ䗃‫઼ޕ‬䗃ࠪྲл˖

ᐢ⸕˖
x а㓴䇝㓳ṧֻ
x ⭡䶎䙂ᖂભ仈ර Horn ᆀਕ㓴ᡀⲴ亶ฏ⨶䇪

≲䀓˖
x ањᤏਸ䇝㓳ṧֻⲴˈ㻛亶ฏ⨶䇪‫ٿ‬㖞ⲴӪᐕ⾎㓿㖁㔌

㺘 12-2KBANN ㇇⌅

亶ฏ⨶䇪㻛䖜ᦒѪㅹ᭸Ⲵ⾎㓿㖁㔌˄↕僔 1ˉ3˅ˈ❦ਾ⭘৽ੁՐ᫝㇇⌅ᖂ㓣㋮ॆ˄ㅜ 4 ↕˅DŽW


ᑨ䟿Ⲵ٬ਟਆѪ 0.4DŽ

KBANN(Domain_Theory, Training_Examples)
Domain_Theory: 䶎䙂ᖂભ仈ර Horn ᆀਕ䳶ਸ
Training_Examples:ⴞḷ࠭ᮠⲴ<input, output>ሩⲴ䳶ਸ
࠶᷀↕˖ࡋᔪањㅹԧҾ亶ฏ⨶䇪Ⲵࡍ࿻㖁㔌
1. ሩ⇿њᇎֻ኎ᙗࡋᔪањ㖁㔌䗃‫ޕ‬
2. ሩ Domain_Theory Ⲵ⇿њ Horn ᆀਕˈྲлࡋᔪањ㖁㔌অ‫ݳ‬
 䘎᧕↔অ‫Ⲵݳ‬䗃‫↔ࡠޕ‬ᆀਕⲴ‫ݸ‬㹼䇽⍻䈅Ⲵ኎ᙗ
 ሩᆀਕⲴ⇿њ䶎䍏‫ݸ‬㹼䇽ˈ䍻Ҹᵳ٬ W 㔉ሩᓄⲴ sigmoid অ‫ݳ‬䗃‫ޕ‬
 ሩᆀਕⲴ⇿њ䍏‫ݸ‬㹼䇽ˈ䍻Ҹᵳ٬-W 㔉ሩᓄⲴ sigmoid অ‫ݳ‬䗃‫ޕ‬
 䇮㖞↔অ‫Ⲵݳ‬䰸٬w0Ѫ-(n-0.5)WˈަѝnѪᆀਕⲴ䶎䍏‫ݸ‬㹼䇽Ⲵᮠⴞ
3. ൘㖁㔌অ‫ݳ‬ѻ䰤໎࣐䱴࣐Ⲵ䘎᧕ˈ䘎᧕␡ᓖѪ i Ⲵ⇿њ㖁㔌অ‫␡ࡠݳ‬ᓖѪ i+1 Ⲵᡰᴹ㖁㔌অ‫Ⲵݳ‬
䗃‫ޕ‬ቲкDŽ䍻Ҹ䘉Ӌ䱴࣐Ⲵ䘎᧕Ѫ᧕䘁 0 Ⲵ䲿ᵪᵳ٬DŽ
ᖂ㓣↕˖㋮ॆ↔ࡍ࿻㖁㔌
4. ᓄ⭘৽ੁՐ᫝㇇⌅ᶕ䈳ᮤࡍ࿻㖁㔌ᵳ٬ԕᤏਸ Training_Examples

KBANN ㇇⌅वਜ਼єњ䱦⇥ˈ俆‫ݸ‬ᆳࡋᔪањᆼ㖾ᤏਸ亶ฏ⨶䇪ⲴӪᐕ⾎㓿㖁㔌ˈ❦ਾ֯
⭘৽ੁՐ᫝㇇⌅ᶕ㋮ॆࡍ࿻㖁㔌ԕᤏਸ䇝㓳ṧֻDŽ㇇⌅Ⲵ㓶㢲ˈवᤜࡋᔪࡍ࿻㖁㔌Ⲵ㇇⌅൘㺘
12-2 ѝࡇࠪˈᒦሶ൘ 12.3.2 㢲䈤᰾DŽ

㺘 12-3Cup ᆖҐԫ࣑

㺘ѝࡇࠪҶⴞḷᾲᘥ Cup Ⲵа㓴䘁լ亶ฏ⨶䇪઼а㓴䇝㓳ṧֻDŽ

亶ฏ⨶䇪˖
CupĕStable, Liftable, OpenVessel
StableĕBottomIsFlat
LiftableĕGraspable, Light
GraspableĕHasHandle
OpenVesselĕHasConcavity, ConcavityPointsUp

䇝㓳ṧֻ˖
Cups Non-Cups
BottomIsFlat Ĝ Ĝ Ĝ Ĝ Ĝ Ĝ Ĝ Ĝ
ConcavityPointsUp Ĝ Ĝ Ĝ Ĝ Ĝ Ĝ Ĝ
Expensive Ĝ Ĝ Ĝ Ĝ
Fragile Ĝ Ĝ Ĝ Ĝ Ĝ Ĝ
HandleOnTop Ĝ Ĝ
HandleOnSide Ĝ Ĝ Ĝ
HasConcavity Ĝ Ĝ Ĝ Ĝ Ĝ Ĝ Ĝ Ĝ Ĝ
HasHandle Ĝ Ĝ Ĝ Ĝ Ĝ
Light Ĝ Ĝ Ĝ Ĝ Ĝ Ĝ Ĝ Ĝ
MadeOfCeramic Ĝ Ĝ Ĝ Ĝ
MadeOfPaper Ĝ Ĝ
MadeOfStyrofoam Ĝ Ĝ Ĝ Ĝ
12.3.2 жѠ⽰ׁ

Ѫֻ⽪ KBANN Ⲵ᫽֌ˈ㘳㲁㺘 12-3 ࡇࠪⲴањㆰঅⲴᆖҐ䰞仈ˈᆳਆ㠚Ҿ Towell &


Shavlik˄1989˅ᒦ⮕֌᭩ࣘDŽ䘉䟼⇿њᇎֻԓ㺘а⢙⨶ሩ䊑DŽ᧿䘠ҶᆳⲴ⢙⨶ᶀᯉǃᆳⲴ䖫䟽
ㅹㅹDŽԫ࣑ᱟᆖҐᇊѹ൘䘉⢙⨶ሩ䊑кⲴⴞḷᾲᘥ CupDŽ㺘 12-3 ᧿䘠Ҷ Cup ⴞḷᾲᘥⲴ䇝㓳
ṧ઼ֻ亶ฏ⨶䇪DŽ⌘᜿亶ฏ⨶䇪ѝᇊѹ Cup Ѫањ StableǃLiftable ԕ৺ OpenVessel Ⲵሩ䊑DŽ
亶ฏ⨶䇪䘈ᢺ䘉 3 њ኎ᙗᇊѹѪᴤสᵜⲴ኎ᙗˈণ᧿䘠Ҷ↔ᇎֻⲴ৏ᆀⲴǃਟ᫽֌Ⲵ኎ᙗDŽ⌘
᜿亶ฏ⨶䇪ᒦнᱟо䇝㓳ṧֻᆼ‫ޘ‬а㠤ⲴDŽֻྲˈ亶ฏ⨶䇪䭉䈟ൠ࠶㊫ㅜ 2 ઼ㅜ 3 њ䇝㓳ṧֻ
Ѫ৽ֻDŽн䗷ˈ亶ฏ⨶䇪ᖒᡀҶⴞḷᾲᘥⲴᴹ᭸䘁լDŽKBANN ֯⭘亶ฏ⨶䇪઼䇝㓳ṧֻа䎧
ᆖҐⴞḷᾲᘥˈਟԕ∄অ⤜֯⭘ަѝа⿽ᴤ㋮⺞DŽ

൘KBANN㇇⌅Ⲵㅜа䱦⇥˄㇇⌅ѝⲴ 1-3 ↕˅ˈᶴᔪҶањо亶ฏ⨶䇪а㠤Ⲵࡍ࿻㖁


㔌DŽֻྲˈӾCupⲴ亶ฏ⨶䇪ѝᶴᔪⲴ㖁㔌᧿㔈Ҿമ 12-2 ѝDŽа㡜䈤ᶕˈ㖁㔌Ⲵᶴᔪᱟ䙊䗷ሩ
亶ฏ⨶䇪ѝ⇿аHornᆀਕᔪ・ањsigmoidঅ‫ݳ‬DŽKBANN䚥Ӿᜟֻˈsigmoid䗃ࠪ٬བྷҾ 0.5 ᰦ
㻛䀓䟺ѪⵏˈሿҾ 0.5 ࡉѪ‫ٷ‬DŽഐ↔⇿њঅ‫Ⲵݳ‬ᶴᔪᯩ⌅Ѫ˖ᖃሩᓄⲴHornᆀਕᆈ൘ᰦˈঅ‫ݳ‬
Ⲵ䗃ࠪቡབྷҾ 0.5DŽሩ↔HornᆀਕⲴ⇿њ‫ݸ‬㹼䇽ˈቡᔪ・ަሩᓄⲴsigmoidঅ‫֌ݳ‬Ѫ䗃‫ޕ‬DŽ❦ਾ
䇮㖞sigmoidঅ‫Ⲵݳ‬ᵳ٬ˈ֯ަ䇑㇇ᗇࠪަ䗃‫Ⲵޕ‬䙫䗁оDŽ⺞࠷ൠ䇢ˈሩҾ⇿њሩᓄҾ䶎䍏‫ݸ‬
㹼䇽Ⲵ䗃‫ˈޕ‬ᵳ٬㻛䇮㖞ѪḀ↓ᑨ䟿WDŽሩ⇿њሩᓄҾ䍏‫ݸ‬㹼䇽Ⲵ䗃‫ˈޕ‬ᵳ٬䇮Ѫ-WDŽঅ‫Ⲵݳ‬
䰸٬ᵳw0䇮Ѫ-(n-0.5)WˈަѝnѪ䶎䍏‫ݸ‬㹼䇽ⲴᮠⴞDŽᖃঅ‫ݳ‬䗃‫ޕ‬٬Ѫ 1 ᡆ 0 ᰦˈ䘉‫؍‬䇱Ҷᖃ
фӵᖃᡰᴹⲴᆀਕ‫ݸ‬㹼䇽┑䏣ᰦˈ䗃‫࣐Ⲵޕ‬ᵳ઼࣐кw0 Ѫ↓˄㘼ф↔sigmoidⲴ䗃ࠪབྷҾ
0.5˅DŽ⌘᜿ሩҾsigmoidঅ‫ˈݳ‬ㅜҼቲ৺ԕਾⲴቲѝঅ‫ݳ‬䗃‫ޕ‬наᇊѪ 1 ᡆ 0ˈк䶒Ⲵભ仈ᰐ
⌅ᓄ⭘Ҿ↔DŽ❦㘼ྲ᷌ѪW䘹ᤙ䏣ཏབྷⲴ٬ˈ↔KBANN㇇⌅ਟԕሩԫ᜿␡ᓖⲴ㖁㔌䘋㹼亶ฏ
⨶䇪㕆⸱DŽTowell & Shavlik˄1994˅൘ަཊᮠᇎ傼ѝ֯⭘W˙4.0DŽ

⇿њ sigmoid অ‫ݳ‬䗃‫ޕ‬㻛䘎᧕ࡠ䘲ᖃⲴ㖁㔌䗃‫ޕ‬ᡆਖа sigmoid অ‫Ⲵݳ‬䗃ࠪˈԕ৽᱐亶ฏ


⨶䇪ѝሩᓄ኎ᙗⲴ‫׍‬䎆‫ޣ‬㌫മDŽᴰਾа↕ˈ৸䱴࣐Ҷ䇨ཊ䗃‫⇿ࡠޕ‬њ䰸٬অ‫ˈݳ‬ᆳԜⲴᵳ٬䇮
㖞䘁լѪ 0DŽ䘉Ӌ䱴࣐䘎᧕Ⲵ֌⭘ᱟ‫ݱ‬䇨㖁㔌㜭ᖂ㓣ᆖҐࡠⲴ޵ᇩਟ䎵ࠪ亶ฏ⨶䇪ѝᨀࠪⲴ‫׍‬
䎆‫ޣ‬㌫DŽമ 12-2 ѝⲴ㋇ᇎ㓯㺘᰾ᵳ٬Ѫ W Ⲵঅ‫ݳ‬䗃‫ˈޕ‬㘼㓶㓯㺘᰾ࡍ࿻ᵳ٬㓖Ѫ 0 Ⲵ䘎᧕DŽ
ᖸᇩ᱃傼䇱ሩҾ䏣ཏབྷⲴ W ٬ˈ↔㖁㔌䗃ࠪ٬ㅹҾ亶ฏ⨶䇪Ⲵ亴⍻DŽ

插图——原书页码:343

മ 12-2 ањㅹԧҾ亶ฏ⨶䇪Ⲵ⾎㓿㖁㔌

䘉њ㖁㔌൘ KBANN ㇇⌅Ⲵㅜа䱦⇥ࡋᔪࠪᶕˈᆳӗ⭏Ⲵ䗃ࠪ࠶㊫ㅹҾ㔉ᇊⲴ亶ฏ⨶䇪ѝⲴᆀਕ


‫࠶Ⲵڊ‬㊫DŽ㋇㓯㺘⽪ᵳ٬Ѫ W Ⲵ䘎᧕ˈሩᓄ亶ฏ⨶䇪ѝⲴᆀਕ‫ݸ‬㹼䇽DŽ㓶㓯㺘⽪ᵳ٬䘁լѪ 0 Ⲵ䘎
᧕DŽ

KBANN ⲴㅜҼ䱦⇥˄㺘 12-2 ѝ㇇⌅Ⲵㅜ 4 ↕˅֯⭘䇝㓳ṧ઼ֻ৽ੁՐ᫝㇇⌅ᶕ㋮ॆࡍ࿻


㖁㔌ᵳ٬DŽᖃ❦ˈྲ᷌亶ฏ⨶䇪઼䇝㓳ṧֻнवਜ਼ᐞ䭉ˈࡍ࿻Ⲵ㖁㔌ቡᐢ㓿ᤏਸ䇝㓳ᮠᦞҶDŽ
❦㘼൘ Cup ֻᆀѝˈ亶ฏ⨶䇪о䇝㓳ᮠᦞна㠤ˈᡰԕ↔↕僔Պ᭩ਈࡍ࿻㖁㔌Ⲵᵳ٬DŽᗇࡠⲴ
䇝㓳䗷Ⲵ㖁㔌ᱮ⽪൘മ 12-3 ѝˈ㋇ᇎ㓯㺘᰾ᴰབྷⲴ↓ᵳ٬ˈ㋇㲊㓯㺘᰾ᴰབྷ䍏ᵳ٬ˈ㓶㓯㺘
᰾ਟᘭ⮕Ⲵᵳ٬DŽ㲭❦ࡍ࿻㖁㔌䈟࠶㊫Ҷ㺘 12-3 ѝࠐњ䇝㓳ṧֻˈնമ 12-3 ѝ㋮ॆҶⲴ㖁㔌
㜭ᆼ㖾ൠ࠶㊫ᡰᴹ䇝㓳ֻDŽ

ᴹᗵ㾱∄䖳алᴰ㓸ᖂ㓣㋮ॆⲴ㖁㔌ᵳ٬઼亶ฏ⨶䇪ሬࠪⲴࡍ࿻ᵳ٬DŽྲമ 12-3 ᡰ㿱ˈ


൘ᖂ㓣↕ѝਁ⧠Ҷ‫ޘ‬ᯠⲴ‫׍‬䎆‫ޣ‬㌫ˈवᤜ Liftable অ‫ݳ‬ሩ MadeofStyrofoam Ⲵ‫׍‬䎆‫ޣ‬㌫DŽᗵ享⢒
䇠ˈ㲭❦ḷᴹ Liftable Ⲵঅ‫ݳ‬ᴰࡍ⭡ᆳⲴ Horn ᆀਕᇊѹˈնਾᶕ⭡৽ੁՐ᫝‫؞‬᭩Ⲵᵳ٬ᐢ㓿ᆼ
‫ޘ‬᭩ਈҶ↔䳀㯿অ‫Ⲵݳ‬᜿ѹDŽ൘㖁㔌㻛䇝㓳䗷ਾˈ䈕অ‫ݳ‬ਟ㜭ᴹҶоࡍ࿻Ⲵ Liftable 䇠ਧᰐ‫ޣ‬
Ⲵ䶎ᑨн਼Ⲵ᜿ѹDŽ

插图——原书页码:344

മ 12-3 ሩࡍ࿻㖁㔌ᖂ㓣㋮ॆਾⲴ㔃᷌

KBANN ֯⭘䇝㓳ṧֻᶕ‫؞‬᭩Ӿ亶ฏ⨶䇪ѝሬࠪⲴ㖁㔌ᵳ٬DŽ⌘᜿ަѝᯠӗ⭏Ⲵ Liftable ሩ


MadeOfStyrofoam ઼ HandleOnTop Ⲵ‫׍‬䎆ᙗDŽ

12.3.3 䈪᱄

ᾲᤜൠ䇢ˈKBANN ⭘࠶᷀ⲴᯩᔿࡋᔪҶㅹԧҾ㔉ᇊ亶ฏ⨶䇪Ⲵ㖁㔌ˈ❦ਾᖂ㓣ൠ㋮ॆ↔
ࡍ࿻‫ٷ‬䇮ԕᴤྭൠᤏਸ䇝㓳ᮠᦞDŽ൘↔䗷〻ѝˈᆳѪҶ᭩ਈ亶ฏ⨶䇪઼䇝㓳ᮠᦞна㠤Ⲵᛵߥ
㘼‫؞‬᭩㖁㔌ᵳ٬DŽ

о㓟ᖂ㓣Ⲵ৽ੁՐ᫝˄ᆳᔰ࿻Ҿ䲿ᵪⲴᵳ٬˅⴨∄ˈKBANN Ⲵྭ༴൘Ҿˈᆳ൘㔉ᇊ䘁լ
↓⺞亶ฏ⨶䇪ᰦˈ㜭ཏ∄৽ੁՐ᫝ᴹᴤ儈Ⲵ⌋ॆ㋮ᓖˈ⢩࡛ᱟ൘䇝㓳ᮠᦞ〰㕪ᰦDŽ൘ࠐ⿽ᇎ䱵
㌫㔏ѝˈKBANN ઼ަԆࡍ࿻ॆ‫ٷ‬䇮Ⲵ䙄ᖴᐢᱮ⽪ࠪՈҾ㓟ᖂ㓣Ⲵ㌫㔏DŽֻྲˈTowell et al.
˄1990˅᧿䘠Ҷሶ KBANN ᓄ⭘Ҿ࠶ᆀ䚇Ր䰞仈DŽަѝⲴԫ࣑ᱟᆖҐ䇶࡛〠Ѫ◰ਁ४ฏ
˄promoter region˅Ⲵ DNA ⡷ᯝˈᆳᖡ૽สഐⲴ⍫ᙗDŽ൘↔ᇎ傼ѝˈKBANN Ⲵ亶ฏ⨶䇪Ӿа
њ࠶᷀䚇Րᆖᇦ䛓䟼㧧ਆˈ㘼◰ਁ४ฏⲴ䇝㓳ṧֻѝवਜ਼ 53 њ↓઼ֻ 53 њ৽ֻDŽᙗ㜭䇴ՠ֯
⭘ҶĀ⮉а⌅ā˄leave-one-out˅ˈ㌫㔏䘀㹼 106 ⅑DŽ⇿⅑ᗚ⧟ѝ KBANN ⭘ 105 њṧֻ䇝
㓳ˈᒦ൘࢙։Ⲵ 1 њк⍻䈅DŽ䘉 106 ⅑ᇎ傼Ⲵ㔃᷌㻛〟㚊䎧ᶕᨀ‫׋‬ሩⵏᇎ䭉䈟⦷Ⲵՠ䇑DŽ
KBANN 䭉䈟⦷Ѫ 4ˋ106ˈ㘼ḷ߶Ⲵ৽ੁՐ᫝䭉䈟⦷Ѫ 8ˋ106DŽKBANN Ⲵањਈ⿽⭡ Fu
˄1993˅ᇎ⧠ˈᆳᣕ੺൘਼ṧᮠᦞкⲴ䭉䈟⦷Ѫ 2ˋ106DŽഐ↔ˈ‫ݸ‬傼⸕䇶൘䘉Ӌᇎ傼ѝᖸབྷ
〻 ᓖ ൠ ߿ ሿ Ҷ 䭉 䈟 ⦷ DŽ ↔ ᇎ 傼 Ⲵ 䇝 㓳 ᮠ ᦞ ਟ ԕ Ӿ з 㔤 㖁 ൰
http://www.ics.uci.edu/~mlearn/MLReository.html кᗇࡠDŽ

Fu˄1993˅઼ Towell et al.˄1990˅䜭ᣕ੺˖Ӿᴰ㓸䇝㓳䗷Ⲵ㖁㔌ѝᣭਆⲴ Horn ᆀਕˈਟ


ᨀ‫׋‬ањ㜭ᴤྭᤏਸ䇝㓳ᮠᦞⲴ亶ฏ⨶䇪DŽ㲭❦ᴹᰦਟ㜭ӾᆖҐࡠⲴ㖁㔌ᵳ٬᱐ሴഎањ㋮ॆ
Ⲵ Horn ᆀਕ䳶ˈն൘а㡜ᛵᖒл䘉⿽֌⌅ᱟᴹ䰞仈ⲴDŽഐѪḀӋᵳ٬䇮㖞⋑ᴹⴤ᧕ሩᓄⲴ
Horn ᆀਕDŽCraven & Shavlik˄1994˅઼ Craven˄1996˅᧿䘠ҶਖཆⲴᯩ⌅ԕӾᆖҐ䗷Ⲵ㖁㔌
ѝᣭਆㅖਧ㿴ࡉDŽ

Ѫ⨶䀓 KBANN Ⲵᇊѹˈᴹᗵ㾱㘳㲁ަѝⲴ‫ٷ‬䇮ᩌ㍒о㓟ᖂ㓣Ⲵ৽ੁՐ᫝㇇⌅ѝᴹӰѸ४


࡛DŽ䘉є⿽㇇⌅ѝᢗ㹼Ⲵ‫ٷ‬䇮オ䰤ᩌ㍒൘മ 12-4 ѝ⽪᜿DŽྲަѝᱮ⽪Ⲵˈ‫ޣ‬䭞४࡛൘Ҿᢗ㹼
ᵳ٬䈳㢲ᡰสҾⲴࡍ࿻‫ٷ‬䇮DŽ൘ᴹཊњ‫ٷ‬䇮˄ᵳ٬ੁ䟿˅㜭ᤏਸᮠᦞⲴᛵߥл˄䘉⿽ᛵߥ൘䇝
㓳ᮠᦞ〰㕪ᰦᴤਟ㜭ࠪ⧠˅ˈKBANN ᴤᴹਟ㜭᭦ᮋࡠ䘉ṧⲴ‫ٷ‬䇮ˈᆳӾ䇝㓳ᮠᦞѝⲴ⌋ॆо
亶ฏ⨶䇪Ⲵ亴⍻ᴤ⴨լDŽਖаᯩ䶒ˈ৽ੁՐ᫝᭦ᮋࡠⲴ⢩ᇊ‫ٷ‬䇮ᴤਟ㜭ᱟሿᵳ٬Ⲵ‫ٷ‬䇮ˈᆳབྷ
㠤ሩᓄҾ൘䇝㓳ṧֻ䰤ᒣ━ᨂ٬Ⲵ⌋ॆ‫ٿ‬㖞DŽㆰ㾱ൠ䈤ˈKBANN ֯⭘ањ亶ฏ⢩ᇊⲴ⨶䇪ᶕ
‫ٿ‬㖞⌋ॆˈ㘼৽ੁՐ᫝㇇⌅֯⭘ањ亶ฏᰐ‫Ⲵޣ‬䈝⌅‫ٿ‬㖞˄‫ੁٿ‬ҾሿⲴᵳ٬˅DŽ⌘᜿൘↔ᾲ䘠
ѝᡁԜᘭ⮕Ҷᩌ㍒ѝተ䜘ᶱሿ٬Ⲵᖡ૽DŽ

插图——原书页码:346
Hypothesis Space˖ ‫ٷ‬䇮オ䰤
Hypotheses that fit training data equally well˖ԕ਼ṧ〻ᓖᤏਸ䇝㓳ᮠᦞⲴ‫ٷ‬䇮
Initial hypothesis for KBANN˖ KBANN Ⲵࡍ࿻‫ٷ‬䇮
Initial hypothesis for Backpropagation˖ ৽ੁՐ᫝Ⲵࡍ࿻‫ٷ‬䇮

മ 12-4KBANN ѝⲴ‫ٷ‬䇮オ䰤ᩌ㍒

KBANN ࡍ࿻ॆ㖁㔌֯ަᤏਸ亶ฏ⨶䇪ˈ㘼৽ੁՐ᫝ሶ㖁㔌ࡍ࿻ॆѪ䲿ᵪሿᵳ٬DŽ❦ਾᆳԜ֯⭘
⴨਼Ⲵởᓖл䱽㿴ࡉ৽༽㋮ॆᵳ٬DŽᖃ᢮ࡠཊњ㜭ᤏਸ䇝㓳ᮠᦞⲴ‫ٷ‬䇮ᰦ˄ྲ䱤ᖡ४ฏᡰ⽪˅ˈ
KBANN ઼৽ੁՐ᫝ਟ㜭᢮ࡠнаṧⲴ‫ٷ‬䇮ˈഐѪᆳԜⲴ䎧⛩н਼DŽ

KBANN Ⲵተ䲀ᙗѻаѪˈᆳਚ㜭֯⭘ભ仈亶ฏ⨶䇪ˈণᰐਈ䟿Ⲵ Horn ᆀਕ䳶DŽྲ᷌㔉


Ҹᖸн㋮⺞Ⲵ亶ฏ⨶䇪ˈKBANN ҏਟ㜭㻛䈟ሬˈӾ㘼ަ⌋ॆ㋮ᓖਈᗇվҾ৽ੁՐ᫝DŽн䗷ˈ
KBANN ઼⴨‫ޣ‬㇇⌅⺞ᇎ൘㤕ᒢᇎ䱵䰞仈ѝᱮ⽪ࠪᴹࣙҾᆖҐDŽ

KBANN ᱟ㔃ਸ࠶઼᷀ᖂ㓣ᆖҐⲴࡍ࿻ॆ‫ٷ‬䇮䙄ᖴѝⲴа⿽DŽ䘉а䙄ᖴⲴަԆֻᆀवᤜ Fu
˄1993˅˗Gallant(1988)˗Bradshaw et al.˄1989˅˗Yang & Bhargava(1990)˗Lacher et al.
˄1991˅DŽ䘉Ӌ䙄ᖴн਼ѻ༴൘Ҿᔪ・ࡍ࿻‫ٷ‬䇮Ⲵᇎ䱵֯⭘Ⲵᢰᵟǃᵳ٬䈳ᮤⲴ৽ੁՐ᫝Ⲵᓄ
⭘ǃԕ৺Ӿ㋮ॆҶⲴ㖁㔌ѝᣭਆㅖਧ᧿䘠Ⲵᯩ⌅DŽPratt˄1993aˈ1993b˅᧿䘠Ⲵањࡍ࿻ॆ‫ٷ‬
䇮䙄ᖴѝˈ‫ݸ‬傼⸕䇶ᱟ䙊䗷‫ࡽݸ‬ሩ⴨‫ޣ‬ԫ࣑ᆖҐࡠⲴ⾎㓿㖁㔌ᶕᨀ‫Ⲵ׋‬DŽ䇝㓳䍍ਦᯟ㖞ؑ㖁Ⲵ
٬Ⲵᯩ⌅˄ྲ 6.11 㢲ѝ䇘䇪Ⲵ˅ҏਟ㻛ⴻ֌ᱟ⭘‫ݸ‬傼⸕䇶ᶕࡍ࿻ॆ‫ٷ‬䇮DŽ䘉䟼‫ݸ‬傼⸕䇶ሩᓄ
Ҿа㓴ᶑԦ⤜・ᙗ‫ٷ‬ᇊˈᆳ⺞ᇊҶ䍍ਦᯟ㖁Ⲵമ㔃ᶴˈ❦ਾަᶑԦᾲ⦷㺘Ӿ䇝㓳ᮠᦞѝᖂ㓣ᗇ
ࡠDŽ

12.4 ֵ⭞‫ݾ‬僂⸛䇼᭯਎ᩒ㍘ⴤḽ

к䶒Ⲵ䙄ᖴ⭡ањᆼ㖾ᤏਸ亶ฏ⨶䇪Ⲵ‫ٷ‬䇮ᔰ࿻ởᓖл䱽ᩌ㍒ˈ❦ਾ൘䴰㾱ᰦ᭩ਈ↔‫ٷ‬䇮
ԕᴰབྷ〻ᓖൠᤏਸ䇝㓳ᮠᦞDŽ֯⭘‫ݸ‬傼⸕䇶Ⲵਖаᯩ⌅ᱟሶᆳਸᒦࡠởᓖл䱽ѝ䴰ᴰሿॆⲴ䈟
ᐞࡔᦞˈ䘉ṧ㖁㔌享ᤏਸⲴᱟ䇝㓳ᮠᦞ઼亶ฏ⨶䇪Ⲵ㓴ਸ࠭ᮠDŽ⺞࠷ൠ䇢ˈᡁԜ㘳㲁Ⲵ‫ݸ‬傼⸕
䇶Ⲵᖒᔿᱟⴞḷ࠭ᮠⲴḀ⿽ᐢ⸕ⲴሬࠪᔿDŽаӋ㊫රⲴ‫ݸ‬傼⸕䇶ਟԕᖸ㠚❦ൠ⭘↔ᖒᔿ㺘⽪DŽ
ֻྲˈ൘䇝㓳ањ⾎㓿㖁㔌ԕ䇶࡛᡻߉ᆇㅖᰦˈᡁԜਟԕᤷᇊⴞḷ࠭ᮠⲴḀ⿽ሬᮠˈԕ㺘⽪䘉
⿽Ⲵ‫ݸ‬傼⸕䇶˖ĀᆇㅖⲴ⺞䇔⤜・Ҿമ‫Ⲵۿ‬ᗞሿᒣ઼〫᯻䖜DŽā

л䶒᧿䘠Ⲵ TangentProp ㇇⌅䇝㓳⾎㓿㖁㔌ˈ֯ަ਼ᰦᤏਸ䇝㓳٬઼䇝㓳ሬᮠDŽ12.4.4 㢲


䈤᰾Ҷᘾṧ⭘㊫լҾ 12.3 㢲֯⭘Ⲵ Cup ֻᆀѝⲴᯩ⌅Ӿ亶ฏ⨶䇪ѝ㧧ᗇ䘉Ӌ䇝㓳ሬᮠDŽ⺞࠷
ൠ䇢ˈᆳ䇘䇪Ҷ EBNN ㇇⌅ᘾṧᶴ䙐অ⤜ṧֻⲴ䀓䟺ˈԕᣭਆࠪ䇝㓳ሬᮠᶕ‫ ׋‬TangentProp ֯
⭘DŽTangentProp ઼ EBNN ᐢ൘ཊњ亶ฏѝ㻛⽪㤳ࠪᴹՈҾ㓟ᖂ㓣ᯩ⌅Ⲵᙗ㜭ˈवᤜᆇㅖ઼⢙
փ䇶࡛ˈԕ৺ᵪಘӪᝏ⸕઼᧗ࡦԫ࣑ѝDŽ

12.4.1 TangentProp ㇍⌋

TangentProp ˄Simard et al. 1992˅᧕ਇⲴ亶ฏ⸕䇶㻛㺘⽪ѪሩᓄҾަ䗃‫ޕ‬ਈᦒⲴⴞḷ࠭ᮠ


ⲴሬᮠDŽ㘳㲁ањᆖҐԫ࣑ˈवਜ਼ањᇎֻオ䰤X઼ⴞḷ࠭ᮠfDŽ㠣↔ᡁԜᡰ֌Ⲵ‫ٷ‬ᇊѝ⇿њ䇝
㓳ṧֻᖒᔿѪ<xi,f(xi)>ˈᆳ᧿䘠ҶḀᇎֻxi઼ަ䇝㓳٬f(xi)DŽTangentProp㇇⌅䘈‫ٷ‬ᇊᨀ‫׋‬Ҷⴞḷ
࠭ᮠⲴн਼Ⲵ䇝㓳ሬᮠ˄training derivative˅DŽֻྲˈྲ᷌⇿њᇎֻxi᧿䘠Ѫањᇎᮠˈ䛓Ѹ⇿
wf ( x) wf ( x )
њ䇝㓳ṧֻᖒᔿਟ㜭Ѫ ¢ xi , f ( xi ), ² DŽ䘉䟼 㺘⽪ⴞḷ࠭ᮠ൘⛩x=xi кሩxⲴሬ
wx xi wx xi

ᮠDŽ

ѪҶӾⴤ㿹к⨶䀓൘ᆖҐѝнӵᨀ‫׋‬䇝㓳٬ҏᨀ‫׋‬䇝㓳ሬᮠⲴྭ༴ˈ㘳㲁ањㆰঅⲴԫ
࣑ˈ൘മ 12-5 㺘⽪DŽަѝᖵᆖҐⲴⴞḷ࠭ᮠfᱮ⽪Ҿަѝᴰᐖ䗩ⲴമᖒˈᆳสҾᡰᱮ⽪Ⲵ 3 њ
䇝㓳ṧֻ<x1, f(x1)>ˈ<x2, f(x2)>઼<x3, f(x3)>DŽᴹҶ䘉 3 њṧֻˈ৽ੁՐ᫝㇇⌅ਟᵋᗇࡠањᒣ
━࠭ᮠ‫ٷ‬䇮ˈྲѝ䰤മᱮ⽪Ⲵ࠭ᮠgDŽᴰਣ䗩Ⲵമᱮ⽪Ҷᨀ‫׋‬䇝㓳ሬᮠ˄ᡆᯌ⦷˅֌Ѫ⇿њ䇝
wf ( x)
㓳ṧֻⲴ䱴࣐ؑ᚟˄ྲ ¢ x1 , f ( x1 ), ² ˅Ⲵ᭸᷌DŽ䙊䗷ᤏਸ䇝㓳٬f(xi)਼ᰦᤏਸ䘉Ӌሬᮠ
wx x1
wf ( x)
ˈᆖҐಘਟԕᴤྭൠӾ〰⮿䇝㓳ᮠᦞѝ↓⺞⌋ॆDŽᾲᤜൠ䈤ˈवਜ਼䇝㓳ሬᮠⲴ᭸᷌ᱟ
wx xi

ѪҶ‫ݻ‬ᴽ৽ੁՐ᫝ѝⲴ䈝⌅ᖂ㓣‫ٿ‬㖞˄ᆳ‫ྭٿ‬਴⛩䰤Ⲵᒣ━ᨂ٬˅ˈሶަᴯᦒѪᡰᐼᵋⲴሬᮠ
Ⲵᱮᔿ䗃‫ؑޕ‬᚟DŽ㔃᷌‫ٷ‬䇮hᱮ⽪൘ᴰਣ䗩Ⲵമѝˈᆳᨀ‫׋‬Ҷሩⵏᇎⴞḷ࠭ᮠfⲴᴤ㋮⺞ՠ䇑DŽ

插图——原书页码:347

മ 12-5 ⭘ TangentProp ᤏਸ٬઼ሬᮠ

ԔfѪⴞḷ࠭ᮠˈᆳⲴйњṧֻ<x1, f(x1)>ˈ<x2, f(x2)>઼<x3, f(x3)>ᐢ⸕DŽสҾ䘉Ӌ⛩ˈᆖҐಘਟ㜭


⭏ᡀ‫ٷ‬䇮gDŽྲ᷌ሬᮠҏᐢ⸕ˈᆖҐಘਟԕ⌋ॆࡠᴤ㋮⺞ⲴhDŽ
൘к䘠ֻᆀѝˈᡁԜਚ㘳㲁Ҷㆰঅ㊫රⲴⴞḷ࠭ᮠሬᮠDŽᇎ䱵кˈTangentPropਟ᧕ਇሩᓄ
Ҿ䗃‫ޕ‬xⲴ਴⿽ਈᦒⲴ䇝㓳ሬᮠDŽֻྲˈ㘳㲁ᆖҐ䇶࡛᡻߉ᆇㅖⲴԫ࣑DŽ⺞࠷ൠ䇢ˈ‫ٷ‬ᇊ䗃‫ޕ‬x
ሩᓄҾवਜ਼অњ᡻߉ᆇㅖⲴമ‫ˈۿ‬㘼ԫ࣑ᱟ↓⺞࠶㊫↔ᆇㅖDŽ൘↔ԫ࣑ѝˈᡁԜਟ㜭ᐼᵋ੺䇹
ᆖҐಘĀⴞḷ࠭ᮠሩҾമ‫ۿ‬ѝᆇㅖⲴᗞሿ᯻䖜нਇᖡ૽āDŽѪ䗃‫ݸ↔ޕ‬傼⸕䇶㔉ᆖҐಘˈᡁԜ
俆‫ݸ‬ᇊѹањਈᦒs(¢,x)ˈᆳᢺമ‫ۿ‬x᯻䖜¢ᓖDŽ⧠൘ᡁԜਟᢺ᯻䖜нਈᙗⲴᯝ䀰ྲл㺘⽪˖
ሩ⇿њ䇝㓳ᇎֻxi ˈⴞḷ࠭ᮠሩᓄ↔ਈᦒⲴሬᮠѪ 0˄ণ᯻䖜䗃‫ޕ‬മ‫ۿ‬н᭩ਈⴞḷ࠭ᮠⲴ
٬˅DŽᦒ䀰ѻˈᡁԜਟሩ⇿њ䇝㓳ᇎֻxiᯝ䀰л䶒Ⲵ䇝㓳ሬᮠ˖

wf ( s (D , xi ))
0
wD

ަѝfѪⴞḷ࠭ᮠˈ㘼s(¢,xi)Ѫᓄ⭘↔ਈᦒsࡠമ‫ۿ‬xiᗇࡠⲴമ‫ۿ‬DŽ

䘉ṧⲴ䇝㓳ሬᮠ൘ TangentProp ѝᘾṧ㻛⭘Ҿ㓖ᶏ⾎㓿㖁㔌Ⲵᵳ٬˛൘ TangentProp ѝ䘉Ӌ


䇝㓳ሬᮠ㻛ਸᒦࡠởᓖл䱽ѝ享ᴰሿॆⲴ䈟ᐞ࠭ᮠѝˈഎᗶㅜ 4 ㄐѝ৽ੁՐ᫝㇇⌅ᢗ㹼ởᓖл
䱽䈅മ֯䈟ᐞᒣᯩ઼ᴰሿॆ˖

E ¦ ( f ( x )  fˆ ( x ))
i
i i
2

ަѝxiԓ㺘ㅜiњ䇝㓳ᇎֻˈf ԓ㺘ⵏᇎⴞḷ٬ˈ㘼 fˆ ԓ㺘ᆖҐࡠⲴ⾎㓿㖁㔌㺘⽪Ⲵ࠭ᮠDŽ

൘TangentPropѝˈ䈟ᐞ࠭ᮠѝᯠ໎Ҷа亩ԕ᜙㖊䇝㓳ሬᮠ઼ᆖҐࡠⲴ⾎㓿㖁㔌࠭ᮠⲴᇎ䱵
ሬᮠ fˆ ѻ䰤Ⲵ࠶↗DŽа㡜ൠˈTangentPropਟ᧕ਇཊњਈᦒ˄ֻྲˈᡁԜᐼᵋᯝ䀰᯻䖜нਈ
ᙗˈ਼ᰦᯝ䀰ᆇㅖ䇶࡛ѝⲴᒣ〫нਈᙗ˅ˈ⇿њਈᦒᖒᔿᗵ享Ѫsj(¢,x)ˈަѝ¢Ѫ䘎㔝৲ᮠˈ
㘼sj ਟᗞˈ㘼фsj(0,x)=x˄ֻྲሩҾ 0 ᓖⲴ᯻䖜ˈ࠭ᮠণѪᚂㅹ࠭ᮠ˅DŽሩ⇿њ䘉ṧⲴਈᦒ
sj(¢,x)ˈTangentProp㘳㲁ᤷᇊⲴ䇝㓳ሬᮠ઼ᆖҐࡠⲴ⾎㓿㖁㔌Ⲵᇎ䱵ሬᮠ䰤Ⲵ䈟ᐞᒣᯩDŽ‫؞‬᭩
ਾⲴ䈟ᐞ࠭ᮠѪ˖

ª § wf ( s (D , x )) wfˆ ( s (D , x )) ·
2
º
¦i ««( f ( xi )  fˆ ( xi )) 2  P ¦j ¨¨ wD  ¸ » ˄12ˊ1˅
j i j i
E
wD ¸ »
¬ © ¹ D 0¼

ަѝ­Ѫ⭘ᡧᨀ‫Ⲵ׋‬ᑨ䟿ˈԕ⺞ᇊᤏਸ䇝㓳ᮠᦞ઼ᤏਸ䇝㓳ሬᮠѻ䰤Ⲵ⴨ሩ䟽㾱ᙗDŽ⌘᜿
E ᇊѹѝㅜа亩Ѫ৏ᶕⲴ䇝㓳ᮠᦞ਼㖁㔌ѻ䰤Ⲵ䈟ᐞᒣᯩˈ㘼ㅜҼ亩Ѫ䇝㓳ሬᮠ਼㖁㔌ѻ䰤Ⲵ
䈟ᐞᒣᯩDŽ

Simard et al. ˄1992˅㔉ࠪҶ֯↔ᢙኅⲴ䈟ᐞ࠭ᮠᴰሿॆⲴởᓖл䱽㿴ࡉDŽᆳਟ⭡㊫լҾ


ㅜ 4 ㄐѝ৽ੁՐ᫝㿴ࡉѝⲴᯩ⌅䘋㹼᧘ሬDŽ

12.4.2 ⽰ׁ

Simard ㅹᨀ‫׋‬Ҷ TangentProp Ⲵ⌋ॆ㋮ᓖ਼㓟ᖂ㓣৽ੁՐ᫝ѻ䰤Ⲵ∄䖳㔃᷌ˈ䪸ሩⲴ䰞仈


Ѫ᡻߉ᆇㅖ䇶࡛DŽᴤ⺞࠷ൠ䇢ˈ䘉䟼Ⲵԫ࣑ᱟѪঅњᮠᆇ 0 ࡠ 9 Ⲵമ‫֌ۿ‬ḷ䇠DŽ൘ањᇎ傼
ѝˈTangentProp ઼৽ੁՐ᫝䜭⭘н਼བྷሿⲴ䇝㓳䳶䘋㹼䇝㓳ˈ❦ਾสҾᆳԜ൘⤜・Ⲵ 160 њ
ṧֻⲴ⍻䈅䳶к䇴ՠᙗ㜭DŽ㔉Ҹ TangentProp Ⲵ‫ݸ‬傼⸕䇶Ѫ˖ᮠᆇⲴ࠶㊫нഐമ‫≤Ⲵۿ‬ᒣ઼඲
ⴤᒣ〫㘼᭩ਈ˄ণ↔ⴞḷ࠭ᮠሩᓄҾ䘉ӋਈᦒⲴሬᮠѪ 0˅DŽ㔃᷌ᱮ⽪൘㺘 12-4 ѝˈ䇱᰾Ҷ
TangentProp ֯⭘‫ݸ‬傼⸕䇶Ⲵ⌋ॆ㋮ᓖ⺞ᇎ儈Ҿ㓟৽ੁՐ᫝㇇⌅DŽ

㺘 12-4TangentProp ઼৽ੁՐ᫝Ⲵ⌋ॆ㋮ᓖˈ䪸ሩ᡻߉ᮠᆇ䇶࡛䰞仈

TangentProp ⌋ॆ㋮ᓖᴤ儈ˈഐѪᆳᴹ‫ݸ‬傼⸕䇶˖ᮠᆇⲴ⺞ᇊᴹᒣ〫нਈᙗDŽ䘉Ӌ㔃᷌ᶕ㠚Ҿ
Simard et al.˄1992˅DŽ

䇝㓳䳶 ൘⍻䈅䳶кⲴ䭉䈟⦷Ⲯ࠶∄
བྷሿ TangentProp ৽ੁՐ᫝
10 34 48
20 17 33
40 7 18
80 4 10
160 0 3
320 0 0

12.4.3 䈪᱄

ᾲᤜൠ䈤ˈTangentProp ֯⭘Ⲵ‫ݸ‬傼⸕䇶ᖒᔿѪⴞḷ࠭ᮠሩᓄަ䗃‫ޕ‬ਈᦒⲴᡰᐼᵋⲴሬ
ᮠDŽᆳ䙊䗷֯ањⴞḷ࠭ᮠᴰሿॆᶕ㔃ਸ‫ݸ‬傼⸕䇶઼㿲ሏࡠⲴ䇝㓳ᮠᦞˈⴞḷ࠭ᮠ਼ᰦᓖ䟿Ҷ
㖁㔌ሩᓄ䇝㓳ṧֻ٬Ⲵ䈟ᐞ˄ᤏਸᮠᦞ˅ˈ઼㖁㔌ሩᓄҾሬᮠⲴ䈟ᐞ˄ᤏਸ‫ݸ‬傼⸕䇶˅DŽ­Ⲵ
٬ߣᇊҶ㖁㔌൘ᮤњ䈟ᐞѝᤏਸ䘉є䜘࠶Ⲵ〻ᓖDŽ㇇⌅Ⲵ㹼Ѫሩ­٬᭿ᝏˈᆳᱟ⭡䇮䇑㘵䘹ᤙ
ⲴDŽ

㲭❦ TangentProp ᡀ࣏ൠ㔃ਸҶ‫ݸ‬傼⸕䇶઼䇝㓳ᮠᮠᦞԕᤷሬ⾎㓿㖁㔌ᆖҐˈնᆳሩҾ‫ݸ‬
傼⸕䇶ѝⲴ䭉䈟励ἂᙗнᕪDŽᖃ‫ݸ‬傼⸕䇶н↓⺞ᰦˈণ䗃‫ࡠޕ‬ᆖҐಘⲴ䇝㓳ሬᮠн㜭↓⺞৽᱐
ⵏᇎⴞḷ࠭ᮠⲴሬᮠᰦˈ㇇⌅ሶ䈅മᤏਸн↓⺞ⲴሬᮠˈӾ㘼ሬ㠤⌋ॆ㋮ᓖнྲᆼ‫ޘ‬ᘭ⮕‫ݸ‬傼
⸕䇶֯⭘㓟৽ੁՐ᫝㇇⌅Ⲵ㋮ᓖDŽྲ᷌ᡁԜ亴‫⸕ݸ‬䚃䇝㓳ሬᮠѝ䭉䈟ࠪ⧠〻ᓖˈᡁԜਟ⭘䘉а
ؑ᚟䘹ᤙᑨ䟿­ˈԕ⺞ᇊᤏਸ䇝㓳٬઼ᤏਸ䇝㓳ሬᮠⲴ⴨ሩ䟽㾱〻ᓖDŽ❦㘼ˈ䘉аؑ᚟нཚਟ
㜭亴‫⸕ݸ‬䚃DŽ൘ла㢲ᡁԜ䇘䇪Ҷ EBNN ㇇⌅ˈᆳਟ㠚ࣘṩᦞ example-by-example Ⲵส⹰䘹ᤙ
­Ⲵ٬ˈԕ䀓ߣн↓⺞Ⲵ‫ݸ‬傼⸕䇶Ⲵ䰞仈DŽ

ᴹᗵ㾱∄䖳ал TangentPropǃKBANN ઼৽ੁՐ᫝ᢗ㹼Ⲵ‫ٷ‬䇮オ䰤˄ᵳ٬オ䰤˅Ⲵᩌ㍒ᯩ


⌅DŽTangentProp 㔃ਸ‫ݸ‬傼⸕䇶ˈ䙊䗷᭩ਈ⭡ởᓖл䱽ᴰሿॆⲴⴞⲴ(objective)࠭ᮠᶕᖡ૽‫ٷ‬䇮
ᩌ㍒DŽᆳ⴨ᖃҾ᭩ਈҶ‫ٷ‬䇮オ䰤ᩌ㍒Ⲵⴞḷˈྲമ 12-6 ᡰ⽪DŽྲ৽ੁՐ᫝㇇⌅аṧ˄նо
KBANN н਼˅ˈTangentProp ᔰ࿻Ҿ䲿ᵪሿᵳ٬Ⲵࡍ࿻㖁㔌DŽ❦㘼ˈᆳⲴởᓖ䇝㓳⌅ࡉӗ⭏Ⲵ
ᵳ٬ᴤᯠо৽ੁՐ᫝Ⲵн਼ˈӾ㘼ᗇࡠн਼Ⲵᴰ㓸‫ٷ‬䇮DŽྲമѝᡰ⽪ˈ֯ TangentProp ⲴⴞⲴ
࠭ᮠᴰሿॆⲴ‫ٷ‬䇮䳶ਸн਼Ҿ֯৽ੁՐ᫝ⲴⴞⲴ࠭ᮠᴰሿॆⲴ‫ٷ‬䇮䳶ਸˈ䟽㾱Ⲵᱟˈྲ᷌䇝㓳
ṧ઼ֻ‫ݸ‬傼⸕䇶䜭↓⺞ˈᒦфⴞḷ࠭ᮠਟ⭘ ANN ㋮⺞㺘⽪ˈ䛓Ѹ┑䏣 TangentProp ⴞḷⲴᵳ
ੁ䟿䳶ਸሶѪ┑䏣৽ੁՐ᫝ⴞḷⲴᵳੁ䟿䳶ਸⲴᆀ䳶DŽ䘉єњᴰ㓸‫ٷ‬䇮Ⲵ䳶ਸⲴᐞ࡛ѪаӋн
↓⺞Ⲵ‫ٷ‬䇮ˈᆳԜՊ㻛৽ੁՐ᫝㘳㲁ˈնՊഐѪ‫ݸ‬傼⸕䇶㘼㻛 TangentProp ࢄ䲔ᦹDŽ

插图——原书页码:351
Hypothesis Space˖ ‫ٷ‬䇮オ䰤
Hypotheses that maximize fit to data and prior knowledge: ሩᮠᦞ઼‫ݸ‬傼⸕䇶䜭ᴹᴰབྷᤏ
ਸᓖⲴ‫ٷ‬䇮
Hypotheses that maximize fit to data ሩᮠᦞᤏਸᓖᴰབྷⲴ‫ٷ‬䇮
TangentProp Search TangentProp ᩌ㍒
Backpropagation Search ৽ੁՐ᫝ᩌ㍒

മ 12-6TangentProp ѝⲴ‫ٷ‬䇮オ䰤ᩌ㍒

TangentProp ሶ㖁㔌ࡍ࿻ॆѪ䲿ᵪሿᵳ٬ˈྲ৽ੁՐ᫝ѝаṧDŽ❦㘼ˈᆳ֯⭘н਼Ⲵ䈟ᐞ࠭ᮠᶕ
ᕅሬởᓖл䱽ᩌ㍒DŽTangentProp ѝ֯⭘Ⲵ䈟ᐞवᤜҶ亴⍻䇝㓳٬Ⲵ䈟ᐞˈҏवᤜ亴⍻⭡‫ݸ‬傼⸕䇶ᨀ‫׋‬
Ⲵ䇝㓳ሬᮠⲴ䈟ᐞDŽ

⌘᜿ˈሩⴞḷ࠭ᮠⲴ䇝㓳ሬᮠᤏਸⲴਖа⿽ᯩ⌅ᱟˈㆰঅൠሶ㿲ሏࡠⲴ䇝㓳ṧֻ䱴䘁Ⲵ䱴
࣐䇝㓳ṧֻ㔬ਸ䎧ᶕˈ֯⭘ᐢ⸕Ⲵ䇝㓳ሬᮠᶕՠ䇑䘉Ӌ䱴䘁ⲴᇎֻⲴ䇝㓳٬DŽֻྲˈ൘к䶒Ⲵ
ᆇㅖ䇶࡛ԫ࣑ѝˈਟԕਆањ䇝㓳മ‫ˈۿ‬ሩަቁ䟿Ⲵᒣ〫ˈ❦ਾᯝ䀰ᒣ〫ਾⲴമ‫ۿ‬о৏ᶕⲴṧ
ֻ኎Ҿ਼а㊫DŽਟԕᵏᵋ֯⭘৽ੁՐ᫝઼䘉Ӌ㔬ਸⲴṧֻˈ㜭ᗇࡠ⴨լҾ TangentProp ѝ֯⭘
৏࿻ṧ઼ֻሬᮠᡰᗇࡠⲴ㔃᷌DŽSimard et al.˄1992˅֌Ⲵᇎ傼ᱮ⽪є⿽ᛵߥлᴹ䘁լ⴨ㅹⲴ⌋
ॆ䭉䈟⦷ˈն TangentProp 㜭ᴤѪᴹ᭸ൠ᭦ᮋDŽᴹ᜿ᙍⲴᱟㅜ 4 ㄐᨀࡠⲴᆖҐ傮傦⊭䖖Ⲵ
ALVINN ㌫㔏ˈ֯⭘Ҷᖸ⴨լⲴ䙄ᖴԕ㔬ਸ䱴࣐䇝㓳ṧֻDŽᆳ֯⭘ᴹ‫ྲޣ‬օṩᦞ䮌ཤമ‫≤Ⲵۿ‬
ᒣᒣ〫ᶕ᭩ਈ傮傦ᯩੁⲴ‫ݸ‬傼⸕䇶ˈᶕࡋᔪཊњ㔬ਸⲴ䇝㓳ṧֻԕᢙ‫⇿ݵ‬њ㿲ሏࡠⲴ䇝㓳ṧ
ֻDŽ

12.4.4 EBNN ㇍⌋

EBNN(Explanation-Based neural network)ণสҾ䀓䟺Ⲵ⾎㓿㖁㔌˄㿱 Mitchell & Thrun


1993a; Thrun 1996˅ˈ䘉⿽㇇⌅ԕє⿽ᯩᔿ᭩䘋Ҷ TangentProp ㇇⌅DŽ俆‫ˈݸ‬ᆳн‫׍‬䶐⭘ᡧᨀ
‫׋‬䇝㓳ሬᮠˈ㘼ᱟሩ⇿њ䇝㓳ṧֻ㠚㹼䇑㇇↔䇝㓳ሬᮠDŽ䇑㇇ᯩ⌅ᱟ䙊䗷⭘а྇㔉ᇊⲴ亶ฏ⨶
䇪ᶕ䀓䟺⇿њ䇝㓳ṧֻDŽަ⅑ˈEBANN ⎹৺Ҷྲօ⺞ᇊᆖҐ䗷〻ѝᖂ㓣઼࠶᷀䜘࠶⴨ሩ䟽㾱
〻ᓖⲴ䰞仈˄ণྲօ䘹ᤙᔿ 12.1 ѝ৲ᮠ­Ⲵ٬˅DŽ­Ⲵ٬ᱟሩ⇿њ䇝㓳ṧֻ⤜・䘹ᤙⲴˈᆳ
สҾањ੟ਁᔿ㿴ࡉˈ㘳㲁亶ฏ⨶䇪㜭੖㋮⺞亴⍻⢩ᇊṧֻⲴ䇝㓳٬DŽഐ↔ሩҾ䛓Ӌ㜭⭡亶ฏ
⨶䇪↓⺞䀓䟺Ⲵ䇝㓳ṧֻˈᆖҐⲴ࠶᷀ᡀ࠶㻛ᕪॆ˗㘼ሩн㜭↓⺞䀓䟺Ⲵṧֻˈ࠶᷀ᡀ࠶㻛ᕡ
ॆDŽ

EBNNⲴ䗃‫ޕ‬वᤜ˄1˅ᖒᔿѪ<xi,f(xi)>Ⲵа㓴䇝㓳ṧֻˈнवਜ਼䇝㓳ሬᮠ˗˄2˅а㓴亶
ฏ⨶䇪ˈ㊫լҾสҾ䀓䟺ⲴᆖҐ˄ㅜ 11 ㄐ˅઼KBANNѝ֯⭘Ⲵˈնᆳ㺘⽪Ѫа㓴亴‫ݸ‬䇝㓳䗷
Ⲵ⾎㓿㖁㔌ˈ㘼нᱟHornᆀਕDŽEBNNⲴ䗃ࠪᱟањ㜭䙬䘁ⴞḷ࠭ᮠfⲴᯠⲴ⾎㓿㖁㔌DŽ↔ᆖҐ
ࡠⲴ㖁㔌㜭ཏᤏਸ䇝㓳ṧֻ<xi,f(xi)>ˈԕ৺Ӿ亶ฏ⨶䇪ѝᣭਆⲴfⲴ䇝㓳ሬᮠDŽሩ䇝㓳ṧֻ
<xi,f(xi)>ⲴᤏਸᶴᡀҶᆖҐⲴᖂ㓣ᡀ࠶ˈ㘼ሩ亶ฏ⨶䇪ѝᣭਆⲴ䇝㓳ሬᮠⲴᤏਸᶴᡀҶᆖҐⲴ
࠶᷀ᡀ࠶DŽ

Ѫ䈤᰾ EBNN ѝ֯⭘Ⲵ亶ฏ⨶䇪ˈ㘳㲁മ 12-7DŽമⲴк䶒䜘࠶ᱮ⽪Ⲵᱟⴞḷ࠭ᮠ Cup Ⲵ


EBNN 亶ฏ⨶䇪ˈ⇿аᯩඇ㺘⽪亶ฏ⨶䇪ѝањ⾎㓿㖁㔌DŽ⌘᜿൘↔ֻѝˈ㺘 12-3 Ⲵㅖਧ亶
ฏ⨶䇪ѝ⇿њ Horn ᆀਕᴹаሩᓄⲴ㖁㔌DŽֻྲˈḷѪ Graspable Ⲵ㖁㔌䗃‫ޕ‬Ѫаᇎֻ᧿䘠ˈ
䗃ࠪѪ৽᱐ሩ䊑ᱟ੖ Graspable Ⲵ٬˄EBNN ިරᛵߥл⭘ 0.8 㺘⽪ⵏભ仈ˈ⭘ 0.2 㺘⽪‫ٷ‬ભ
仈˅DŽ↔㖁㔌㊫լҾ㺘 12-3 ѝ㔉ࠪⲴ Graspable Ⲵ Horn ᆀਕDŽḀӋ㖁㔌ԕަԆ㖁㔌Ⲵ䗃ࠪ֌
Ѫ䗃‫ˈྲֻ˄ޕ‬ᴰਣ䗩ḷѪ Cup Ⲵ㖁Ⲵ䗃‫ޕ‬Ѫ StableǃLiftable ઼ OpenVessel 㖁㔌Ⲵ䗃ࠪDŽ˅
ഐ↔ˈ㓴ᡀ亶ฏ⨶䇪Ⲵ䘉Ӌ㖁㔌ਟԕ䬮᧕䎧ᶕˈሩ⇿њ䗃‫ޕ‬Ṹֻ᧘⨶ࠪⴞḷ࠭ᮠˈྲ Horn ᆀ
ਕѻ䰤Ⲵ䬮᧕аṧDŽа㡜ൠˈ䘉Ӌ亶ฏ⨶䇪㖁㔌ਟ⭡Ḁཆ䜘Ⓚᨀ‫׋‬㔉ᆖҐಘˈᡆ㘵ҏਟᱟ਼а
㌫㔏ԕࡽᆖҐⲴ㔃᷌DŽEBNN ֯⭘䘉Ӌ亶ฏ⨶䇪ᶕᆖҐᯠⲴⴞḷ࠭ᮠDŽᆳ൘↔䗷〻ѝн᭩ਈ亶
ฏ⨶䇪DŽ

EBNNⲴⴞⲴᱟᆖҐањ᧿䘠ⴞḷ࠭ᮠⲴᯠ⾎㓿㖁㔌DŽᡁԜሶ↔ᯠ㖁㔌〠Ѫⴞḷ㖁㔌
˄target network˅DŽ൘മ 12-7 Ⲵֻᆀѝˈⴞḷ㖁㔌Cuptargetᱮ⽪൘മⲴᓅ䜘ˈᆳⲴ䗃‫ޕ‬Ѫԫ᜿
Ⲵᇎֻ᧿䘠ˈ䗃ࠪѪ㺘⽪↔ሩ䊑ᱟ੖ѪCupⲴ٬DŽ

EBNN䙊䗷ᢗ㹼ࡽа㢲᧿䘠ⲴTangentProp㇇⌅ᶕᆖҐⴞḷ㖁㔌ˈഎᗶалˈTangentProp䇝
㓳 㖁 㔌 ԕ ᤏ ਸ 䇝 㓳 ٬ ઼ 䇝 㓳 ሬ ᮠ DŽ EBNN ᢺ ᆳ ᧕ ᭦ ࡠ Ⲵ 䗃 ‫ ޕ‬䇝 㓳 ٬ <xi,f(xi)> Ր 䙂 㔉
TangentPropDŽ↔ཆˈEBNN䘈ᢺᆳӾ亶ฏ⨶䇪ѝ䇑㇇ࠪⲴሬᮠᨀ‫׋‬㔉TangentPropDŽѪ⨶䀓
EBNNᱟྲօ䇑㇇䘉Ӌ䇝㓳ሬᮠⲴˈ޽⅑㘳㲁മ 12-7DŽമкᯩᱮ⽪Ҷሩа⢩ᇊ䇝㓳ᇎֻxiˈ亶
ฏ⨶䇪֌ࠪⲴⴞḷ࠭ᮠ٬亴⍻DŽEBNNሩᓄҾ䗃‫ޕ‬ᇎֻⲴ⇿ањ⢩ᖱ䇑㇇↔亴⍻ⲴሬᮠDŽֻ
ྲˈ൘മѝˈᇎֻxi ᧿䘠Ѫࠐњ⢩ᖱྲMadeOfStyrofoam=0.2˄ণѪ‫ˈ˅ٷ‬㘼亶ฏ⨶䇪亴⍻Ѫ
Cup˙0.8˄ণⵏ˅DŽEBNNሩᓄҾ⇿њᇎֻ⢩ᖱ䇑㇇↔亴⍻Ⲵ‫ٿ‬ሬˈᗇࡠл䶒Ⲵ‫ٿ‬ሬ䳶ਸ˖

ª wCup wCup wCup º


« wBottomIsFlat , wConcavityPointsUp ,..., wMadeOfStyrofoam »
¬ ¼x xi

插图——原书页码:353
Explanation of training example in terms of domain theory: ṩᦞ亶ฏ⨶䇪ᗇࡠⲴ䇝㓳ṧֻ
Ⲵ䀓䟺
Target network: ⴞḷ㖁㔌

മ 12-7 ൘ EBNN ѝа䇝㓳ṧֻⲴ䀓䟺

↔䀓䟺⭡亶ฏ⨶䇪㖁㔌˄к䜘˅֌ࠪⲴⴞḷ࠭ᮠ٬亴⍻ᶴᡀDŽ䇝㓳ሬᮠӾ↔䀓䟺ѝᣭਆࠪᶕˈԕ
䇝㓳࠶⿫Ⲵⴞḷ㖁㔌DŽ⇿њ⸙ᖒඇ㺘⽪ањঅ⤜Ⲵཊቲ⾎㓿㖁㔌DŽ
䘉㓴ሬᮠᱟ亶ฏ⨶䇪亴⍻࠭ᮠሩ䗃‫ޕ‬ᇎֻⲴởᓖDŽлḷ㺘⽪䘉Ӌሬᮠ൘x=xiк䇑㇇DŽ൘ᴤ
а㡜Ⲵᛵߥлˈⴞḷ࠭ᮠᴹཊњ䗃ࠪঅ‫ˈݳ‬ởᓖሩ⇿њ䗃ࠪ䘋㹼䇑㇇DŽ䘉њởᓖ⸙䱥㻛〠Ѫⴞ
ḷ࠭ᮠⲴ䳵ਟ∄㹼ࡇᔿ˄Jacobian˅DŽ

wCup
Ѫ⨶䀓䘉Ӌ䇝㓳ሬᮠ൘ᑞࣙᆖҐⴞḷ㖁㔌Ⲵ䟽㾱ᙗˈ㘳㲁ሬᮠ DŽྲ᷌亶ฏ⨶
wExpensive
wCup
䇪㕆⸱Ⲵ⸕䇶ѝExpensive⢩ᖱоⴞḷ࠭ᮠCupᰐ‫ˈޣ‬䛓ѸӾ↔䀓䟺ѝᣭਆⲴሬᮠ
wExpensive
Ⲵ٬Ѫ 0DŽѪ 0 Ⲵሬᮠ㺘⽪䘉ṧⲴᯝ䀰ˈ⢩ᖱExpensiveкⲴ᭩ਈሩCup٬Ⲵ亴⍻⋑ᴹᖡ૽DŽਖ
аᯩ䶒ˈᖸབྷⲴ↓ሬᮠᡆ䍏ሬᮠ㺘⽪ᯝ䀰˖↔⢩ᖱоⴞḷ٬䶎ᑨ⴨‫ޣ‬DŽഐ↔ˈӾ亶ฏ⨶䇪䀓䟺
ѝᣭਆⲴሬᮠᨀ‫׋‬Ҷ४࠶⴨‫઼ޣ‬н⴨‫ޣ‬⢩ᖱⲴ䟽㾱ؑ᚟DŽᖃ䘉ӋᣭਆࠪⲴሬᮠ㻛ᨀ‫׋‬Ѫ
TangentPropⲴ䇝㓳ሬᮠԕᆖҐⴞḷ㖁㔌Cuptarget ˈᆳԜᨀ‫׋‬Ҷᤷሬ⌋ॆ䗷〻Ⲵᴹ⭘Ⲵ‫ٿ‬㖞
˄bias˅DŽ䙊ᑨ⾎㓿㖁㔌ѝⲴ䈝⌅ᖂ㓣‫ٿ‬㖞൘䘉䟼㻛ᴯᦒѪӾ亶ฏ⨶䇪ѝᗇࡠⲴሬᮠᡰӗ⭏Ⲵ
‫ٿ‬㖞DŽ

к䶒ᡁԜ᧿䘠Ҷ亶ฏ⨶䇪亴⍻ྲօ㻛⭘Ҿ⭏ᡀа㓴䇝㓳ሬᮠDŽ㋮⺞ൠ䇢ˈᆼᮤⲴEBNN㇇
⌅ྲл˖㔉ᇊ䇝㓳ṧ઼ֻ亶ฏ⨶䇪ˈEBNN俆‫ࡋݸ‬ᔪањᯠⲴ‫ޘ‬䘎᧕ࡽ侸㖁㔌ԕ㺘⽪↔ⴞḷ࠭
ᮠDŽ䈕ⴞḷ㖁㔌㻛ࡍ࿻ॆѪ䲿ᵪሿᵳ٬ˈྲ൘৽ੁՐ᫝ѝ䛓ṧDŽ❦ਾˈEBNNሩ⇿њ䇝㓳ṧֻ
<xi,f(xi)>⺞ᇊ⴨ᓄⲴ䇝㓳ሬᮠˈԕє↕僔ᇎ⧠DŽㅜа↕⭘亶ฏ⨶䇪ᶕ亴⍻ᇎֻxi Ⲵⴞḷ࠭ᮠ
٬DŽԔA(xi)ԓ㺘↔亶ฏ⨶䇪ሩᇎֻxi亴⍻DŽᦒ䀰ѻˈA(xi)ѪᖒᡀxiⲴ䀓䟺Ⲵ亶ฏ⨶䇪㓴ਸ㖁㔌ᇊ
ѹⲴ࠭ᮠDŽㅜҼ↕ˈ࠶᷀亶ฏ⨶䇪Ⲵᵳ٬઼◰⍫⣦ᘱԕᣭਆࠪሩᓄxi⇿њ࠶䟿ⲴA(xi)ⲴሬᮠDŽ
˄ণ൘x=xi 䇑㇇ⲴA(x)Ⲵ䳵ਟ∄㹼ࡇᔿ˅DŽᣭਆሬᮠⲴ䗷〻㊫լҾ৽ੁՐ᫝㇇⌅ѝ䇑㇇ ¥ 亩
˄㿱Ґ仈 12.5˅DŽᴰਾˈEBNN֯⭘ҶTangentPropⲴᗞሿਈරᶕ䇝㓳ⴞḷ㖁㔌ԕᤏਸл䶒Ⲵ䈟
ᐞ࠭ᮠDŽ

ª § wA( x ) wfˆ ( x) ·
2
º
E ¦i ««( f ( xi )  fˆ ( xi ))  P i ¦j ¨¨ wx j  wx j ¸¸
2
»
»
˄12.2˅
¬ © ¹ (x xi ) ¼

ަѝ

A( xi )  f ( xi )
Pi { 1  ˄12ˊ3˅
c

䘉䟼xiԓ㺘ㅜiњ䇝㓳ᇎֻˈA(x)ԓ㺘䗃‫ޕ‬xⲴ亶ฏ⨶䇪亴⍻DŽкḷㅖਧxjԓ㺘ੁ䟿xⲴㅜjњ
࠶䟿˄ণ⾎㓿㖁㔌Ⲵㅜjњ䗃‫ޕ‬㔃⛩˅DŽ㌫ᮠcѪањᖂаॆᑨ䟿ˈᆳⲴ٬ᱟѪҶ‫؍‬䇱ሩᡰᴹiˈ
0 d Pi d 1DŽ

㲭❦‫ޜ‬ᔿⴻ䎧ᶕᖸ༽ᵲˈަѝⲴᙍᜣᖸㆰঅDŽ⭡ᔿ 12.2 㔉ࠪⲴ䈟ᐞ࠭ᮠоᔿ 12.1 ѝ⭡


TangentPropᴰሿॆⲴ䈟ᐞ࠭ᮠᴹ⴨਼Ⲵа㡜ᖒᔿDŽᴰᐖ䗩Ⲵ亩ྲ䙊ᑨ䛓ṧˈᱟ䇝㓳٬f(xi)઼ⴞ
wA( x)
ḷ㖁㔌亴⍻٬ fˆ ( xi ) ѻ䰤Ⲵ䈟ᐞᒣᯩDŽᴰਣ䗩Ⲵ亩㺑䟿ҶӾ亶ฏ⨶䇪ѝᣭਆⲴ䇝㓳ሬᮠ j
wx
wfˆ ( x )
઼ⴞḷ㖁㔌Ⲵᇎ䱵ሬᮠ ѻ䰤Ⲵ䈟ᐞᒣᯩDŽഐ↔ˈᴰᐖ䗩Ⲵ亩ᨀ‫׋‬ᱟᖂ㓣㓖ᶏˈ‫ٷ‬䇮ᗵ享
wx j
ᤏਸ䇝㓳ᮠᦞ˗㘼ᴰਣ䗩Ⲵ亩ᨀ‫Ⲵ׋‬ᱟ࠶᷀㓖ᶏˈণ‫ٷ‬䇮ᗵ享ᤏਸӾ亶ฏ⨶䇪ѝᣭਆⲴ䇝㓳ሬ
wfˆ ( x ) wfˆ ( s j (D , xi ))
ᮠDŽ⌘᜿൘ᔿ 12.2 ѝⲴሬᮠ ਚᱟᔿ 12.1 ѝ㺘䗮ᔿ Ⲵа⿽⢩↺ᖒᔿˈަѝ
wx j wD
ሶ s j (D , xi ) ѝⲴxijᴯѪҶxij+¢ˈEBNN֯⭘Ⲵ㋮⺞Ⲵᵳ٬䇝㓳⌅ࡉ⭡Thrun˄1996˅᧿䘠DŽ

EBNNѝᖂ㓣઼࠶᷀ᆖҐ䜘࠶Ⲵ⴨ሩ䟽㾱ᙗ⭡ᑨ䟿­i⺞ᇊˈᆳ⭡ᔿ 12-3 ᇊѹDŽ­iⲴ٬ᱟ


⭡亶ฏ⨶䇪Ⲵ亴⍻A(xi) ઼䇝㓳٬f(xi)Ⲵᐞᔲ⺞ᇊⲴDŽᆖҐⲴ࠶᷀ᡀ࠶ሩҾ㜭㻛亶ฏ⨶䇪↓⺞亴
⍻Ⲵ䇝㓳ṧֻަᵳ٬㻛࣐䟽ˈ㘼ሩҾн㜭↓⺞亴⍻Ⲵṧֻᵳ٬߿䖫DŽ䘉а࣐ᵳ੟ਁᔿ㿴ࡉ‫ٷ‬ᇊ
൘䇝㓳٬㜭ཏ㻛亶ฏ⨶䇪↓⺞亴⍻ᰦˈӾ亶ฏ⨶䇪ѝᣭਆⲴ䇝㓳ሬᮠᴤᴹਟ㜭ᱟ↓⺞ⲴDŽ㲭❦
ਟ㜭ᶴ䙐ࠪ↔੟ਁᔿ㿴ࡉཡ䍕Ⲵᛵߥˈ൘ᇎ䐥ѝࠐњ亶ฏѝ䜭ᐢ䇱᰾ᱟᴹ᭸Ⲵ˄ֻྲˈ㿱
Mitchell & Thrun 1993a; Thrun 1996˅DŽ

12.4.5 䈪᱄

ᾲᤜൠ䈤ˈEBNN㇇⌅֯⭘Ⲵ亶ฏ⨶䇪㻛㺘⽪Ѫа㓴亴‫ݸ‬ᆖҐࡠⲴ⾎㓿㖁㔌ˈ❦ਾ亶ฏ⨶
䇪о䇝㓳ṧֻа䎧䇝㓳ަ䗃ࠪ‫ٷ‬䇮˄ⴞḷ㖁㔌˅DŽሩ⇿њ䇝㓳ṧֻˈEBNN֯⭘ަ亶ฏ⨶䇪ᶕ
䀓䟺ᆳˈ❦ਾӾ↔䀓䟺ѝᣭਆ䇝㓳ሬᮠDŽሩᇎֻⲴ⇿њ኎ᙗ䇑㇇ࠪањ䇝㓳ሬᮠˈԕ᧿䘠˖᤹
➗亶ฏ⨶䇪ˈⴞḷ࠭ᮠ٬ᱟᘾṧ⭡ަ኎ᙗ٬Ⲵᗞሿਈॆᖡ૽ⲴDŽ䘉њ䇝㓳ሬᮠ㻛ᨀ‫׋‬㔉
TangentPropⲴањਈփˈަѝ֯ⴞḷ㖁㔌ᤏਸ䘉Ӌሬᮠ઼䇝㓳ṧֻ٬DŽᤏਸሬᮠ䲀ࡦҶᆖҐࡠ
㖁㔌ᗵ享ᤏਸ亶ฏ⨶䇪㔉ࠪⲴ‫׍‬䎆‫ޣ‬㌫ˈ㘼ᤏਸ䇝㓳٬䲀ࡦҶ㖁㔌ᗵ享ᤏਸ㿲ሏࡠⲴᮠᦞᵜ
䓛DŽᤏਸሬᮠⲴᵳ٬­i ᱟ⭡⇿њ䇝㓳ṧֻ⤜・⺞ᇊⲴˈᆳสҾ亶ฏ⨶䇪亴⍻↔ṧֻ䇝㓳٬Ⲵ
㋮⺞〻ᓖDŽ

൘ ཊ њ 亶 ฏ ޵ ˈ EBNN ᐢ 㻛 䇱 ᰾ ᱟ Ӿ 䘁 լ 亶 ฏ ⨶ 䇪 ѝ ᆖ Ґ Ⲵ а ⿽ ᴹ ᭸ ᯩ ⌅ DŽ Thrum
˄1996˅᧿䘠Ҷᆳ൘к䘠䇘䇪Ⲵ Cup ᆖҐԫ࣑ⲴਈփкⲴᓄ⭘ˈᒦфᣕ੺䈤ᆳ∄ḷ߶৽ੁՐ᫝
㇇⌅⌋ॆᴤѪ㋮⺞ˈ⢩࡛ᱟ൘䇝㓳ᮠᦞ㕪ቁⲴᛵߥлDŽֻྲˈ൘㓿䗷 30 њṧֻ䇝㓳ਾˈ
EBANN ൘ਖа⍻䈅ᮠᦞ䳶кᗇࡠⲴ൷ᯩṩ䈟ᐞѪ 5.5ˈ㘼৽ੁՐ᫝Ⲵ䈟ᐞѪ 12.0DŽMitchell &
Thrun˄1993a˅᧿䘠Ҷᓄ⭘ EBNN ԕᆖҐ᧗ࡦ⁑ᤏⲴ〫ࣘᵪಘӪˈަѝ亶ฏ⨶䇪⭡⾎㓿㖁㔌ᶴ
ᡀˈᆳԜ亴⍻Ҷн਼ᵪಘӪሩཆ⭼⣦ᘱⲴࣘ֌Ⲵ᭸᷌DŽަѝ EBNN ҏ֯⭘Ҷ䘁լⲴ亴‫ݸ‬ᆖҐ
Ⲵ亶ฏ⨶䇪ˈᒦ㧧ᗇҶ∄৽ੁՐ᫝ᴤྭⲴᙗ㜭DŽ䘉䟼৽ੁՐ᫝䴰㾱㓖 90 њ䇝㓳һԦ᡽㜭䗮ࡠ
EBNN ѝ 25 њ䇝㓳һԦਾⲴᙗ㜭DŽO'Sullivan et al.˄1997˅઼ Thrun˄1996˅᧿䘠Ҷ EBNN ᓄ
⭘ࡠަԆࠐ⿽ⵏᇎц⭼ᝏ⸕઼᧗ࡦԫ࣑ˈަѝ亶ฏ⨶䇪⭡㖁㔌㓴ᡀˈᆳ֯⭘༠㓣ǃ㿶㿹઼◰‫ݹ‬
㤳തՐᝏಘ亴⍻Ҷᇔ޵〫ࣘᵪಘӪⲴࣘ֌᭸᷌DŽ

EBNN оަԆสҾ䀓䟺ⲴᆖҐᯩ⌅ѻ䰤ᆈ൘޵൘Ⲵ㚄㌫ˈྲㅜ 11 ㄐ᧿䘠Ⲵ Prolog-EBGDŽ


എᗶ䈕ㄐѝ Prolog-EBG ҏสҾ亶ฏ⨶䇪ᶴ䙐䀓䟺˄ሩṧֻⴞḷ٬Ⲵ亴⍻˅DŽ൘ Prolog-EBG
ѝˈ䀓䟺Ⲵᶴ䙐ᶕ㠚Ҿ⭡ Horn ᆀਕ㓴ᡀⲴ亶ฏ⨶䇪ˈ㘼ⴞḷ‫ٷ‬䇮Ⲵ㋮ॆᱟ䙊䗷䇑㇇↔䀓䟺ᡀ
・ⲴᴰᕡᶑԦDŽഐ↔䀓䟺ѝⲴ⴨‫׍ޣ‬䎆ᙗ൘ᆖҐࡠⲴ Horn ᆀਕ‫ٷ‬䇮ѝ৽᱐DŽEBNN ᶴ䙐Ҷа
њ⴨լⲴ䀓䟺ˈնᆳᱟสҾ⾎㓿㖁㔌ᖒᔿⲴ亶ฏ⨶䇪ˈ㘼нᱟ Horn ᆀਕDŽྲ൘ Prolog-EBG
ѝˈ⴨‫׍Ⲵޣ‬䎆ᙗᱟӾ䀓䟺ѝᣭਆⲴˈ㘼ф㻛⭘Ҿ㋮ॆⴞḷ‫ٷ‬䇮DŽ൘ EBNN ѝˈ䘉Ӌ‫׍‬䎆ᙗ
ᖒᔿѪሬᮠˈഐѪ൘⾎㓿㖁㔌䘉ṧⲴ䘎㔝࠭ᮠѝˈሬᮠᱟ㺘⽪‫׍‬䎆ᙗⲴᖸ㠚❦Ⲵᯩ⌅DŽ⴨৽ˈ
൘ㅖਧ䀓䟺ᡆ䙫䗁䇱᰾ѝˈ㺘⽪‫׍‬䎆ᙗⲴ㠚❦ᯩ⌅ᱟ᧿䘠↔䇱᰾ᡰᓄ⭘Ⲵṧֻ䳶DŽ

ㅜ 11 ㄐ᧿䘠ⲴㅖਧⲴสҾ䀓䟺ᯩ⌅о EBNN ൘ަᆖҐ㜭࣋ᯩ䶒ᴹࠐњн਼DŽѫ㾱н਼൘


Ҿ EBNN 㜭༴⨶нᆼ㖾Ⲵ亶ฏ⸕䇶ˈ㘼 Prolog-EBG н㜭DŽ䘉ан਼ᱟ⭡Ҿ EBNN ᱟᔪ・൘ᤏ
ਸ㿲ሏ䇝㓳٬Ⲵᖂ㓣ᵪࡦѻкⲴˈ㘼ф亶ฏ⨶䇪ਚ㻛֌ѪᆖҐࡠⲴ‫ٷ‬䇮Ⲵ䱴࣐㓖ᶏDŽㅜҼњ䟽
㾱н਼൘Ҿ Prolog-EBG ᆖҐࡠ䙀⑀໎䮯Ⲵ Horn ᆀਕ䳶DŽ㘼 EBNN ᆖҐࡠപᇊབྷሿⲴ⾎㓿㖁
㔌DŽྲㅜ 11 ㄐ䇘䇪ⲴˈᆖҐ Horn ᆀਕ䳶Ⲵањ䳮仈ᱟˈ䲿⵰ᆖҐ䗷〻Ⲵ䘋㹼઼ᯠ Horn ᆀਕ
㻛࣐‫࠶ˈޕ‬㊫ᯠᇎֻⲴᔰ䬰нᯝ໎䮯DŽ❦㘼പᇊབྷሿⲴ⾎㓿㖁㔌ҏᴹ⴨ᓄⲴн䏣ˈᆳਟ㜭ᰐ⌅
㺘⽪䏣ཏ༽ᵲⲴ࠭ᮠˈ㘼໎䮯Ⲵ Horn ᆀਕ䳶ਟԕ㺘⽪䎺ᶕ䎺༽ᵲⲴ࠭ᮠDŽMitchell & Thrun
˄1993b˅ᴤ䈖㓶ൠ䇘䇪Ҷ‫ޣ‬Ҿ EBNN ઼ㅖਧ㺘⽪ⲴสҾ䀓䟺ᆖҐᯩ⌅ѻ䰤㚄㌫DŽ

12.5 ֵ⭞‫ݾ‬僂⸛䇼ᶛᢟኋᩒ㍘㇍ᆆ

ࡽ䶒є㢲㘳ḕҶ‫ݸ‬傼⸕䇶൘ᆖҐѝⲴє⿽н਼䀂㢢DŽࡍ࿻ॆᆖҐಘⲴ‫ٷ‬䇮ǃ઼᭩ਈⴞⲴ࠭
ᮠԕᕅሬ‫ٷ‬䇮オ䰤кⲴᩌ㍒DŽᵜ㢲ᡁԜ㘳㲁֯⭘‫ݸ‬傼⸕䇶ᶕ᭩ਈ‫ٷ‬䇮オ䰤ᩌ㍒Ⲵㅜй⿽ᯩ⌅˖
ণ᭩ਈᩌ㍒ѝᇊѹਸ⌅ᩌ㍒↕Ⲵ㇇ᆀ䳶ਸDŽ䘉а䙄ᖴ㻛⭘Ҿ FOCL˄Pazzani et al. 1991ˈ
Pazzani & Kibler 1992˅ԕ৺ ML-SMART˄Bergadano & Giordanna 1990˅ㅹ㌫㔏DŽ䘉䟼ᡁԜ⭘
FOCL ᶕ䈤᰾䘉а䙄ᖴDŽ

12.5.1 FOCL ㇍⌋

FOCL ᱟㅜ 10 ㄐ᧿䘠Ⲵ㓟ᖂ㓣Ⲵ FOIL ㌫㔏ⲴањᢙኅDŽFOIL ઼ FOCL 䜭ᆖҐа㓴а䱦


Horn ᆀਕԕ㾶ⴆ㿲ሏࡠⲴ䇝㓳ֻDŽєњ㌫㔏䜭ᓄ⭘Ҷᒿࡇ㾶ⴆ㇇⌅ᶕᆖҐঅњ Horn ᆀਕˈ〫
৫䛓Ӌ㻛ᯠ Horn ᆀਕ㾶ⴆⲴ↓ֻˈ❦ਾ൘࢙։Ⲵ䇝㓳ṧֻк䟽༽䘉а䗷〻DŽ൘єњ㌫㔏ѝˈ
⇿њᯠ Horn ᆀਕ䜭ᱟ䙊䗷а㡜ࡠ⢩↺ᩌ㍒ࡋᔪⲴˈᔰ࿻Ҿᴰа㡜Ⲵ Horn ᆀਕ˄ণнਜ਼ࡽԦⲴ
ᆀਕ˅DŽ❦ਾ⭏ᡀᖃࡽᆀਕⲴࠐњ‫ى‬䘹⢩ॆᔿˈᒦ䘹ᤙަѝ‫ޣ‬Ҿ䇝㓳ṧֻᴹᴰབྷؑ᚟໎⳺Ⲵа
њDŽ䟽༽䈕䗷〻ˈ⭏ᡀᴤཊⲴ‫ى‬䘹⢩ॆᔿᒦ䘹ᤙᴰ֣Ⲵˈⴤࡠ㧧ᗇањ┑䏣ᤷᇊᙗ㜭Ⲵ Horn
ᆀਕDŽ

FOIL ઼ FOCL ѻ䰤Ⲵ४࡛൘Ҿᩌ㍒অњ Horn ᆀਕⲴа㡜ࡠ⢩↺䗷〻ѝ‫ى‬䘹‫ٷ‬䇮⭏ᡀⲴᯩ


⌅DŽㅜ 10 ㄐ᧿䘠Ⲵ FOIL ⭏ᡀ⇿њ‫ى‬䘹⢩ॆᔿᱟ䙊䗷࣐‫ޕ‬ањᯠ᮷ᆇࡠᆀਕࡽԦѝᗇࡠⲴDŽ
FOCL ֯⭘਼ṧⲴᯩ⌅ӗ⭏‫ى‬䘹⢩ॆᔿˈն䘈สҾ亶ฏ⨶䇪⭏ᡀҶ䱴࣐Ⲵ⢩ॆᔿDŽമ 12-8 Ⲵᩌ
㍒ṁⲴᇎ㓯䗩ᱮ⽪Ҷ൘ FOIL ިරⲴᩌ㍒ѝ㘳㲁Ⲵа㡜ࡠ⢩↺ᩌ㍒↕DŽമ 12-8 ᩌ㍒ṁⲴ㲊㓯䗩
㺘⽪ FOCL ѝสҾ亶ฏ⨶䇪㘳㲁Ⲵ䱴࣐‫ى‬䘹⢩ॆᔿDŽ

㲭❦ FOCL ઼ FOIL 䜭ᆖҐа䱦 Horn ᆀਕˈᡁԜ䘉ᰦ╄⽪Ⲵ᫽֌䜭ਚᴹㆰঅⲴભ仈 Horn


ᆀਕ˄ᰐਈ䟿Ⲵ˅DŽ⢩࡛ൠˈ޽⅑㘳㲁മ 12-3 ѝⲴ Cup ⴞḷᾲᘥǃ䇝㓳ṧ઼ֻ亶ฏ⨶䇪DŽѪ
᧿䘠 FOIL Ⲵ᫽֌ˈᡁԜᗵ享俆‫ݸ‬൘ࠪ⧠Ҿ亶ฏ⨶䇪઼‫ٷ‬䇮㺘⽪ѝⲴє⿽᮷ᆇѻ䰤֌а४࠶DŽ
ᖃањ᮷ᆇਟ㻛⭘Ҿ᧿䘠ањ䗃ࠪ‫ٷ‬䇮ᰦˈᡁԜ〠ᆳᱟ᫽֌ර˄operational˅DŽֻྲˈ൘മ 12-
3 Ⲵ Cup ֻᆀѝˈᡁԜ‫ݱ‬䇨䗃ࠪ‫ٷ‬䇮ѝਚ㜭ᕅ⭘᧿䘠䇝㓳ṧֻⲴ 12 њ኎ᙗ˄ྲ˖HasHandle,
HandleOnTop˅DŽสҾ䘉 12 њ኎ᙗⲴ᮷ᆇ㻛䇔Ѫᱟ᫽֌රⲴDŽ⴨৽ˈ䛓Ӌਚࠪ⧠൘亶ฏ⨶䇪ѝ
֌Ѫѝ䰤⢩ᖱնнᱟᇎֻⲴ৏ᆀ኎ᙗⲴ᮷ᆇˈ㻛䇔Ѫᱟ䶎᫽֌රDŽ൘↔ᛵߥл䶎᫽֌ර኎ᙗⲴ
ањֻᆀᱟ኎ᙗ StableDŽ

插图——原书页码:358

Generated by the domain theory˖⭡亶ฏ⨶䇪⭏ᡀ

മ 12-8FOCL ѝⲴ‫ٷ‬䇮オ䰤ᩌ㍒

ѪᆖҐањ㿴ࡉˈFOCL Ӿа㡜Ⲵ‫ٷ‬䇮ᔰ࿻ˈᩌ㍒䙀⑀⢩↺Ⲵ‫ٷ‬䇮DŽᴹє⿽㇇ᆀ⭘Ҿ⭏ᡀᖃࡽ‫ٷ‬
䇮Ⲵ⢩ॆᔿDŽа⿽ᱟ໎࣐ањᯠⲴ᮷ᆇ˄മѝⲴᇎ㓯˅DŽਖа⿽㇇ᆀᱟ䙊䗷໎࣐а㓴᮷ᆇ⢩ॆ↔㿴
ࡉDŽ䘉㓴᮷ᆇ᤹➗亶ฏ⨶䇪ᶴᡀҶⴞḷᾲᘥⲴ䙫䗁‫࠶ݵ‬ᶑԦ˄മѝ㲊㓯˅DŽFOCL ൘ᡰᴹ䘉Ӌ‫ى‬䘹ॆ
ᔿѝสҾᆳԜ൘ᮠᦞкⲴᙗ㜭䘋㹼䘹ᤙDŽഐ↔ˈнᆼ㖾Ⲵ亶ฏ⨶䇪ਚՊ൘ᴹ䇱ᦞ᭟ᤱ⨶䇪ᰦ᡽Պᖡ૽
‫ٷ‬䇮DŽ䈕ֻสҾࡽ䶒 KBANN ֻᆀ⴨਼Ⲵ䇝㓳ᮠᦞ઼亶ฏ⨶䇪DŽ

൘ަа㡜ࡠ⢩↺ᩌ㍒Ⲵ⇿а⛩ˈFOCL ֯⭘л䶒є⿽㇇ᆀᢙኅަᖃࡽ‫ٷ‬䇮 h˖

1ˊሩнᱟ h а䜘࠶Ⲵ⇿њ᫽֌ර᮷ᆇˈࡋᔪ h Ⲵањ⢩ॆᔿˈᯩ⌅ᱟ࣐‫ޕ‬᮷ᆇࡠࡽԦ


ѝDŽ䘉ҏᱟ FOIL ѝ⭏ᡀ‫ى‬䘹ਾ㔗Ⲵᯩ⌅DŽമ 12-8 ᇎ㓯㇝ཤ㺘⽪Ҷ↔⿽㊫රⲴ⢩ॆDŽ

2ˊ᤹➗亶ฏ⨶䇪ˈࡋᔪањ᫽֌රⲴˈᒦфᱟⴞḷᾲᘥⲴ䙫䗁‫࠶ݵ‬ᶑԦDŽሶ䘉㓴᮷ᆇ࣐
‫ ࡠޕ‬h ⲴᖃࡽࡽԦѝ৫DŽᴰਾ‫ ࢚؞‬h ⲴࡽԦˈ〫৫ሩҾ䇝㓳ᮠᦞн䴰㾱Ⲵ᮷ᆇDŽമ 12-8 ѝ㲊
㇝ཤ㺘⽪Ҷ↔⿽㊫රⲴ⢩ॆDŽ

к䶒ㅜ 2 ⿽㇇ᆀⲴ䈖㓶䗷〻ྲлDŽFOCL 俆‫ݸ‬䘹ᤙаᶑ亶ฏ⨶䇪ᆀਕˈᆳⲴཤ䜘˄ࡽԦ˅


३䝽ⴞḷᾲᘥDŽྲ᷌ᴹཊњ䘉ṧⲴᆀਕˈ䘹ᤙަѝփ䜘˄ਾԦ˅‫ޣ‬Ҿ䇝㓳ṧֻᴹᴰ儈ؑ᚟໎⳺
ⲴDŽֻྲˈ൘亶ฏ⨶䇪Ⲵ䇝㓳ᮠᦞѝ˄മ 12-3˅ˈਚᴹањṧⲴᆀਕ˖

CupĕStable, Liftable, OpenVessel

ᡰ䘹ᆀਕⲴࡽԦᖒᡀҶⴞḷᾲᘥⲴањ䙫䗁‫࠶ݵ‬ᶑԦDŽ൘䘉Ӌ‫࠶ݵ‬ᶑԦѝˈ޽⅑֯⭘亶ฏ
⨶䇪ˈ⇿њ䶎᫽֌ර᮷ᆇ㻛ᴯᦒᦹˈᒦфሶᆀਕࡽԦԓ‫ࡠޕ‬ᆀਕਾԦѝDŽֻྲˈ亶ฏ⨶䇪ᆀਕ
StableĕBottomIsFlat 㻛⭘Ҿሶ᫽֌රⲴ BottomIsFlat ԓᦒ䶎᫽֌රⲴ StableDŽ䘉њĀኅᔰā
˄ unfolding˅亶ฏ⨶䇪Ⲵ䗷〻ᤱ㔝ⴤࡠ‫࠶ݵ‬ᶑԦᐢ㻛㺘䘠Ѫ᫽֌ර᮷ᆇDŽྲ᷌ᴹཊњਟ䘹Ⲵ亶
ฏ⨶䇪ӗ⭏н਼Ⲵ㔃᷌ˈ䛓Ѹ൘↔ኅᔰ䗷〻Ⲵ⇿а↕⭘䍚ႚⲴᯩ⌅䘹ᤙᴹᴰབྷؑ᚟໎⳺ањDŽ
䈫㘵ਟԕ傼䇱൘䘉њֻᆀѝˈ㔉ᇊᮠᦞ઼亶ฏ⨶䇪ˈᴰ㓸Ⲵ᫽֌ර‫࠶ݵ‬ᶑԦѪ˖

BottomIsFlat, HasHandle, Light, HasConcavity, ConcavityPointsUp

֌Ѫ⭏ᡀ‫ى‬䘹⢩ॆᔿⲴᴰਾа↕ˈ↔‫࠶ݵ‬ᶑԦ㻛‫࢚؞‬DŽሩ㺘䗮ᔿѝⲴ⇿њ᮷ᆇˈ䲔䶎᮷ᆇ
Ⲵ〫䲔Պ䱽վ䇝㓳ֻкⲴ࠶㊫㋮ᓖˈ੖ࡉᆳ㻛〫৫DŽवਜ਼䘉а↕僔ᱟѪҶӾ䗷⢩ॆ
(overspecialization)Ⲵᛵߥлᚒ༽ˈ䘉ᰦнᆼ㖾Ⲵ亶ฏ⨶䇪ѝवਜ਼н⴨‫Ⲵޣ‬᮷ᆇDŽ൘ᡁԜⲴֻᆀ
ѝˈк䘠Ⲵ᮷ᆇ䳶ਸ३䝽єњ↓઼ֻєњ৽ֻDŽ‫〫˄࢚؞‬৫˅᮷ᆇ HasHandle Պ֯ᙗ㜭᭩䘋DŽ
ഐ↔ˈᴰ㓸Ⲵ‫࢚؞‬䗷Ⲵ᫽֌ර‫࠶ݵ‬ᶑԦѪ˖

BottomIsFlat, Light, HasConcavity, ConcavityPointsUp

䘉㓴᮷ᆇ⧠൘㻛࣐‫ࡠޕ‬ᖃࡽ‫ٷ‬䇮ⲴࡽԦѝDŽ⌘᜿↔‫ٷ‬䇮ᱟമ 12-8 ѝ㲊㓯㇝ཤᱮ⽪Ⲵᩌ㍒


↕Ⲵ㔃᷌DŽ

֯⭘Ҷк䶒є⿽᫽֌ਾˈаնᖃࡽ‫ٷ‬䇮Ⲵ‫ى‬䘹⢩ॆᔿᐢ㓿⭏ᡀҶˈᴹᴰབྷؑ᚟໎⳺Ⲵ‫ى‬䘹
㘵㻛䘹ᤙDŽ൘മ 12-8 ѝᱮ⽪Ⲵֻᆀѝˈ൘ᩌ㍒ṁⲴㅜаቲ䘹ᤙⲴ‫ى‬䘹㘵Ѫ亶ฏ⨶䇪⭏ᡀⲴ䛓
ањDŽᩌ㍒䗷〻㔗㔝㘳㲁䘉њ亶ฏ⨶䇪᧘ѮⲴࡽԦⲴᴤ䘋а↕Ⲵ⢩ॆᔿˈ䘉ṧᆖҐⲴᖂ㓣ᡀ࠶
ਟԕ㋮ॆ亶ฏ⨶䇪ѝሬࠪⲴࡽԦDŽ൘↔ֻѝˈ亶ฏ⨶䇪‫ݸ‬ᖡ૽ᩌ㍒ⲴㅜаቲDŽ❦㘼ˈᛵߥᒦ䶎
ᙫᱟྲ↔DŽྲ᷌൘ㅜаቲሩަԆ‫ى‬䘹ᴹᴤᕪⲴ㓿傼ॆⲴ᭟ᤱˈ亶ฏ⨶䇪᧘ѮⲴ᮷ᆇӽਟ㜭൘ᩌ
㍒Ⲵਾ㔝↕僔ѝ㻛࣐‫ޕ‬DŽᾲᤜൠ䈤ˈFOCL ᆖҐԕлᖒᔿⲴ Horn ᆀਕ˖

c m oi š o b š o f

ަѝcѪⴞḷᾲᘥˈoi Ѫࡍ࿻Ⲵ᫽֌ර᮷ᆇⲴਸਆˈᆳ⭡ㅜањ䈝⌅㇇ᆀ⇿⅑࣐‫ޕ‬ањ᮷
ᆇˈobᱟสҾ亶ฏ⨶䇪অ↕࣐‫Ⲵޕ‬᫽֌ර᮷ᆇਸਆˈ㘼ofѪㅜањ䈝⌅㇇ᆀ⇿⅑࣐‫ޕ‬ањⲴ᫽
֌ර᮷ᆇⲴਸਆDŽ䘉йњ᮷ᆇ䳶ਸ䜭ਟ㜭ѪオDŽ

к䘠Ⲵ䇘䇪╄⽪Ҷ֯⭘ભ仈ර亶ฏ⨶䇪൘অњ Horn ᆀਕⲴа㡜ࡠ⢩↺ᩌ㍒ѝࡋᔪ‫ٷ‬䇮Ⲵ


‫ى‬䘹⢩ॆᔿⲴ䗷〻DŽ䈕㇇⌅ᖸᇩ᱃㻛ᢙኅࡠа䱦㺘⽪ѝ˄ণਜ਼ᴹਈ䟿Ⲵ㺘⽪˅DŽㅜ 10 ㄐ䈖㓶
䇘䇪Ҷ FOIL ѝ⭏ᡀа䱦 Horn ᆀਕⲴ㇇⌅ˈवᤜк䘠ㅜањ㇇ᆀᢙኅࡠа䱦㺘⽪ⲴᛵߥDŽѪ
ᢙኅㅜҼњ㇇ᆀԕ༴⨶а䱦亶ฏ⨶䇪ˈᗵ享൘ኅᔰ亶ฏ⨶䇪ᰦ㘳㲁ਈ䟿ԓᦒDŽ䘉ਟԕ䙊䗷⎹৺
ࡠ㺘 11-3 എᖂ䗷〻Ⲵа⿽ᯩ⌅ᆼᡀDŽ

12.5.2 䈪᱄

FOCL ֯⭘亶ฏ⨶䇪ᶕ໎࣐⇿↕ᩌ㍒অњ Horn ᆀਕѝ㘳㲁Ⲵ‫ى‬䘹⢩ॆᔿᮠ䟿DŽമ 12-9 ∄


䖳Ҷ FOCL ᢗ㹼Ⲵ‫ٷ‬䇮オ䰤ᩌ㍒ԕ৺㓟ᖂ㓣Ⲵ FOIL ㇇⌅ᢗ㹼Ⲵᩌ㍒DŽFOCL ѝ亶ฏ⨶䇪᧘Ѯ
Ⲵ⢩ॆᔿሩᓄ FOIL ᩌ㍒ѝⲴањĀᆿĀ˄marcro˅↕ˈަѝཊњ᮷ᆇ൘а↕ѝ㻛࣐‫ޕ‬DŽ↔䗷
〻ਟ㻛ⴻᡀᱟሶањਟ㜭ԕਾ㻛㘳㲁Ⲵ‫ٷ‬䇮ᨀॷѪ・ণ㻛㘳㲁Ⲵ‫ٷ‬䇮DŽྲ᷌亶ฏ⨶䇪ᱟ↓⺞
Ⲵˈ䇝㓳ᮠᦞՊᱮ⽪ࠪ↔‫ٷ‬䇮∄ަԆ‫ٷ‬䇮ⲴՈ䎺ᙗˈഐ↔ᆳ㻛䘹ᤙDŽྲ᷌亶ฏ⨶䇪н↓⺞ˈሩ
ᡰᴹ‫ى‬䘹Ⲵ㓿傼ॆ䇴ՠՊሶᩌ㍒ሬੁਖཆаᶑ䐟ᖴDŽ

插图——原书页码:361

Hypotheses that fit training data equally well: ሩ䇝㓳ᮠᦞᴹ਼ㅹᤏਸᓖⲴ‫ٷ‬䇮

FOCL search: FOCL ᩌ㍒


FOIL search: FOIL ᩌ㍒

മ 12-9 ൘ FOCL ѝᩌ㍒Ⲵ‫ٷ‬䇮オ䰤

FOCL ᢙབྷҶ FOIL ѝ֯⭘Ⲵᩌ㍒㇇ᆀ䳶ਸDŽFOIL ൘⇿↕ਚ㘳㲁࣐‫ޕ‬অњᯠ᮷ᆇˈ㘼 FOCL 䘈㘳


㲁࣐‫⭡ޕ‬亶ฏ⨶䇪ሬࠪⲴཊњ᮷ᆇDŽ

ᾲᤜൠ䈤ˈFOCL ֯⭘䈝⌅⭏ᡀⲴ‫ى‬䘹⢩ॆᔿⲴ਼ᰦˈ䘈֯⭘Ҷ亶ฏ⨶䇪傡ࣘⲴ൘ᩌ㍒ѝ
⇿↕Ⲵ‫ى‬䘹⢩ॆ⭏ᡀDŽ䈕㇇⌅䘹ᤙ䘉Ӌ‫ى‬䘹ѫ㾱ᱟสҾᆳԜ൘䇝㓳ᮠᦞкⲴ㓿傼ॆ᭟ᤱDŽഐ
↔ˈ亶ฏ⨶䇪֯⭘ᯩᔿᱟ֯ᆖҐಘ‫ٿ‬㖞ˈն䇙ᆳสҾަ൘䇝㓳ᮠᦞкⲴᙗ㜭䘋㹼ᴰ㓸Ⲵ䘹ᤙDŽ
⭡亶ฏ⨶䇪ᕅ‫Ⲵޕ‬䘉⿽‫ٿ‬㖞㺘⧠ᖒᔿѪ˖Ո‫ݸ‬䘹ᤙ䘉ṧⲴ Horn ᆀਕˈᆳᴰ⴨լҾ亶ฏ⨶䇪⏥
㮤˄entail˅Ⲵ᫽֌රⲴ䙫䗁‫࠶ݵ‬ᶑԦDŽ↔‫ٿ‬㖞о㓟ᖂ㓣Ⲵ FOIL 〻ᒿⲴ‫ٿ‬㖞㔃ਸ൘а䎧DŽਾ䶒
ањ‫ٿ‬㖞Ո‫ݸ‬䘹ᤙ⸝Ⲵ‫ٷ‬䇮DŽ

൘䇨ཊнᆼ㖾亶ฏ⨶䇪Ⲵᓄ⭘ѝˈFOCL ᐢᱮ⽪ࠪ∄㓟ᖂ㓣Ⲵ FOIL ㇇⌅ᴹᴤ儈Ⲵ⌋ॆ㋮


ᓖDŽֻྲ Pazzanzi & Kibler˄1992˅⹄ウҶᆖҐĀਸ⌅ỻⴈ⣦ᘱāᾲᘥⲴ䰞仈DŽ㔉ᇊ 60 њ䇝
㓳ṧֻˈ30 њਸ⌅Ⲵ㓸ⴈỻⴈ⣦ᘱˈ30 њѪнਸ⌅ⲴDŽFOIL ൘а⤜・⍻䈅ṧֻ䳶кᗇԕҶ
86%Ⲵ㋮ᓖDŽFOCL ֯⭘⴨਼Ⲵ 60 њ䇝㓳ṧֻˈԕ৺ањ㋮ᓖѪ 76%Ⲵ䘁լ亶ฏ⨶䇪DŽ㔃᷌ᗇ
ࡠⲴ‫ٷ‬䇮⌋ॆ㋮ᓖѪ 94ˁüü䈟ᐞ⦷∄ FOIL Ⲵаॺ䘈ሿDŽ൘ަԆ亶ฏҏᗇࡠҶ㊫լⲴ㔃᷌DŽ
ֻྲˈ㔉ᇊ 500 њ⭥䈍㖁䰞仈Ⲵ䇝㓳ṧֻˈԕ৺⭥䈍‫ޜ‬ਨ NYNEX ሩᆳԜⲴ䇺ᯝˈFOIL ㋮ᓖ
Ѫ 90%ˈ㘼 FOCL ൘㔉ᇊ⴨਼䇝㓳ᮠᦞԕ৺ 95ˁ㋮ᓖⲴ亶ฏ⨶䇪ᰦˈᴰ㓸䗮ࡠ㋮ᓖѪ 98ˁDŽ

12.6 ⹊ガ⧦⣬

ᵜㄐኅ⽪Ⲵᯩ⌅ਚᱟ㔃ਸ࠶઼᷀ᖂ㓣ᆖҐⲴਟ㜭䙄ᖴѝⲴࠐњֻᆀDŽަѝ⇿њᯩ⌅䜭㻛䇱
᰾൘ᡰ䘹亶ฏѝᙗ㜭䎵ࠪ㓟ᖂ㓣ⲴᆖҐᯩ⌅ˈն⋑ᴹањ൘བྷ㤳തⲴ䰞仈亶ฏѝ㻛ᖫᓅ⍻䈅ᡆ
䇱᰾DŽ㔃ਸᖂ㓣઼࠶᷀ᆖҐⲴѫ仈ӽᱟањ䶎ᑨ⍫䏳Ⲵ⹄ウ亶ฏDŽ

12.7 ቅ㔉ૂ㺛‫ݻ‬䈱⢟

ᵜㄐⲴ㾱⛩वᤜ˖
x 䘁լⲴ‫ݸ‬傼⸕䇶˄ᡆ亶ฏ⨶䇪˅൘䇨ཊᇎ䱵ᆖҐ䰞仈ѝᱟਟ࡙⭘ⲴDŽߣㆆṁ઼⾎
㓿㖁㔌৽ੁՐ᫝䘉ṧⲴ㓟ᖂ㓣ᯩ⌅н㜭࡙⭘䘉ṧⲴ亶ฏ⨶䇪ˈഐ↔൘ᮠᦞ〰㕪ᰦ
ᙗ㜭䖳ᐞDŽProlog-EBG 䘉ṧⲴ㓟࠶᷀ᆖҐᯩ⌅㜭ཏ࡙⭘䘉ṧⲴ亶ฏ⨶䇪ˈն൘㔉
ᇊнᆼ㖾‫ݸ‬傼⸕䇶ᰦՊӗ⭏н↓⺞Ⲵ‫ٷ‬䇮DŽ㔃ਸᖂ㓣઼࠶᷀ᆖҐⲴᯩ⌅ਟԕ㧧ᗇ
є㘵ⲴՈ⛩ˈ߿ሿṧᵜ༽ᵲᓖˈᒦф੖ߣн↓⺞Ⲵ‫ݸ‬傼⸕䇶DŽ
x ⴻᖵ㔃ਸᖂ㓣઼࠶᷀ᆖҐ㇇⌅Ⲵа⿽ᯩ⌅ᱟˈ㘳㲁亶ฏ⨶䇪ᱟྲօᖡ૽‫ٷ‬䇮オ䰤
ᩌ㍒ⲴDŽᵜㄐᡁԜ㘳ḕҶࠐ⿽ᯩ⌅ˈᆳԜ֯⭘нᆼ㖾Ⲵ亶ฏ⨶䇪DŽ˄1˅ࡋᔪᩌ㍒
ѝⲴࡍ࿻‫ٷ‬䇮ˈ˄2˅ᢙ‫ݵ‬ᖃࡽ‫ٷ‬䇮Ⲵᩌ㍒㇇ᆀ䳶ਸˈ˄3˅᭩ਈᩌ㍒ⴞⲴDŽ
x ֯⭘亶ฏ⨶䇪ᶕࡍ࿻ॆ‫ٷ‬䇮Ⲵањ㌫㔏ᱟ KBANNDŽ↔㇇⌅֯⭘а྇㕆⸱Ѫભ仈㿴
ࡉⲴ亶ฏ⨶䇪ᶕ࠶᷀ൠࡋᔪㅹԧҾ亶ฏ⨶䇪Ⲵ⾎㓿㖁㔌DŽ❦ਾ↔㖁㔌㻛৽ੁՐ᫝
㇇⌅ᖂ㓣ൠ㋮ॆˈԕ᭩䘋ަ൘䇝㓳ᮠᦞкⲴᙗ㜭DŽ㔃᷌ᱟањ㻛৏࿻亶ฏ⨶䇪‫ٿ‬
㖞Ⲵ㖁㔌ˈަᵳ٬㻛สҾ䇝㓳ᮠᦞᖂ㓣㋮ॆDŽ
x TangentProp ֯⭘Ⲵ‫ݸ‬傼⸕䇶㻛㺘⽪Ѫⴞḷ࠭ᮠⲴᡰᐼᵋⲴሬᮠDŽ൘ḀӋ亶ฏᰦˈ
ྲമ‫ۿ‬༴⨶ˈ䘉ṧ㺘⽪‫ݸ‬傼⸕䇶Ⲵањᖸ㠚❦Ⲵᯩ⌅DŽTangentProp 䙊䗷᭩ਈⴞⲴ
࠭ᮠ֯⭘䘉а⸕䇶ˈ↔࠭ᮠ൘ᩌ㍒‫ٷ‬䇮オ䰤Ⲵởᓖл䱽ѝ㻛ᴰሿॆDŽ
x EBNN ֯⭘亶ฏ⨶䇪᭩ਈӪᐕ⾎㓿㖁㔌ᩌ㍒Ⲵ‫ٷ‬䇮オ䰤ⲴⴞḷDŽᆳ֯⭘Ⲵ亶ฏ⨶䇪
⭡亴‫ݸ‬ᆖҐⲴ⾎㓿㖁㔌㓴ᡀˈަ֌⭘ᱟᇎ⧠ањ⾎㓿㖁㔌ˈԕ⁑ᤏㅖਧⲴสҾ䀓
䟺ᆖҐDŽྲ൘ㅖਧⲴสҾ䀓䟺ⲴᆖҐѝаṧˈ亶ฏ⨶䇪㻛⭘Ҿ䀓䟺অњṧֻˈ㧧
ᗇн਼ṧֻ⢩ᖱⲴ⴨‫ޣ‬〻ᓖⲴؑ᚟DŽ❦㘼൘⾎㓿㖁㔌㺘⽪ѝˈᴹ‫ޣ⴨ޣ‬ᙗⲴؑ᚟
㻛㺘⽪Ѫⴞḷ࠭ᮠሩᓄҾᇎֻ⢩ᖱⲴሬᮠDŽ㖁㔌‫ٷ‬䇮Ⲵ䇝㓳֯⭘Ҷ TangentProp ㇇
⌅Ⲵањਈ⿽ˈަѝ㻛ᴰሿॆⲴ䈟ᐞнӵवਜ਼Ҷ㖁㔌䗃ࠪ٬Ⲵ䈟ᐞˈ䘈वਜ਼ҶӾ
䀓䟺ѝ㧧ᗇⲴ㖁㔌ሬᮠⲴ䈟ᐞDŽ
x FOCL ֯⭘亶ฏ⨶䇪ᶕᢙኅ⇿↕ᩌ㍒ѝ㘳㲁ⲴⲴ‫ى‬䘹䳶DŽᆳ֯⭘㺘⽪Ѫа䱦 Horn
ᆀਕⲴ䘁լ亶ฏ⨶䇪ᶕᆖҐа㓴䙬䘁ⴞḷ࠭ᮠⲴ Horn ᆀਕDŽFOCL ᓄ⭘Ҷᒿࡇ㾶
ⴆ㇇⌅ˈ䙊䗷а㡜ࡠ⢩↺ᩌ㍒䗷〻ᶕᆖҐ⇿њ Horn ᆀਕDŽ亶ฏ⨶䇪㻛⭘Ҿᢙབྷ↔
ᩌ㍒ѝ⇿↕㘳㲁Ⲵлањᴤ⢩↺‫ى‬䘹‫ٷ‬䇮䳶DŽ❦ਾ‫ى‬䘹‫ٷ‬䇮สҾަ൘䇝㓳ᮠᦞк
Ⲵᙗ㜭㻛䇴ՠDŽԕ䘉⿽ᯩ⌅ˈFOCL 㔃ਸҶ FOIL Ⲵ䍚ႚⲴǃа㡜ࡠ⢩↺ᩌ㍒ㆆ
⮕ˈԕ৺࠶᷀ᯩ⌅ѝⲴ㿴ࡉ䬮࠶᷀᧘⨶DŽ
x ྲօᴰྭൠ㶽ਸ‫ݸ‬傼⸕䇶ࡠᯠ㿲ሏһ⢙ѝⲴ䰞仈ˈӽᱟᵪಘᆖҐѝѫ㾱Ⲵᖵ䀓ߣ
䰞仈ѻаDŽ

䘈ᴹ䇨ཊ⿽㇇⌅䈅മ㔃ਸᖂ㓣઼࠶᷀ᆖҐDŽֻྲˈㅜ 6 ㄐ䇘䇪ⲴᆖҐ䍍ਦᯟ㖞ؑ㖁Ⲵᯩ⌅
ᨀ‫׋‬Ҷਖа⿽䙄ᖴDŽᵜㄐᵛቮⲴ৲㘳᮷⥞ᨀ‫׋‬Ҷ䘋а↕䰵䈫ⲴֻᆀᶕⓀDŽ
Ґ仈

12.1 㘳㲁ᆖҐањⴞḷᾲᘥ GoodCreditRiskˈᆳᇊѹ൘Ḁᇎֻ᧿䘠ѻкˈᇎֻ᧿䘠वਜ਼ 4


њ኎ᙗ HasStudentLoan, HasSavingsAccount, IsStudent, OwnsCarDŽሩҾл䶒Ⲵ亶ฏ⨶䇪ˈ㔉ࠪ
KBANN ࡋᔪⲴࡍ࿻㖁㔌ˈवᤜᡰᴹⲴ㖁㔌䘎᧕઼ᵳ٬DŽ

GoodCreditRiskĕEmpolyed, LowDebt
Employedĕ™IsStudent
LowDebtĕ™HasStudentLoan, HasSavingsAccount

12.2 KBANN ሶа㓴ભ仈 Horn ᆀਕਈᦒѪањࡍ࿻⾎㓿㖁㔌DŽ㘳㲁а㊫ n-of-m ᆀਕˈ䘉


⿽ Horn ᆀਕࡽԦ˄‫ݸ‬㹼䇽˅ѝवਜ਼ m њ᮷ᆇˈᒦфवਜ਼а‫ޣ‬㚄Ⲵ৲ᮠ nˈnİmDŽᖃ m њࡽԦ
ѝ㠣ቁ n њ┑䏣ᰦˈ↔ n-of-m Horn ᆀਕ㻛䇔Ѫ┑䏣DŽֻྲˈᆀਕ˖

StudentĕLivesInDorm, Young, Studies; n=2

ᯝ䀰ྲ᷌ 3 њࡽԦѝ㠣ቁєњ┑䏣ᰦˈ↔ӪѪ StudentDŽ

㔉ࠪо KBANN ⴨լⲴањ㇇⌅ˈᆳ᧕ਇа㓴ભ仈ර n-of-m ᆀਕᒦф㜭ᶴ䙐ࠪо亶ฏ⨶


䇪а㠤Ⲵ⾎㓿㖁㔌DŽ

12.3 䈅ሶ KBANN ᢙኅˈԕ᧕ਇवਜ਼а䱦 Horn ᆀਕⲴ亶ฏ⨶䇪ˈ㘼нਚᱟભ仈 Horn ᆀ


ਕDŽ˄ণ‫ݱ‬䇨 Horn ᆀਕवਜ਼ਈ䟿ˈྲㅜ 10 ㄐѝ䛓ṧ˅DŽ㔉ࠪањ㇇⌅ԕᶴ䙐ㅹԧҾањ
Horn ᆀਕ䳶Ⲵ⾎㓿㖁㔌ˈྲ᷌н㜭ࡉ䇘䇪ަѝⲴഠ䳮ᡰ൘DŽ

12.4 ↔Ґ仈㾱≲᧘ሬࠪ㊫լҾ TangentProp ֯⭘Ⲵởᓖл䱽⌅ࡉDŽ㘳㲁ᇎֻオ䰤 X ⭡ᇎᮠ


ᶴᡀˈ㘼‫ٷ‬䇮オ䰤 H ⭡ x ⲴҼ⅑࠭ᮠᶴᡀDŽণ⇿њ‫ٷ‬䇮ᖒᔿѪ˖

h(x)=w0+w1x+w2x2

˄a˅᧘ሬањởᓖл䱽⌅ࡉˈᆳᴰሿॆ৽ੁՐ᫝ѝ⴨਼Ⲵࡔᦞ˖ণ൘‫ٷ‬䇮઼䇝㓳ᮠᦞⴞ
ḷ٬ѻ䰤Ⲵ䈟ᐞᒣᯩ઼DŽ

˄b˅᧘ሬањởᓖл䱽⌅ࡉˈᆳᴰሿॆ TangentProp ѝ⴨਼ⲴࡔᦞDŽਚ㘳㲁ањਈᦒ


s(¢,x)=x+¢

12.5 EBNNӾ䀓䟺ѝᣭਆ䇝㓳ሬᮠⲴᯩ⌅ᱟˈ㘳㲁ᶴᡀ䀓䟺Ⲵ⾎㓿㖁㔌Ⲵᵳ٬઼◰⍫⣦
ᘱDŽ㘳㲁ањㆰঅⲴֻᆀˈަѝ䀓䟺ⲴᖒᔿѪᴹnњ䗃‫Ⲵޕ‬অњsigmoidঅ‫ݳ‬DŽ᧘ሬањ䗷〻ԕ
wfˆ ( x)
ᣭਆሬᮠ ˈަѝxiѪ䗃‫↔ࡠޕ‬অ‫Ⲵݳ‬⢩ᇊ䇝㓳ᇎֻˈ fˆ ( x ) Ѫsigmoidঅ‫ݳ‬䗃ࠪˈᒦф
wx j x xi

x ԓ㺘sigmoidঅ‫ݳ‬ㅜjњ䗃‫ޕ‬DŽҏਟԕ֯⭘䇠ਧxijԓ㺘xiⲴㅜjњ࠶䟿DŽᨀ⽪˖䈕ሬᮠо৽ੁՐ᫝
j

䇝㓳⌅ࡉѝⲴሬᮠ⴨լDŽ
12.6 ޽⅑㘳㲁മ 12-8 ѝᱮ⽪Ⲵ FOCL Ⲵᩌ㍒↕僔DŽ‫ྲٷ‬൘ᩌ㍒Ⲵㅜаቲ䘹ᤙⲴ‫ٷ‬䇮᭩
Ѫ˖

Cupĕ™HasHandle

᧿䘠 FOCL ⭏ᡀⲴ֌Ѫ↔‫ٷ‬䇮ਾ㔗ⲴㅜҼቲ‫ى‬䘹‫ٷ‬䇮DŽਚ䴰㾱वᤜ䛓Ӌ⭡ FOCL ⲴㅜҼњ


ᩌ㍒㇇ᆀ⭏ᡀⲴ‫ٷ‬䇮ˈণ֯⭘亶ฏ⨶䇪⭏ᡀⲴ‫ٷ‬䇮DŽн㾱ᘈ䇠ሩ‫࠶ݵ‬ᶑԦ䘋㹼ਾ‫࢚؞‬DŽ֯⭘㺘
12-3 ѝⲴ䇝㓳ᮠᦞDŽ

12.7 ᵜㄐ䇘䇪Ҷ 3 ⿽䙄ᖴᶕ֯⭘‫ݸ‬傼⸕䇶ԕᖡ૽‫ٷ‬䇮オ䰤Ⲵᩌ㍒DŽ֐䇔Ѫྲօ䳶ᡀ䘉й⿽


ᯩ⌅˛㜭੖ᨀࠪањ⢩↺㇇⌅ˈᆳ䳶ᡀҶ㠣ቁє⿽㇇⌅ԕ䪸ሩḀ⿽⢩↺Ⲵ‫ٷ‬䇮㺘⽪DŽ൘↔䳶ᡀ
ѝᴹӰѸṧⲴՈ㕪⛩˛

12.8 ޽⅑㘳㲁 12.2.1 㢲ѝⲴ䰞仈ˈণᖃᮠᦞ઼‫ݸ‬傼⸕䇶䜭ᆈ൘ᰦˈᓄ֯⭘ӰѸṧⲴ߶ࡉ൘


‫ٷ‬䇮ѝ䘋㹼䘹ᤙDŽ㔉ࠪ֐൘䘉њ䰞仈кⲴ㿱䀓DŽ
ㅢ13ㄖ ໔ᕰᆜҖ

໎ᕪᆖҐ㾱䀓ߣⲴᱟ䘉ṧⲴ䰞仈˖ањ㜭ཏᝏ⸕⧟ຳⲴ㠚⋫ agentˈᘾṧᆖҐ䘹ᤙ㜭䗮ࡠ
ަⴞḷⲴᴰՈࣘ֌DŽ䘉њᖸާᴹᲞ䙽ᙗⲴ䰞仈ᓄ⭘ҾᆖҐ᧗ࡦ〫ࣘᵪಘӪǃ൘ᐕলѝᆖҐ䘋㹼
ᴰՈ᫽֌ᐕᒿǃԕ৺ᆖҐỻ㊫ሩᔸㅹDŽᖃ agent ൘ަ⧟ຳѝ֌ࠪ⇿њࣘ֌ᰦˈᯭᮉ㘵Պᨀ‫྆׋‬
䍿ᡆ᜙㖊ؑ᚟ˈԕ㺘⽪㔃᷌⣦ᘱⲴ↓⺞о੖DŽֻྲˈ൘䇝㓳 agent 䘋㹼ỻ㊫ሩᔸᰦˈᯭᮉ㘵ਟ
൘⑨ᠿ㜌࡙ᰦ㔉ࠪ↓എᣕˈ㘼൘⑨ᠿཡ䍕ᰦ㔉ࠪ䍏എᣕˈަԆᰦ‫ى‬Ѫ䴦എᣕDŽAgent Ⲵԫ࣑ቡ
ᱟӾ䘉њ䶎ⴤ᧕Ⲵǃᴹᔦ䘏ⲴഎᣕѝᆖҐˈԕ‫ׯ‬ਾ㔝Ⲵࣘ֌ӗ⭏ᴰབྷⲴ㍟〟എᣕDŽᵜㄐ⵰䟽ӻ
㓽ањ〠Ѫ Q ᆖҐⲴ㇇⌅ˈᆳਟӾᴹᔦ䘏Ⲵഎᣕѝ㧧ਆᴰՈ᧗ࡦㆆ⮕ˈণ֯ agent ⋑ᴹᴹ‫ަޣ‬
ࣘ֌Պሩ⧟ຳӗ⭏ᘾṧⲴ᭸᷌Ⲵ‫ݸ‬傼⸕䇶DŽ໎ᕪᆖҐоࣘᘱ㿴ࡂ˄dynamic programming˅㇇⌅
ᴹ‫ˈޣ‬ਾ㘵ᑨ㻛⭘Ҿ䀓ߣᴰՈॆ䰞仈DŽ

13.1 ԁ㔃

㘳㲁ᔪ䙐ањਟᆖҐᵪಘӪDŽ䈕ᵪಘӪ˄ᡆ agent˅ᴹаӋՐᝏಘਟԕ㿲ሏަ⧟ຳⲴ⣦ᘱ
˄state˅ᒦ㜭‫ࠪڊ‬а㓴ࣘ֌˄action˅ᐢ᭩ਈ䘉Ӌ⣦ᘱDŽֻྲˈ〫ࣘᵪಘӪާᴹ䮌ཤ઼༠㓣ㅹ
Րᝏಘˈᒦਟԕ‫ࠪڊ‬Āⴤ䎠ā઼Ā䖜ᕟāㅹࣘ֌DŽᆖҐⲴԫ࣑ᱟ㧧ᗇањ᧗ࡦㆆ⮕
˄policy˅ˈԕ䘹ᤙ㜭䗮ࡠⴞⲴⲴ㹼ѪDŽֻྲˈ↔ᵪಘӪⲴԫ࣑ᱟ൘ަ⭥⊐⭥䟿䖜վᰦ᢮ࡠ‫ݵ‬
⭥ಘ䘋㹼‫⭥ݵ‬DŽ

ᵜㄐ‫ޣ‬ᗳⲴቡᱟ˖䘉ṧⲴ agent ᘾṧ൘ަ⧟ຳѝ‫ڊ‬ᇎ傼ᒦᡀ࣏ൠᆖҐࡠ᧗ࡦㆆ⮕DŽ䘉䟼‫ٷ‬


ᇊ agent Ⲵⴞḷਟ㻛ᇊѹѪањഎᣕ˄reward˅࠭ᮠˈᆳሩ agent Ӿн਼Ⲵ⣦ᘱѝ䘹ਆн਼Ⲵࣘ
֌䍻Ҹањᮠᆇ٬ˈণ・ণ␵㇇˄immediate payoff˅DŽֻྲ˖ራ᢮⭥⊐‫⭥ݵ‬ಘⲴⴞḷਟ⭘䘉ṧ
Ⲵഎᣕ࠭ᮠᤷᇊ˖ሩ䛓Ӌ㜭ཏ䘎᧕ࡠ‫⭥ݵ‬ಘⲴ⣦ᘱ-ࣘ֌䖜ᦒ䍻Ҹ↓എᣕ˄ྲ+100˅ˈሩަԆ
Ⲵ⣦ᘱࣘ֌䖜ᦒ䍻Ҹ 0 എᣕDŽ䘉њഎᣕ࠭ᮠਟ޵፼൘ᵪಘӪѝ˗ᡆ㘵ਚᴹањཆ䜘ᯭᮉ㘵⸕
䚃ˈ⭡ᆳሩᵪಘӪⲴ⇿њࣘ֌㔉ࠪഎᣕ٬DŽᵪಘӪⲴԫ࣑ᱟᢗ㹼а㌫ࡇࣘ֌ˈ㿲ሏަਾ᷌ˈ޽
ᆖҐ᧗ࡦㆆ⮕DŽᡁԜᐼᵋⲴ᧗ࡦㆆ⮕ᱟ㜭ཏӾԫօࡍ࿻⣦ᘱ䘹ᤙᚠᖃⲴࣘ֌ˈ֯ agent 䲿ᰦ䰤
Ⲵ㍟〟Ⲵഎᣕ䗮ࡠᴰབྷDŽ䘉њᵪಘӪᆖҐ䰞仈Ⲵа㡜Ṷᷦ൘മ 13-1 ѝᾲ㾱ࡇࠪDŽ

插图——原书页码:368
Agent: Agent
State: ⣦ᘱ
Reward: എᣕ
Action: ࣘ֌
Environment: ⧟ຳ
Goal:Learn to choose actions that maximize˖ ⴞḷ˖ᆖҐ䘹ᤙࣘ֌֯лᔿᴰབྷॆ
where: ަѝ
മ 13-1 ањо⧟ຳӔӂⲴ agent

↔agent⭏ᆈⲴ⧟ຳ㻛᧿䘠ѪḀਟ㜭Ⲵ⣦ᘱ䳶ਸSDŽᆳਟᢗ㹼ԫ᜿Ⲵਟ㜭ࣘ֌䳶ਸADŽ⇿⅑൘Ḁ⣦
ᘱstлᢗ㹼аࣘ֌atˈ↔agentՊ᭦ࡠањᇎ٬എᣕrtˈᆳ㺘⽪↔⣦ᘱ-ࣘ֌䖜ᦒⲴ・ণ٬DŽྲ↔ӗ⭏Ҷа
㌫ࡇⲴ⣦ᘱsiˈࣘ֌ai઼・ণഎᣕriⲴ䳶ਸˈྲമᡰ⽪DŽAgentⲴԫ࣑ᱟᆖҐањ᧗ࡦㆆ⮕±:SėAˈᆳ
֯䘉ӋഎᣕⲴ઼Ⲵᵏᵋ٬ᴰབྷॆˈަѝਾ䶒Ⲵ≷ᣕ٬䲿⵰ԆԜⲴᔦ䘏ᤷᮠ߿ሿDŽ

മ 13-1 ѝਟ␵ᾊൠⴻࡠˈᆖҐ᧗ࡦㆆ⮕ԕ֯㍟〟എᣕᴰབྷॆ䘉њ䰞仈䶎ᑨᲞ䙽ˈᆳ㾶ⴆ
ҶᵪಘӪᆖҐԫ࣑ԕཆⲴ䇨ཊ䰞仈DŽа㡜ൠˈ↔䰞仈ᱟањ䙊䗷ᆖҐᶕ᧗ࡦᒿࡇ䗷〻Ⲵ䰞仈DŽ
ֻྲ⭏ӗՈॆ䰞仈ˈަѝ㾱䘹ᤙа㌫ࡇⲴ⭏ӗࣘ֌ˈ㘼֯⭏ӗࠪⲴ䍗⢙߿৫ަᡀᵜ䗮ࡠᴰབྷ
ॆDŽ޽ྲаӋᒿࡇ䈳ᓖ䰞仈ˈ‫ۿ‬൘ањབྷ෾ᐲѝ䘹ᤙࠪ』䖖䘀䖭҈ᇒˈަѝഎᣕ࠭ᮠѪ҈ᇒㅹ
ᖵⲴᰦ䰤઼ࠪ』䖖䱏Ⲵᮤփ⋩㙇DŽа㡜ᶕ䈤ˈᡁԜᝏ‫ޤ‬䏓Ⲵ䰞仈㊫රᱟ˖ањ agent 䴰㾱䙊䗷
ᆖҐ઼䘹ᤙࣘ֌ᶕ᭩ਈ⧟ຳ⣦ᘱˈ㘼ަѝ֯⭘Ҷањ㍟〟എᣕ࠭ᮠᶕᇊѹԫ᜿ࣘ֌ᒿࡇⲴ䍘
䟿DŽ൘↔㊫䰞仈ѝDŽᡁԜ㘳㲁ࠐ⿽⢩↺ⲴṶᷦ˖वᤜࣘ֌ᱟ੖ާᴹ⺞ᇊᙗⲴ䗃ࠪ˗agent ᱟ੖
ᴹަࣘ֌ሩ⧟ຳⲴ᭸᷌Ⲵ‫ݸ‬傼⸕䇶DŽ

൘ᵜҖࡽ䶒ˈᡁԜᐢ㓿᧕䀖ࡠҶ䙊䗷ᆖҐᶕ᧗ࡦᒿࡇ䗷〻Ⲵ䰞仈DŽ൘ㅜ 11.4 㢲ѝDŽᡁԜ


䇘䇪Ҷ⭘สҾ䀓䟺Ⲵᯩ⌅ᆖҐ㿴ࡉˈԕ᧗ࡦ䰞仈䀓ߣѝⲴᩌ㍒DŽ൘ަѝ agent ⲴⴞⲴᱟ൘ᩌ㍒
ަⴞḷ⣦ᘱᰦⲴ⇿а↕Ӿਟ䘹ࣘ֌ѝ‫ࠪڊ‬ᢹᤙDŽᵜㄐ䇘䇪Ⲵᢰᵟн਼Ҿ 11.4 㢲ˈഐѪ䘉䟼㘳
㲁Ⲵ䰞仈ѝ㹼Ѫਟ㜭ᴹ䶎⺞ᇊᙗⲴ䗃ࠪˈ㘼фᆖҐಘ㕪ቁ᧿䘠ަ㹼Ѫ䗃ࠪⲴ亶ฏ⨶䇪DŽ൘ㅜ 1
ㄐˈᡁԜ䇘䇪Ҷ൘㾯⌻ৼ䱶ỻሩᔸѝⲴᆖҐ䰞仈DŽަѝᾲ䘠ⲴᆖҐᯩ⌅䶎ᑨ㊫լҾᵜㄐⲴᆖҐ
ᯩ ⌅ DŽ ᇎ 䱵 к ᵜ ㄐ Ⲵ ໎ ᕪ ᆖ Ґ ㇇ ⌅ Ⲵ а њ ᴰ ᡀ ࣏ Ⲵ ᓄ ⭘ ቡ ᱟ ㊫ լ Ⲵ ঊ ᔸ 䰞 仈 DŽ Tesauro
˄1995˅᧿䘠Ⲵ TD-Gammon 〻ᒿˈᆳ֯⭘໎ᕪᆖҐᡀѪҶц⭼㓗Ⲵ㾯⌻ৼ䱶ỻ䘹᡻DŽ䘉њ〻
ᒿ㓿䗷Ҷ 150 зњ㠚⭏ᡀⲴሩᔸ䇝㓳ਾˈᐢ䘁լ䗮ࡠҶӪ㊫ᴰྭ䘹᡻Ⲵ≤ᒣˈᒦф൘ഭ䱵㾯⌻
ৼ䱶ỻ㚄䎋ѝо亦ቆỻ᡻ሩᔸਆᗇҶ㢟ྭⲴᡀ㔙DŽ

ᆖҐ᧗ࡦㆆ⮕ԕ䘹ᤙࣘ֌Ⲵ䰞仈൘Ḁ⿽〻ᓖк㊫լҾަԆㄐ䇘䇪䗷Ⲵ࠭ᮠ䙬䘁䰞仈DŽ䘉䟼
ᖵᆖҐⲴⴞḷ࠭ᮠѪ᧗ࡦㆆ⮕±:SėADŽᆳ൘㔉ᇊᖃࡽ⣦ᘱ S 䳶ਸѝⲴ s ᰦˈӾ䳶ਸ A ѝ䗃ࠪ
ањਸ䘲Ⲵࣘ֌ aDŽ❦㘼ˈ໎ᕪᆖҐ䰞仈оަԆⲴ࠭ᮠ䙬䘁䰞仈ᴹࠐњ䟽㾱н਼˖
x ᔦ䘏എᣕ˄delayed reward˅DŽ Agent Ⲵԫ࣑ᱟᆖҐањⴞḷ࠭ᮠ±DŽᆳᢺᖃࡽ⣦
ᘱ s ᱐ሴࡠᴰՈࣘ֌ a=±(s)DŽ൘ࡽ䶒ㄐ㢲ѝˈᡁԜᙫᱟ‫ٷ‬ᇊ൘ᆖҐ±䘉ṧⲴⴞḷ
࠭ᮠᰦˈ⇿њ䇝㓳ṧֻᱟᒿ‫Ⲵڦ‬ᖒᔿ<s, ±(s)>DŽ❦㘼൘໎ᕪᆖҐѝˈ䇝㓳ؑ᚟н
㜭ԕ䘉⿽ᖒᔿᗇࡠDŽ⴨৽ˈᯭᮉ㘵ਚ൘ agent ᢗ㹼ަᒿࡇࣘ֌ᰦᨀ‫׋‬ањᒿࡇ・ণ
എᣕ٬ˈഐ↔ agent 䶒Ѥањᰦ䰤ؑ⭘࠶䝽˄temporal credit assignment ˅Ⲵ䰞仈˖
⺞ᇊᴰ㓸എᣕⲴ⭏ᡀᓄᖂ࣏Ҿަᒿࡇѝଚањࣘ֌DŽ
x ᧒㍒˄exploration ˅DŽ൘໎ᕪᆖҐѝˈagent 䙊䗷ަ䘹ᤙⲴࣘ֌ᒿࡇᖡ૽䇝㓳ṧֻ
Ⲵ࠶ᐳDŽ䘉ӗ⭏Ҷањ䰞仈˖ଚ⿽ᇎ傼ㆆ⮕ਟӗ⭏ᴰᴹ᭸ⲴᆖҐDŽᆖҐಘ䶒ѤⲴ
ᱟањᣈѝⲴ䰞仈˖ᱟ䘹ᤙ᧒㍒ᵚ⸕Ⲵ⣦ᘱ઼ࣘ֌˄ԕ᭦䳶ᯠؑ᚟˅ˈ䘈ᱟ䘹ᤙ
ᆳᐢ㓿ᆖҐ䗷ǃՊӗ⭏儈എᣕⲴ⣦ᘱ઼ࣘ֌˄ԕ֯㍟〟എᣕᴰབྷॆ˅DŽ
x 䜘࠶ਟ㿲ሏ⣦ᘱ˄partially observable states˅DŽ㲭❦ѪҶᯩ‫ׯ‬䎧㿱ˈਟԕ‫ٷ‬ᇊ agent
Րᝏಘ൘⇿а↕ਟᝏ⸕ࡠ⧟ຳⲴ‫ޘ‬䜘⣦ᘱˈն൘ᇎ䱵ⲴᛵߥлՐᝏಘਚ㜭ᨀ‫׋‬䜘
࠶ؑ᚟DŽֻྲ˖ᑖᴹࡽੁ䮌ཤⲴᵪಘӪн㜭ⴻࡠᆳਾ䶒ⲴᛵߥDŽ൘↔ᛵߥлਟ㜭
䴰㾱㔃ਸ㘳㲁ަԕࡽⲴ㿲ሏԕ৺ᖃࡽⲴՐᝏಘᮠᦞԕ䘹ᤙࣘ֌ˈ㘼ᴰ֣Ⲵㆆ⮕ᴹ
ਟ㜭ᱟ䘹ᤙ⢩ᇊⲴࣘ֌ԕ᭩䘋⧟ຳਟ㿲ሏᙗDŽ
x 䮯ᵏᆖҐ˄life-long learning˅DŽн䊑࠶⿫Ⲵ࠭ᮠ䙬䘁ԫ࣑ˈᵪಘӪᆖҐ䰞仈㓿ᑨ㾱
≲↔ᵪಘӪ൘⴨਼Ⲵ⧟ຳл֯⭘⴨਼ⲴՐᝏಘᆖҐཊњ⴨‫ޣ‬ԫ࣑DŽᘾṧ൘ゴሿⲴ
䎠ᓺѝ㹼䎠ˈԕ৺ᘾṧӾ◰‫ݹ‬ᢃঠᵪѝਆᗇᢃঠ㓨ㅹDŽ䘉֯ᗇᴹਟ㜭֯⭘‫ࡽݸ‬㧧
ᗇⲴ㓿傼ᡆ⸕䇶൘ᆖҐᯠԫ࣑ᰦ߿ሿṧᵜ༽ᵲᓖDŽ

13.2 ᆜҖԱࣗ

൘ᵜ㢲ѝˈᡁԜᢺᆖҐᒿࡇ᧗ࡦㆆ⮕Ⲵ䰞仈ᴤ㋮⺞ൠᖒᔿॆDŽᴹ䇨ཊ⿽ᯩ⌅ਟԕ‫ࡠڊ‬DŽֻ
ྲ˖ਟ‫ٷ‬ᇊ agent Ⲵ㹼Ѫᱟ⺞ᇊᙗᡆ䶎⺞ᇊᙗⲴ˗‫ٷ‬ᇊ agent ਟԕ亴⍻⇿ањ㹼Ѫᡰӗ⭏Ⲵ⣦
ᘱˈᡆн㜭亴⍻˗‫ٷ‬ᇊ agent ᱟ⭡ཆ䜘уᇦ䙊䗷⽪ֻᴰՈࣘ֌ᒿࡇᶕ䇝㓳ˈᡆᗵ享䙊䗷ᢗ㹼㠚
ᐡ䘹ᤙⲴࣘ֌ᶕ䇝㓳DŽ䘉䟼ᡁԜสҾ傜ቄਟཛߣㆆ䗷〻ᇊѹ䈕䰞仈Ⲵа㡜ᖒᔿDŽ䘉⿽䰞仈ᖒᔿ
䚥ᗚമ 13-1 ⽪ֻⲴ䰞仈DŽ

൘傜ቄਟཛߣㆆ䗷〻˄Markov decision processˈMDP˅ѝˈagent ਟᝏ⸕ࡠަ⧟ຳⲴн਼


⣦ᘱ䳶ਸSˈᒦфᴹᆳਟᢗ㹼Ⲵࣘ֌䳶ਸADŽ൘⇿њ⿫ᮓᰦ䰤↕tˈagent ᝏ⸕ࡠᖃࡽ⣦ᘱst ˈ䘹
ᤙᖃࡽࣘ֌at ᒦᢗ㹼ᆳDŽ⧟ຳ૽ᓄ↔agentˈ㔉ࠪഎᣕ rt=r(st, at)ˈᒦӗ⭏ањਾ㔗⣦ᘱSt+1=¥
(st, at)DŽ䘉䟼࠭ᮠ¥઼rᱟ⧟ຳⲴа䜘࠶ˈagent нᗵ⸕䚃DŽ൘MDPѝˈ࠭ᮠ¥(st, at)઼r(st, at)ਚ
‫׍‬䎆Ҿᖃࡽ⣦ᘱ઼ࣘ֌ˈ㘼н‫׍‬䎆ҾԕࡽⲴ⣦ᘱ઼ࣘ֌DŽᵜㄐѝᡁԜਚ㘳㲁S઼AѪᴹ䲀Ⲵᛵ
ᖒDŽа㡜ᶕ䈤ˈ¥઼rਟѪ䶎⺞ᇊᙗ࠭ᮠˈնᡁԜ俆‫ݸ‬Ӿ⺞ᇊᙗⲴᛵᖒᔰ࿻DŽ

AgentⲴԫ࣑ᱟᆖҐањㆆ⮕±:SėAˈԕสҾᖃࡽ㿲ሏࡠⲴ⣦ᘱst䘹ᤙлⲴа↕ࣘ֌at˗ণ
±(st)=atDŽྲօ㋮⺞ᤷᇊ↔agent㾱ᆖҐⲴㆆ⮕±઒˛ањ᰾ᱮⲴᯩ⌅ᱟ㾱≲↔ㆆ⮕ሩᵪಘӪӗ
⭏ᴰབྷⲴ〟㍟എᣕDŽѪ㋮⺞ൠ㺘䘠䘉њ㾱≲ˈᡁԜᇊѹ˖䙊䗷䚥ᗚањԫ᜿ㆆ⮕±Ӿԫ᜿ࡍ࿻
±
⣦ᘱst㧧ᗇⲴ㍟〟٬V (st)Ѫ˖

V S ( st ) { rt  Jrt 1  J 2 rt  2  ...

f
{ ¦ J i rt i ˄13.1˅
i 0

ަѝഎᣕᒿࡇrt+iⲴ⭏ᡀᱟ䙊䗷⭡⣦ᘱstᔰ࿻ᒦ䟽༽֯⭘ㆆ⮕±ᶕ䘹ᤙк䘠Ⲵࣘ֌˄ྲat=±
(st)ˈat+1=±(st+1)ㅹ˅DŽ䘉䟼 0ݤ<1 Ѫаᑨ䟿ˈᆳ⺞ᇊҶᔦ䘏എᣕо・ণഎᣕⲴ⴨ሩ٬DŽ⺞
࠷ൠ䇢ˈ൘ᵚᶕⲴㅜiᰦ䰤↕᭦ࡠⲴഎᣕ㻛ഐᆀ¤iԕᤷᮠ㓗ᣈ㇇DŽ⌘᜿ྲ᷌䇮㖞¤=0ˈ䛓Ѹਚ
㘳㲁・ণഎᣕDŽᖃ¤㻛䇮㖞Ѫ᧕䘁 1 Ⲵ٬ᰦˈᵚᶕⲴഎᣕ⴨ሩҾ・ণഎᣕᴹᴤབྷⲴ䟽㾱〻ᓖDŽ

±
⭡ᔿ 13.1 ᇊѹⲴ䟿V (s)ᑨ㻛〠Ѫ⭡ㆆ⮕±Ӿࡍ࿻⣦ᘱs㧧ᗇⲴᣈ㇇㍟〟എᣕ˄discounted
cumulative reward˅DŽᢺᵚᶕⲴഎᣕ⴨ሩҾ・ণഎᣕ䘋㹼ᣈ㇇ᱟਸ⨶ⲴˈഐѪ൘䇨ཊⲴᛵߥ
лˈᡁԜ㾱ᐼᵋ㧧ᗇᴤᘛⲴഎᣕDŽн䗷ˈަԆⲴᮤփഎᣕᇊѹҏ㻛⹄ウ䗷DŽֻྲ˖ᴹ䲀≤ᒣഎ
¦
h
ᣕ˄finite horizon reward ˅ᇊѹѪ r
i 0 t i
ˈᆳ䇑㇇ᴹ䲀Ⲵh↕޵എᣕⲴ䶎ᣈ㇇઼DŽਖа⿽ᇊ
1 h
ѹᯩᔿᱟᒣ൷എᣕ˄average raward ˅ lim hof ¦ rt i DŽᆳ㘳㲁Ⲵᱟagentᮤњ⭏ભᵏ޵⇿ᰦ
h i0
䰤↕Ⲵᒣ൷എᣕDŽᵜㄐਚ䲀ࡦҾ㘳㲁ᔿ 13.1 ᇊѹⲴᣈ㇇എᣕDŽMahadevan˄1996˅䇘䇪ҶᖃՈ
ॆ߶ࡉѪᒣ൷എᣕᰦⲴ໎ᕪᆖҐDŽ

⧠൘ਟԕ㋮⺞䱸䘠agentⲴᆖҐԫ࣑DŽᡁԜ㾱≲agentᆖҐࡠањㆆ⮕±ˈ֯ᗇሩҾᡰᴹ⣦
±
ᘱsˈV (s)ѪᴰབྷDŽ↔ㆆ⮕㻛〠ѪᴰՈㆆ⮕˄optimal policy ˅ˈᒦ⭘±*ᶕ㺘⽪DŽ

S * { arg max V S ( s), (s) ˄13.2˅


S

S*
Ѫㆰॆ㺘⽪ˈᡁԜሶ↔ᴰՈㆆ⮕Ⲵ٬࠭ᮠ V ( s ) 䇠֌V*(s)DŽV*(s)㔉ࠪҶᖃagentӾ⣦ᘱsᔰ
࿻ᰦਟ㧧ᗇⲴᴰབྷᣈ㇇㍟䇑എᣕˈণӾ⣦ᘱsᔰ࿻䚥ᗚᴰՈㆆ⮕ᰦ㧧ᗇⲴᣈ㇇㍟〟എᣕDŽ

ѪҶ䈤᰾䘉Ӌᾲᘥˈമ 13-2 Ⲵкᯩᱮ⽪ҶањㆰঅⲴṬ⣦ц⭼⧟ຳDŽ↔മѝⲴ 6 њᯩṬ


ԓ㺘 agent Ⲵ 6 ⿽ਟ㜭Ⲵ⣦ᘱᡆս㖞DŽമѝ⇿њ㇝ཤԓ㺘 agent ਟ䟷ਆⲴਟ㜭ࣘ֌ˈӾањ⣦
ᘱ〫ࣘࡠਖањDŽо⇿њ㇝ཤ⴨‫ޣ‬㚄Ⲵᮠ٬㺘⽪ྲ᷌ agent ᢗ㹼⴨ᓄⲴ⣦ᘱࣘ֌䖜ᦒਟ᭦ࡠⲴ
・ণഎᣕ r(s,a)DŽ⌘᜿൘䘉њ⢩ᇊ⧟ຳлˈᡰᴹⲴ⣦ᘱࣘ֌䖜ᦒˈ䲔Ҷሬੁ⣦ᘱ G Ⲵԕཆˈ䜭
㻛ᇊѹѪ 0DŽѪ‫ׯ‬Ҿ䇘䇪ˈਟሶ⣦ᘱ G ⴻ֌ᱟⴞḷ⣦ᘱˈഐѪ agent ਟ᧕ਇࡠഎᣕⲴᜏаᯩ⌅
ᱟ䘋‫↔ޕ‬⣦ᘱDŽ䘈㾱⌘᜿൘↔⧟ຳлˈagent аᰖ䘋‫ޕ‬⣦ᘱ Gˈᆳਟ䘹Ⲵࣘ֌ਚ㜭ᱟ⮉൘䈕⣦
ᘱѝDŽഐ↔ˈᡁԜ〠 G Ѫ੨᭦⣦ᘱ˄absorbing state˅DŽ

ᡁԜᐢ㓿ᇊѹҶ⣦ᘱǃࣘ֌઼・ণഎᣕˈਚ㾱޽䘹ᤙᣈ㇇ഐᆀ¤Ⲵ٬ˈቡਟԕ⺞ᇊᴰՈㆆ
⮕±*઼ᆳⲴ٬࠭ᮠV*(s)ҶDŽ൘䘉䟼ᡁԜ䘹ᤙ¤=0.9DŽമ 13-2 Ⲵлᯩᱮ⽪Ҷ൘↔䇮ᇊлⲴа⿽
ᴰՈㆆ⮕˄䘈ᴹަԆⲴᴰՈㆆ⮕˅DŽоԫ᜿ㆆ⮕аṧˈ䈕ㆆ⮕⺞࠷ൠᤷᇊҶagent൘ԫ᜿㔉ᇊ
⣦ᘱлᓄ䘹ᤙⲴањࣘ֌DŽྲᡰᜣ䊑Ⲵ䛓ṧˈ䈕ᴰՈㆆ⮕ᢺagentԕᴰ⸝䐟ᖴሬੁ⣦ᘱGDŽ

插图——原书页码:372
(immediate reward)values˖ ・ণഎᣕ٬
values: ٬
values: ٬
One optimal policy˖ањᴰՈㆆ⮕

മ 13-2 䈤᰾ Q-ᆖҐⲴสᵜᾲᘥⲴањㆰঅⲴ⺞ᇊᙗц⭼

⇿њᯩṬԓ㺘ањн਼Ⲵ⣦ᘱˈ⇿њ㇝ཤԓ㺘ањн਼Ⲵࣘ֌DŽ・ণഎᣕ࠭ᮠᢺ䘋‫ⴞޕ‬ḷ⣦ᘱG
Ⲵഎᣕ䍻Ҹ 100ˈަԆⲴ䍻Ҹ 0DŽV*(s)઼Q(s, a)Ⲵ٬ᶕ㠚Ҿr(s, a)ԕ৺ᣈ㇇ഐᆀ¤=0.9DŽሩᓄҾᴰབྷQ٬
Ⲵࣘ֌ⲴањᴰՈㆆ⮕ҏᱮ⽪൘മѝDŽ

മ 13-2 Ⲵਣ䗩Ⲵമᱮ⽪⇿⣦ᘱⲴV*٬DŽֻྲ˖㘳㲁↔മⲴਣл䀂Ⲵ⣦ᘱDŽ↔⣦ᘱⲴV*٬
Ѫ 100ˈഐѪ൘↔⣦ᘱлᴰՈㆆ⮕Պ䘹ᤙĀੁкāⲴࣘ֌ˈӾ㘼ᗇࡠ・ণഎᣕ 100DŽ❦ਾˈ
agentՊ⮉൘੨᭦⣦ᘱѝˈн޽᧕ࡠᴤཊⲴഎᣕDŽ㊫լⲴˈѝлᯩⲴ⣦ᘱⲴV*٬Ѫ 90DŽ䘉ᱟഐ
ѪᴰՈㆆ⮕Պ֯agentӾ䘉䟼ੁਣ〫ࣘ˄ᗇࡠѪ 0 Ⲵ・ণഎᣕ˅ˈ❦ਾੁк˄⭏ᡀѪ 100 Ⲵ・ণ
എᣕ˅DŽ䘉ṧˈ↔⣦ᘱⲴᣈ㇇䗷ⲴഎᣕѪ˖

0+¤100+¤20+¤30+...=90

എᗶ V*Ⲵᇊѹѝˈᆳᱟ൘ᰐ䲀ᵚᶕкⲴᣈ㇇എᣕ઼DŽ൘䘉њ⢩ᇊⲴ⧟ຳлˈаն agent ࡠ
䗮Ҷ੨᭦⣦ᘱ Gˈަᰐ䲀ᵚᶕሶ⮉൘↔⣦ᘱѝᒦ㧧ᗇ 0 എᣕDŽ

13.3 Q ᆜҖ

ањagent൘ԫ᜿Ⲵ⧟ຳѝྲօ㜭ᆖࡠᴰՈⲴㆆ⮕±*˛ⴤ᧕ᆖҐ࠭ᮠ±*: SėAᖸഠ䳮ˈഐ
Ѫ䇝㓳ᮠᦞѝ⋑ᴹᨀ‫<׋‬s, a>ᖒᔿⲴ䇝㓳ṧֻDŽ֌Ѫᴯԓˈᜏаਟ⭘Ⲵ䇝㓳ؑ᚟ᱟ・ণഎᣕ〻
ᒿࡇr(si,ai)ˈi=0,1,2...DŽྲᡁԜሶⴻࡠⲴˈ㔉ᇊҶ䘉⿽㊫රⲴ䇝㓳ؑ᚟ˈᴤᇩ᱃ⲴᱟᆖҐањ
ᇊѹ൘⣦ᘱ઼ࣘ֌кⲴᮠ٬䇴ՠ࠭ᮠˈ❦ਾԕ↔䇴ՠ࠭ᮠⲴᖒᔿᇎ⧠ᴰՈㆆ⮕DŽ

Agentᓄቍ䈅ᆖҐӰѸṧⲴ䇴ՠ࠭ᮠ˛ᖸ᰾ᱮⲴањ䘹ᤙᱟV* DŽਚ㾱ᖃV*(s1)>V*(s2)ᰦˈ
agent䇔Ѫ⣦ᘱs1ՈҾs2ˈഐѪӾs1ѝਟᗇࡠ䖳བྷⲴ・ণഎᣕDŽᖃ❦agentⲴㆆ⮕㾱䘹ᤙⲴᱟࣘ֌
㘼䶎⣦ᘱDŽ❦㘼൘ਸ䘲Ⲵ䇮ᇊѝ֯⭘V* ҏਟ䘹ᤙࣘ֌DŽ൘⣦ᘱsлⲴᴰՈࣘ֌ᱟ֯・ণഎᣕ
r(s,a)࣐к・ণਾ㔗⣦ᘱⲴV*٬˄㻛¤ᣈ㇇˅ᴰབྷॆⲴࣘ֌aDŽ

S * ( s ) arg max[r ( s, a)  JV * (G ( s, a))] ˄13.3˅


a

˄എᗶ¥(s,a)ԓ㺘ᓄ⭘ࣘ֌aࡠ⣦ᘱsⲴ㔃᷌⣦ᘱ˅DŽഐ↔ˈagentਟ䙊䗷ᆖҐV*㧧ᗇᴰՈㆆ
⮕ⲴᶑԦᱟ˖ᆳާᴹ・ণഎᣕ࠭ᮠr઼⣦ᘱ䖜ᦒ࠭ᮠ¥Ⲵᆼ㖾⸕䇶DŽᖃagentᗇ⸕Ҷཆ⭼⧟ຳ⭘
ᶕ૽ᓄࣘ֌Ⲵ࠭ᮠr઼¥Ⲵᆼ㖾⸕䇶ˈᆳቡਟ⭘ᔿ 13.3 ᶕ䇑㇇ԫ᜿⣦ᘱлⲴᴰՈࣘ֌DŽ

нᒨⲴᱟˈਚ൘agentާᴹr઼¥ᆼ㖾⸕䇶ᰦˈᆖҐV*᡽ᱟᆖҐᴰՈㆆ⮕Ⲵᴹ᭸ᯩ⌅DŽ䘉㾱
≲ᆳ㜭ᆼ㖾亴⍻ԫ᜿⣦ᘱ䖜ᦒⲴ・ণ㔃᷌˄ণ・ণഎᣕ઼・ণਾ㔝˅DŽ൘䇨ཊᇎ䱵Ⲵ䰞仈ѝˈ
∄ྲᵪಘӪ᧗ࡦˈagentԕ৺ᆳⲴ〻ᒿ䇮䇑㘵䜭нਟ㜭亴‫⸕ݸ‬䚃ᓄ⭘ԫ᜿ࣘ֌ࡠԫ᜿⣦ᘱⲴ⺞
࠷䗃ࠪDŽֻྲˈሩҾањ⭘᡻㟲䬢൏ⲴᵪಘӪˈᖃ㔃᷌⣦ᘱवਜ਼൏ඇⲴ⣦ᘱᰦˈྲօ᧿䘠¥࠭
ᮠ˛ഐ↔ᖃ¥ᡆr䜭ᵚ⸕ᰦˈᆖҐV*ᱟᰐࣙҾ䘹ᤙᴰՈࣘ֌ⲴˈഐѪagentн㜭⭘ᔿ 13-3 䘋㹼䇴
ՠDŽ൘ᴤа㡜Ⲵ䘹ᤙѝˈagentᓄ֯⭘ӰѸṧⲴ䇴ՠ࠭ᮠ઒˛ла㢲ᇊѹⲴ䇴ՠ࠭ᮠQᨀ‫׋‬Ҷㆄ
ṸDŽ

13.3.1 Q ࠳ᮦ

䇴ՠ࠭ᮠ Q(s,a)ᇊѹѪ˖ᆳⲴ٬ᱟӾ⣦ᘱ s ᔰ࿻ᒦ֯⭘ࣘ֌ a ֌Ѫㅜањࣘ֌ᰦⲴᴰབྷᣈ


㇇㍟〟എᣕDŽᦒ䀰ѻˈQ Ⲵ٬ѪӾ⣦ᘱ s ᢗ㹼ࣘ֌ a Ⲵ・ণഎᣕ࣐кԕਾ䚥ᗚᴰՈㆆ⮕Ⲵ٬
˄⭘¤ᣈ㇇˅DŽ

Q( s, a ) { r ( s, a )  JV * (G ( s, a )) (13.4)
⌘᜿ Q(s,a)↓ᱟᔿ 13.3 ѝѪ䘹ᤙ⣦ᘱ s кⲴᴰՈࣘ֌ a ᓄᴰབྷॆⲴ䟿ˈഐ↔ਟሶᔿ 13.3 䟽
߉Ѫ Q(s,a)Ⲵᖒᔿ˖

S * ( s ) arg max Q( s, a) ˄13.5˅


a

䟽߉䈕ᔿѪӰѸᖸ䟽㾱˛ഐѪᆳᱮ⽪Ҷྲ᷌agentᆖҐQ࠭ᮠ㘼нᱟV*࠭ᮠˈণ֯൘㕪ቁ࠭
ᮠr઼¥Ⲵ⸕䇶ᰦˈagentҏਟ䘹ᤙᴰՈࣘ֌DŽᔿ 13.5 ␵ᾊൠᱮ⽪ࠪˈagentਚ享㘳㲁ަᖃࡽⲴ⣦
ᘱsл⇿њਟ⭘Ⲵࣘ֌aˈᒦ䘹ᤙަѝ֯Q(s,a)ᴰབྷॆⲴࣘ֌DŽ

䘉а⛩ᔰ࿻ⴻ䎧ᶕԔӪ᛺ཷˈਚ享ሩᖃࡽⲴ⣦ᘱⲴ Q Ⲵተ䜘٬䟽༽‫৽ࠪڊ‬ᓄˈቡਟ䘹ᤙ
ࡠ‫ޘ‬ተᴰՈॆⲴࣘ֌ᒿࡇˈ䘉᜿ણ⵰ agent н享䘋㹼ࡽⷫᙗᩌ㍒ˈн享᰾⺞ൠ㘳㲁Ӿ↔ࣘ֌ᗇ
ࡠⲴ⣦ᘱˈቡਟ䘹ᤙᴰՈࣘ֌DŽQ ᆖҐⲴ㖾࿉ѻ༴а䜘࠶൘Ҿަ䇴ՠ࠭ᮠⲴᇊѹ㋮⺞ൠᤕᴹ↔
኎ᙗ˖ᖃࡽ⣦ᘱ઼ࣘ֌Ⲵ Q ٬൘অњⲴᮠ٬ѝᾲᤜҶᡰᴹ䴰㾱Ⲵؑ᚟ˈԕ⺞ᇊ൘⣦ᘱ s л䘹ᤙ
ࣘ֌ a ᰦ൘ሶᶕՊ㧧ᗇⲴᣈ㇇㍟䇑എᣕDŽ

Ѫ䈤᰾䘉а⛩ˈ㿱മ 13-2DŽަѝ൘ㆰঅⲴṬᆀц⭼ѝᱮ⽪Ҷ⇿њ⣦ᘱ઼ࣘ֌ⲴQ٬DŽ⌘᜿
⇿њ⣦ᘱࣘ֌Ⲵ䖜ᦒⲴQ٬ㅹҾ↔䖜ᦒⲴr٬࣐к㔃᷌⣦ᘱⲴV*٬˄⭘¤ᣈ㇇˅DŽ䘈㾱⌘᜿മѝ
ᱮ⽪ⲴᴰՈㆆ⮕ሩᓄҾ䘹ᤙᴹᴰབྷⲴQ٬Ⲵࣘ֌DŽ

13.3.2 ᆜҖ Q ⲺжѠ㇍⌋

ᆖҐ Q ࠭ᮠሩᓄҾᆖҐᴰՈㆆ⮕DŽQ ᘾṧ㜭㻛ᆖҐࡠ˛

‫ޣ‬䭞൘Ҿ㾱᢮ࡠањਟ䶐Ⲵᯩ⌅ˈ൘ਚᴹᰦ䰤кኅᔰⲴ・ণഎᣕᒿࡇⲴᛵߥлՠ䇑䇝㓳
٬DŽ䘉ਟ䙊䗷䘝ԓ䙬䘁Ⲵᯩ⌅ᆼᡀDŽѪ⨶䀓ᘾṧᆼᡀ䘉а䗷〻ˈ⌘᜿Q઼V*ѻ䰤Ⲵᇶ࠷㚄㌫˖

V * ( s) max Q( s, a c)
ac

ᆳਟ㻛⭘Ҿ䟽߉ᔿ 13.4 Ѫ

Q( s, a) { r ( s, a)  J max Q (G ( s, a), a c) ˄13.6˅


ac

䘉њ Q ࠭ᮠⲴ䙂ᖂᇊѹᨀ‫׋‬Ҷᗚ⧟䙬䘁 Q ㇇⌅Ⲵส⹰˄Watkins 1989˅DŽѪ᧿䘠↔㇇⌅ˈ


ᡁԜሶ֯⭘ㅖਧ Qˆ ᶕᤷԓᇎ䱵 Q ࠭ᮠⲴᆖҐಘⲴՠ䇑ˈᡆ㘵䈤‫ٷ‬䇮DŽ൘↔㇇⌅ѝᆖҐಘ㺘⽪
ަ‫ٷ‬䇮 Qˆ ᱟ䙊䗷ањབྷ㺘ˈަѝሩ⇿њ⣦ᘱ-ࣘ֌ሩᴹа㺘亩DŽ⣦ᘱ-ࣘ֌ሩ<s, a>Ⲵ㺘亩ѝᆈ
ۘҶ Qˆ (s,a)Ⲵ٬ˈণᆖҐಘሩᇎ䱵Ⲵնᵚ⸕Ⲵ Q(s,a)٬Ⲵᖃࡽ‫ٷ‬䇮DŽ↔㺘ਟ㻛ࡍ࿻ປ‫ݵ‬Ѫ䲿ᵪ
٬˄ᖃ❦ˈྲ᷌䇔Ѫᱟ‫ ޘ‬0 Ⲵࡍ࿻٬ᴤ᱃Ҿ⨶䀓˅DŽAgent 䟽༽ൠ㿲ሏަᖃࡽⲴ⣦ᘱ sˈ䘹ᤙ
Ḁࣘ֌ aˈᢗ㹼↔ࣘ֌ˈ❦ਾ㿲ሏ㔃᷌എᣕ r=r(s,a)ԕ৺ᯠ⣦ᘱ s´=¥(s,a)DŽ❦ਾ agent 䚥ᗚ⇿њ
䘉ṧⲴ䖜ᦒᴤᯠ Qˆ (s,a)Ⲵ㺘亩ˈ᤹➗ԕлⲴ㿴ࡉ˖

Qˆ ( s, a) m r  J max Qˆ ( s c, a c) ˄13.7˅
ac
⌘᜿↔䇝㓳٬֯⭘ agent ሩᯠ⣦ᘱ s´Ⲵᖃࡽ Qˆ ٬ᶕ㋮ॆަሩࡽа⣦ᘱ s Ⲵ Qˆ (s,a)ՠ䇑DŽ↔
䇝㓳㿴ࡉᱟӾᔿ 13.6 ѝᗇࡠⲴˈн䗷↔䇝㓳٬㘳㲁 agent Ⲵ䘁լ Q̂ ˈ㘼ᔿ 13.6 ᓄ⭘ࡠᇎ䱵Ⲵ Q
࠭ᮠDŽ⌘᜿㲭❦ᔿ 13.6 ԕ࠭ᮠ¥(s,a)઼ r(s,a)Ⲵᖒᔿ᧿䘠 Qˈagent н䴰⸕䚃䘉Ӌа㡜࠭ᮠᶕᓄ
⭘ᔿ 13.7 Ⲵ䇝㓳㿴ࡉDŽ⴨৽ˈᆳ൘ަ⧟ຳѝᢗ㹼ࣘ֌ˈᒦ㿲ሏ㔃᷌⣦ᘱ s´઼എᣕ rDŽ䘉ṧˈᆳ
ਟ㻛ⴻ֌ᱟ൘ s ઼ a Ⲵᖃࡽ٬к䟷ṧDŽ

к䘠ሩҾ⺞ᇊᙗ傜ቄਟཛߣㆆ䗷〻Ⲵ Q ᆖҐ㇇⌅൘㺘 13-1 ѝ㻛ᴤ㋮⺞ൠ᧿䘠DŽ֯⭘↔㇇


⌅ˈagent ՠ䇑Ⲵ Q̂ ൘ᶱ䲀ᰦ᭦ᮋࡠᇎ䱵 Q ࠭ᮠˈਚ㾱㌫㔏ਟ㻛ᔪ⁑Ѫањ⺞ᇊᙗ傜ቄਟཛߣ
ㆆ䗷〻ˈഎᣕ࠭ᮠ r ᴹ⭼ˈᒦфࣘ֌Ⲵ䘹ᤙਟ֯⇿њ⣦ᘱ-ࣘ֌ሩ㻛ᰐ䲀仁⦷Ⲵ䇯䰞DŽ

㺘 13-1 ൘⺞ᇊᙗഎᣕ઼ࣘ֌‫ٷ‬ᇊлⲴ Q ᆖҐ㇇⌅

ᣈ㇇ഐᆀJѪԫ᜿ᑨ䟿┑䏣 0dJ<1DŽ

Q ᆖҐ㇇⌅
ˆ (s,a)Ѫ 0
ሩ⇿њ s,aˈࡍ࿻ॆ㺘亩 Q

㿲ሏᖃࡽ⣦ᘱ s
аⴤ䟽༽‫˖ڊ‬
 䘹ᤙањࣘ֌ a ᒦᢗ㹼ᆳ
 ᧕᭦ࡠ・ণഎᣕ r
 㿲ሏᯠ⣦ᘱ s´

 ˆ (s,a)᤹➗лᔿᴤᯠ㺘亩˖
ሩQ

Qˆ ( s, a) m r  J max Qˆ ( s c, a c)
ac

 sĕs´

13.3.3 ⽰ׁ

Ѫ䈤᰾ Q ᆖҐ㇇⌅Ⲵ᫽֌䗷〻ˈ㘳㲁മ 13-3 ᱮ⽪ⲴḀњ agent 䟷ਆⲴањࣘ֌઼ሩᓄⲴሩ


Q̂ Ⲵ㋮ॆDŽ൘↔ֻѝˈagent ൘ަṬᆀц⭼ѝੁਣ〫ࣘањঅ‫ݳ‬Ṭˈᒦ᭦ࡠ↔䖜ᦒⲴ・ণഎᣕ
Ѫ 0DŽ❦ਾᆳᓄ⭘䇝㓳㿴ࡉᔿ 13.7 ᶕሩࡊᢗ㹼Ⲵ⣦ᘱ-ࣘ֌䖜ᦒ㋮ॆަ Qˆ Ⲵՠ䇑DŽ᤹➗䇝㓳㿴
ࡉˈ↔䖜ᦒⲴᯠ Q̂ ՠ䇑Ѫ᭦ࡠⲴഎᣕ˄0˅о⭘J˄0.9˅ᣈ㇇Ⲵо㔃᷌⣦ᘱ⴨‫ޣ‬㚄Ⲵᴰ儈 Qˆ ٬
˄100˅Ⲵ઼DŽ

⇿⅑ agent Ӿаᰗ⣦ᘱࡽ䘋ࡠаᯠ⣦ᘱˈQ ᆖҐՊӾᯠ⣦ᘱࡠᰗ⣦ᘱੁਾՐ᫝ަ Qˆ ՠ䇑DŽ


਼ᰦˈagent ᭦ࡠⲴ↔䖜ᦒⲴ・ণഎᣕ㻛⭘Ҿᢙབྷ䘉ӋՐ᫝Ⲵ Q̂ ٬DŽ

㘳㲁ሶ↔㇇⌅ᓄ⭘ࡠṬᆀц⭼ѝˈަഎᣕ࠭ᮠᱮ⽪൘മ 13-2 ѝˈަѝⲴഎᣕ٬䲔Ҷ䘋‫ޕ‬


ⴞḷ⣦ᘱⲴԕཆ䜭Ѫ 0DŽഐѪ↔ц⭼वਜ਼ањ੨᭦ⴞḷ⣦ᘱDŽᡁԜਟ‫ٷ‬ᇊ䇝㓳䗷〻वਜ਼а㌫ࡇ
Ⲵᛵ㢲˄episode˅DŽ൘⇿њᛵ㢲Ⲵ䗷〻ѝˈagent ӾḀ䲿ᵪ䘹ᤙⲴ⣦ᘱᔰ࿻DŽᢗ㹼ࣘ֌ⴤࡠަ
ࡠ䗮੨᭦ⴞḷ⣦ᘱDŽ䘉ᰦᛵ㢲㔃ᶏˈ❦ਾ agent 㻛䘀䗃ࡠањ䲿ᵪ䘹ᤙⲴᯠࡍ࿻⣦ᘱᔰ࿻ла
њᛵ㢲DŽ

插图——原书页码:376
Initial state: ࡍ࿻⣦ᘱ
Next state: ла⣦ᘱ

മ 13-3 ൘ᢗ㹼অњࣘ֌ਾሩ Q Ⲵᴤᯠ

ᐖ 䗩 Ⲵ മ ᱮ ⽪ Ҷ ᵪ ಘ Ӫ R Ⲵ ࡍ ࿻ ⣦ ᘱ s1 ˈ ԕ ৺ ࡍ ࿻ ‫ ٷ‬䇮 ѝ ࠐ њ ⴨ ‫Ⲵ ޣ‬ Q̂ ٬ DŽ ֻ ྲ ˈ
Qˆ ( s1 , a right ) =72.9ˈަѝarightᤷԓRੁਣ〫ࣘⲴࣘ֌DŽᖃᵪಘӪᢗ㹼ࣘ֌arightਾˈᆳ᭦ࡠ・ণഎᣕr=
0ˈᒦ䖜ᦒࡠ⣦ᘱs2DŽ❦ਾᆳสҾަሩᯠ⣦ᘱs2Ⲵ Q̂ ՠ䇑ᴤᯠަ Q ˆ ( s , a ) ՠ䇑DŽ䘉䟼¤=0.9DŽ
1 right

൘↔ֻѝˈᖃᓄ⭘ Q ᆖҐ㇇⌅ᰦˈ Q̂ Ⲵ٬ᱟྲօ╄ॆⲴ˛ഐѪࡍ࿻Ⲵ Q̂ ٬䜭Ѫ 0ˈagent


ሩԫ᜿ Q̂ 㺘亩䜭нՊ᭩ਈˈⴤࡠᆳᚠྭࡠ䗮ⴞḷ⣦ᘱᒦф᭦ࡠ䶎䴦ⲴഎᣕDŽ൘лањᛵ㢲ѝˈ
ྲ᷌㓿䗷䘉Ӌоⴞḷ⣦ᘱ⴨ѤⲴ⣦ᘱˈަ䶎 0 Ⲵ Q̂ ٬Պሬ㠤оⴞⲴ⴨ᐞє↕Ⲵ⣦ᘱѝ٬Ⲵਈ
ॆˈ‫↔׍‬㊫᧘DŽ㔉ᇊ䏣ཏᮠ䟿Ⲵ䇝㓳ᛵ㢲ˈؑ᚟ՊӾᴹ䶎䴦എᣕⲴ䖜ᦒੁਾՐ᫝ࡠᮤњ⣦ᘱ-
ࣘ֌オ䰤ˈᴰ㓸ᗇࡠањ Q̂ 㺘DŽަѝⲴ Q ٬ྲമ 13-2 ᡰ⽪DŽ

൘ла㢲ˈᡁԜ䇱᰾Ҷ൘аᇊᶑԦл㺘 13-1 ⲴQᆖҐ㇇⌅Պ᭦ᮋࡠ↓⺞ⲴQ࠭ᮠDŽ俆‫ݸ‬㘳


㲁↔QᆖҐ㇇⌅Ⲵєњ⢩⛩ˈ䘉єњ⢩⛩ᱟሩഎᣕ䶎䍏фᡰᴹ Q̂ ٬ࡍ࿻ॆѪ 0 Ⲵԫ᜿⺞ᇊᙗⲴ
MDP䜭Პ䙽ᆈ൘ⲴDŽㅜањ኎ᙗᱟˈ൘к䘠ᶑԦл Q̂ ٬൘䇝㓳ѝ≨䘌нՊл䱽DŽᴤᖒᔿॆൠ
䇢ˈԔ Q̂ n(s,a)㺘⽪䇝㓳䗷〻Ⲵㅜn⅑ᗚ⧟ਾᆖҐࡠⲴ Q̂ (s,a)٬˄ণagentᡰ䟷ਆⲴㅜnњ⣦ᘱ-ࣘ
֌䖜ᦒѻਾ˅DŽࡉᴹ˖

(s, a, n)Qˆ n 1 ( s, a ) t Qˆ n ( s, a )

ㅜҼњᲞ䙽⢩⛩ᱟ൘ᮤњ䇝㓳䗷〻ѝˈ⇿њ Q̂ ٬ሶ‫؍‬ᤱ൘䴦઼ⵏᇎ Q ٬Ⲵ४䰤޵˖

(s, a, n)0 d Qˆ n ( s, a ) d Q ( s, a )

13.3.4 ᭬ᮑᙝ

㺘 13-1 Ⲵ㇇⌅ᱟ੖Պ᭦ᮋࡠањㅹҾⵏᇎ Q ࠭ᮠⲴ Q̂ ٬˛൘⢩ᇊᶑԦлˈഎㆄᱟ㛟ᇊ


ⲴDŽ俆‫ݸ‬䴰㾱‫ٷ‬ᇊ㌫㔏Ѫа⺞ᇊᙗⲴ MDPDŽަ⅑ˈᗵ享‫ٷ‬ᇊ・ণഎᣕ٬䜭ᱟᴹ⭼Ⲵˈণᆈ൘
Ḁ↓ᑨᮠ cˈሩᡰᴹ⣦ᘱ s ઼ࣘ֌ aˈ|r(s, a)|<cDŽㅜйˈagent 䘹ᤙࣘ֌ⲴᯩᔿѪᆳᰐ䲀仁㑱ൠ
䇯䰞ᡰᴹਟ㜭Ⲵ⣦ᘱ-ࣘ֌ሩDŽ䘉њᶑԦ᜿ણ⵰ྲ᷌ࣘ֌ a ᱟӾ⣦ᘱ s ࠪਁⲴањਸ⌅Ⲵࣘ֌ˈ
䛓Ѹ䲿ᰦ䰤Ⲵ㍟䇑ˈagent Ⲵࣘ֌ᒿࡇ䙀⑀䗮ࡠᰐ䲀䮯DŽagent ᗵ享ԕ䶎 0 Ⲵ仁⦷䟽༽ൠӾ⣦ᘱ
s ᢗ㹼ࣘ֌ aDŽ⌘᜿䘉ӋᶑԦ൘Ḁ⿽〻ᓖкॱ࠶а㡜ˈնᴹᰦ৸⴨ᖃѕṬDŽᆳԜ᧿䘠Ҷ∄ࡽа
㢲ᡰѮⲴֻᆀѝᴤа㡜Ⲵ䇮ᇊˈഐѪᆳԜ‫ݱ‬䇨⧟ຳᴹԫ᜿Ⲵ↓ᡆ䍏എᣕˈᒦф⧟ຳѝਟᴹԫ᜿
ᮠ䟿Ⲵ⣦ᘱ-ࣘ֌䖜ᦒਟӗ⭏䶎䴦എᣕDŽ䘉ӋᶑԦⲴѕṬᙗ൘Ҿᆳ㾱≲ agent ᰐ䲀仁㑱Ⲵ䇯䰞⇿
њн਼Ⲵ⣦ᘱ-ࣘ֌䖜ᦒDŽ䘉൘䶎ᑨབྷⲴ˄ᡆ㘵⭊㠣ᱟ䘎㔝Ⲵ˅亶ฏѝᱟ䶎ᑨᕪⲴ‫ٷ‬ᇊDŽᡁԜ
ሶ൘ਾ䶒䇘䇪ᴤᕪⲴ᭦ᮋ㔃᷌DŽ❦㘼ᵜ㢲᧿䘠Ⲵ㔃᷌ሶѪ⨶䀓 Q ᆖҐⲴ䘀㹼ᵪࡦᨀ‫ⴤ׋‬㿲Ⲵ
⨶䀓DŽ

ሩ᭦ᮋᙗ䇱᰾Ⲵ‫ޣ‬䭞ᙍ䐟൘Ҿˈᴹᴰབྷ䈟ᐞⲴ㺘亩 Q̂ (s,a)ᗵ享൘ަᴤᯠᰦሶ䈟ᐞ᤹ഐᆀ¤
߿ሿDŽ৏ഐ൘ҾᆳⲴᯠ٬Ⲵа䜘࠶‫׍‬䎆Ҿᴹ䈟ᐞ‫ Ⲵੁٮ‬Q̂ ՠ䇑ˈަ։Ⲵ䜘࠶‫׍‬䎆Ҿᰐ䈟ᐞⲴ㿲
ሏࡠⲴ・ণഎᣕ rDŽ

ᇊ⨶ 13.1DŽ⺞ ᇊᙗ傜ቄਟཛߣㆆ䗷〻ѝⲴQᆖҐⲴ᭦ᮋᙗDŽ㘳㲁ањQᆖҐagentˈ൘ањ⺞ᇊᙗ
MDPѝˈᒦфᴹᴹ⭼എᣕ (s , a ) r ( s , a ) d c DŽQᆖҐagent֯⭘ᔿ 13.7 Ⲵ䇝㓳㿴ࡉˈሶ㺘 Q̂ (s,a)ࡍ࿻

ॆѪԫ᜿ᴹ䲀٬ˈᒦф֯⭘ᣈ㇇ഐᆀ¤ˈ0ݤ<1DŽԔ Q̂ n(s,a)ԓ㺘൘ㅜn⅑ᴤᯠਾagentⲴ‫ٷ‬䇮 Q̂ (s,a)DŽ

ྲ᷌⇿њ⣦ᘱ-ࣘ֌ሩ䜭㻛ᰐ䲀仁㑱Ⲵ䇯䰞ˈ䛓ѸሩᡰᴹsˈaˈᖃnėĞᰦ Q̂ n(s,a)᭦ᮋࡠQ(s,a)DŽ

䇱᰾˖ഐѪ⇿њ⣦ᘱ-ࣘ֌䖜ᦒᰐ䲀仁㑱ਁ⭏ˈ㘳㲁䘎㔝Ⲵ४䰤ˈަѝ⇿њ⣦ᘱ-ࣘ֌䖜ᦒ㠣ቁਁ⭏
䗷а⅑DŽᡰ䴰㾱䇱᰾Ⲵᱟˈ൘ Q̂ 㺘ѝᡰᴹ㺘亩кⲴᴰབྷ䈟ᐞ൘⇿њ䘉ṧⲴ䘎㔝४䰤޵㠣ቁ᤹ഐᆀ ¤߿

ቁDŽ Q̂ nѪn⅑ᴤᯠਾagentՠ䇑ⲴQ٬㺘DŽԔnѪ Q̂ nѝᴰབྷ䈟ᐞˈণ˖

' n { max Qˆ n ( s, a )  Q ( s, a )
s ,a

л䶒ᡁԜ֯⭘s´ᶕԓ㺘¥(s,a)ˈ⧠൘ሩ൘ㅜn+1 ⅑䘝ԓѝᴤᯠⲴԫ᜿㺘亩 Q̂ n(s,a)ˈ൘‫↓؞‬ਾⲴՠ䇑

Q̂ n+1(s,a)ѝⲴ䈟ᐞ䟿Ѫ˖

Qˆ n 1 ( s, a )  Q( s, a) (r  J max Qˆ n ( s c, a c))  (r  J max Q( s c, a c))


ac ac

J max Qˆ n ( s c, a c)  max Q( s c, a c)
ac ac

d J max Qˆ n ( s c, a c)  Q( s c, a c)
ac

d J max Qˆ n ( s cc, a c)  Q ( s cc, a c)


s cc, ac

Qˆ n 1 ( s, a)  Q( s, a) d J' n

к䶒Ⲵㅜй㹼ӾㅜҼ㹼ѝሬࠪˈ৏ഐᱟሩԫ᜿єњ࠭ᮠf1઼f2ᴹлࡇнㅹᔿᡀ・˖

max f1 (a )  max f 2 (a) d max f1 (a )  f 2 (a)


a a a
Ӿㅜй㹼ࡠㅜഋ㹼Ⲵ᧘ሬˈᡁԜᕅ‫ޕ‬Ҷањᯠਈ䟿s´´൘ަкᢗ㹼ᴰབྷॆDŽަਸ⨶ᙗ൘ҾᖃᡁԜ‫ݱ‬䇨
䱴࣐Ⲵਈ䟿ਈॆᰦˈ↔ᴰབྷ٬ਚਟ㜭ᴤབྷᡆ㠣ቁᱟ⴨ㅹDŽ⌘᜿ˈ䙊䗷ᕅ‫↔ޕ‬ਈ䟿ˈᡁԜ㧧ᗇҶањоn
Ⲵᇊѹ३䝽Ⲵ㺘䗮ᔿDŽ

ഐ↔ˈሩԫ᜿s, aˈᴤᯠਾⲴ Q̂ n+1(s,a)Ⲵ䈟ᐞᴰཊѪ Q̂ n㺘ѝᴰབྷ䈟ᐞnⲴ¤‫ؽ‬DŽ൘ࡍ࿻㺘ѝⲴᴰ

བྷ䈟ᐞ0ᱟᴹ⭼ⲴˈഐѪ Q̂ 0(s,a)઼Q(s,a)Ⲵ٬ሩᡰᴹs, a䜭ᴹ⭼DŽ⧠൘ˈ൘⇿њs,a䜭㻛䇯䰞䗷Ⲵㅜањ


४䰤޵ˈ↔㺘ѝᴰབྷⲴ䈟ᐞ㠣ཊѪ¤0DŽ൘kњ४䰤ਾˈ䈟ᐞᴰཊѪ¤k0DŽഐѪ⇿њ⣦ᘱ䜭㻛ᰐ䲀仁㑱
ൠ䇯䰞ˈ䘉ṧⲴ४䰤Ⲵᮠⴞᱟᰐ䲀Ⲵˈഐ↔ᖃnėĞᰦnė0DŽᇊ⨶ᗇ䇱DŽ

13.3.5 ᇔ僂ㆌ⮛

⌘᜿㺘 13-1 Ⲵ㇇⌅⋑ᴹᤷᇊ agent ྲօ䘹ᤙࣘ֌DŽањ᰾ᱮⲴㆆ⮕ᱟˈሩҾ൘⣦ᘱ s Ⲵ


agentˈ䘹ᤙ֯ Q̂ (s,a)ᴰབྷॆⲴࣘ֌ˈӾ㘼࡙⭘ަᖃࡽ䙬䘁Ⲵ Q̂ DŽ❦㘼ˈ֯⭘↔ㆆ⮕ᆈ൘仾
䲙ˈagent ਟ㜭䗷ᓖᶏ㕊ࡠ൘ᰙᵏ䇝㓳ѝᴹ儈 Qˆ ٬Ⲵࣘ֌ˈ㘼н㜭ཏ᧒㍒ࡠަԆਟ㜭ᴹᴤ儈٬
ᗇࣘ֌DŽᇎ䱵кˈк䶒Ⲵ᭦ᮋᙗᇊ⨶㾱≲⇿њ⣦ᘱ-ࣘ֌䖜ᦒᰐ䲀仁㑱ൠਁ⭏DŽᱮ❦ˈྲ᷌
agent ᙫ䘹ᤙ֯ᖃࡽ Q̂ (s,a)ᴰབྷⲴࣘ֌ˈሶн㜭‫؍‬䇱↔ᰐ䲀仁㑱ᙗDŽഐ↔ˈ൘ Q ᆖҐѝ䙊ᑨ֯
⭘ᾲ⦷Ⲵ䙄ᖴᶕ䘹ᤙࣘ֌DŽᴹ䖳儈 Qˆ ٬Ⲵࣘ֌㻛䍻Ҹ䖳儈Ⲵᾲ⦷ˈնᡰᴹࣘ֌Ⲵᾲ⦷䜭䶎 0DŽ
䍻Ҹ䘉⿽ᾲ⦷Ⲵа⿽ᯩ⌅ᱟ

ˆ
k Q ( s ,ai )
P(ai | s )
¦
Qˆ ( s , a j )
j
k

ަѝP(ai|s)Ѫagent൘⣦ᘱsᰦ䘹ᤙࣘ֌aiⲴᾲ⦷ˈk>0 Ѫаᑨ䟿ˈᆳ⺞ᇊ↔䘹ᤙՈ‫ݸ‬㘳㲁儈
Q̂ ٬Ⲵ〻ᓖDŽ䖳བྷⲴk٬Պሶ䖳儈Ⲵᾲ⦷䍻Ҹ䎵ࠪᒣ൷ Q̂ Ⲵࣘ֌ˈ㠤֯agent࡙⭘ᆳᡰᆖҐࡠⲴ
⸕䇶ᶕ䘹ᤙᆳ䇔ѪՊ֯എᣕᴰབྷⲴࣘ֌DŽ⴨৽ˈ䖳ሿⲴk٬Պ֯ަԆࣘ֌ᴹ䖳儈Ⲵᾲ⦷ˈሬ㠤
agent᧒㍒䛓Ӌᖃࡽ Q̂ ٬䘈н儈Ⲵࣘ֌DŽ൘ḀӋᛵߥлˈkᱟ䲿⵰䘝ԓ⅑ᮠ㘼ਈॆⲴDŽԕ֯agent
൘ᆖҐⲴᰙᵏਟ⭘᧒㍒රㆆ⮕ˈ❦ਾ䙀↕䖜ᦒࡠ࡙⭘රⲴㆆ⮕DŽ

13.3.6 ᴪ᯦ᓅࡍ

к䶒᭦ᮋᙗᇊ⨶ањ䟽㾱ᙗ᳇⽪൘ҾˈQ ᆖҐн䴰㾱⭘ᴰՈࣘ֌䘋㹼䇝㓳ˈቡਟԕ᭦ᮋࡠ
ᴰՈㆆ⮕DŽᇎ䱵кˈਚ㾱⇿↕Ⲵ䇝㓳ࣘ֌ᆼ‫ޘ‬䲿ᵪ䘹ᤙˈ֯ᗇ㔃᷌䇝㓳ᒿࡇᰐ䲀仁㑱Ⲵ䇯䰞⇿
њ⣦ᘱ-ࣘ֌䖜ᦒˈቡਟԕᆖҐࡠ Q ࠭ᮠ˄ԕ৺ᴰՈㆆ⮕˅DŽ䘉аһᇎᔪ䇞᭩ਈ䇝㓳䖜ᦒṧֻ
Ⲵᒿࡇˈԕ᭩䘋䇝㓳᭸⦷㘼нড৺ᴰ㓸Ⲵ᭦ᮋᙗDŽѪ䈤᰾䘉а⛩ˈ޽⅑㘳㲁൘ањ MDP ѝᴹ
অњ੨᭦ⴞḷ⣦ᘱⲴᆖҐ䗷〻ˈྲ਼ 13-1 ѝᡰ⽪DŽྲԕࡽ䛓ṧˈ‫ٷ‬ᇊ֯⭘ᒿࡇॆⲴᛵ㢲
˄episode˅ᶕ䇝㓳 agentDŽሩ⇿њᛵ㢲ˈagent 㻛᭮㖞൘ањ䲿ᵪࡍ࿻⣦ᘱˈ❦ਾᢗ㹼ࣘ֌ԕᴤ
ᯠަ Q̂ 㺘ˈⴤࡠᆳࡠ䗮੨᭦⣦ᘱDŽ❦ਾᔰ࿻ањᯠⲴ䇝㓳ᛵ㢲ˈ䙊䗷ሶ agent Ӿⴞḷ⣦ᘱ䖜ᦒ
ࡠањᯠⲴ䲿ᵪࡍ࿻⣦ᘱDŽྲࡽ䶒ᤷࠪⲴˈྲ᷌ᔰ࿻ᡰᴹ Q̂ ٬Ⲵࡍ࿻ॆѪ 0ˈࡉ൘ㅜањᛵ㢲
ਾˈagent Ⲵ Qˆ 㺘ѝਚᴹањ㺘亩᭩ਈ˖ণሩᓄҾᴰਾ䖜ᦒࡠⴞḷ⣦ᘱⲴ㺘亩DŽྲ᷌൘ㅜҼњ
ᛵ㢲ѝˈagent ᚠྭӾ⴨਼Ⲵ䲿ᵪࡍ࿻⣦ᘱ⋯⵰⴨਼ࣘ֌ᒿࡇ〫ࣘˈࡉਖа㺘亩ਈѪ䶎 0ˈ‫↔׍‬
㊫᧘DŽྲ᷌䟽༽ൠԕ⴨਼Ⲵᯩᔿ䘀㹼ᛵ㢲ˈ䶎 0 Qˆ ٬Ⲵ䗩㕈䙀⑀ੁਣ〫ࣘˈӾⴞḷ⣦ᘱᔰ࿻ˈ
⇿њᛵ㢲〫ࣘࡠањᯠⲴ⣦ᘱ-ࣘ֌䖜ᦒDŽ⧠൘㘳㲁൘䘉Ӌ⴨਼Ⲵ⣦ᘱ-ࣘ֌䖜ᦒкⲴ䇝㓳ˈն
ሩ⇿њᛵ㢲ԕ৽ੁⲴᰦᒿDŽণሩ⇿њ㘳㲁Ⲵ䖜ᦒᓄ⭘ᔿ 13-7 ѝ⴨਼Ⲵᴤᯠ㿴ࡉˈնԕ䘶ᒿᢗ
㹼䘉ӋᴤᯠDŽ䘉ṧˈ൘ㅜањᛵ㢲ਾˈagent Պᴤᯠ䗮ࡠⴞḷ䐟ᖴк⇿њ䖜ᦒⲴ Q̂ ՠ䇑DŽ↔䇝
㓳䗷〻ᱮ❦Պ൘ᴤቁⲴᗚ⧟⅑ᮠ޵᭦ᮋˈ㲭❦ᆳ㾱≲ agent ൘ᔰ࿻↔ᛵ㢲䇝㓳ࡽ֯⭘ᴤཊⲴ޵
ᆈᶕᆈۘᮤњᛵ㢲DŽ

᭩䘋᭦ᮋ䙏⦷ⲴㅜҼњㆆ⮕ᱟᆈۘ䗷৫Ⲵ⣦ᘱ-ࣘ֌䖜ᦒˈԕ৺⴨ᓄ᭦ࡠⲴ・ণഎᣕˈ❦
ਾઘᵏᙗൠ൘ަк䟽ᯠ䇝㓳DŽᔰ࿻ਟ㜭Պ䇔Ѫ⭘⴨਼Ⲵ䖜ᦒ䟽ᯠ䇝㓳ᱟ‫ڊ‬ᰐ⭘࣏DŽն⌘᜿ࡠᴤ
ᯠⲴ Qˆ (s,a)٬ᱟ⭡ਾ㔗⣦ᘱ s´= ¥ (s,a)Ⲵ Qˆ (s´,a)٬⺞ᇊⲴDŽഐ↔ˈྲ᷌ਾ㔝Ⲵ䇝㓳᭩ਈҶ
Q̂ (s,a)٬ަѝањˈ൘䖜ᦒ<s,a>к䟽䇝㓳Պᗇࡠ Q̂ (s,a)Ⲵн਼٬DŽа㡜ൠˈᡁԜᐼᵋ䟽᭮ᰗ
Ⲵ䖜ᦒ⴨∄ҾӾ⧟ຳѝ㧧ᗇᯠ䖜ᦒⲴ〻ᓖਆߣҾ䘉є⿽᫽֌൘⢩ᇊ䰞仈亶ฏѝ⴨ሩᔰ䬰DŽֻྲ
൘ᵪಘӪሬ㡚ࣘ֌Ⲵ亶ฏˈަࣘ֌ᢗ㹼䴰㾱ᮠ。Ⲵᰦ䰤ˈӾཆ䜘ц⭼᭦䳶ᯠⲴ⣦ᘱ-ࣘ֌䖜ᦒ
Ⲵᔦ䘏Պ∄൘޵䜘䟽᭮ԕࡽ㿲ሏ䗷Ⲵ䖜ᦒⲴᔰ䬰㾱བྷ㤕ᒢᮠ䟿㓗DŽ⭡Ҿ Q ᆖҐ䙊ᑨ㾱≲ᡀॳ
кзⲴ䇝㓳ᗚ⧟᡽᭦ᮋˈ䘉⿽ᐞ࡛ᱮᗇॱ࠶䟽㾱ⲴDŽ

⌘᜿䍟ク൘к䘠䇘䇪ѝⲴєњ‫ٷ‬ᇊᱟˈagent н⸕䚃⧟ຳ⭘ᶕ⭏ᡀਾ㔗⣦ᘱ s´Ⲵ⣦ᘱ䖜ᦒ


࠭ᮠ¥(s,a)ˈҏн⸕䚃⭏ᡀഎᣕⲴ࠭ᮠ r(s,a)DŽྲ᷌ᆳ⸕䚃Ҷ䘉єњ࠭ᮠˈቡਟ㜭ᴹᴤཊᴹ᭸
Ⲵᯩ⌅DŽֻྲˈྲ᷌ᢗ㹼ཆ䜘ࣘ֌ᔰ䬰ᖸབྷˈ agent ਟԕㆰঅൠᘭ⮕⧟ຳˈ൘ަ޵䜘⁑ᤏ⧟
ຳˈᴹ᭸⭏ᡀ⁑ᤏࣘ֌ᒦ䍻Ҹ䘲ᖃⲴ⁑ᤏഎᣕˈSutton˄1991˅᧿䘠Ҷ Dyna փ㌫㔃ᶴˈᆳ൘
ཆ䜘ц⭼ѝᢗ㹼Ⲵ⇿↕ࣘ֌ਾᢗ㹼аᇊᮠ䟿Ⲵ⁑ᤏࣘ֌DŽMoore & Atkeson˄1993˅᧿䘠Ҷа
⿽〠ѪՈ‫ݸ‬㓗ᢛ䲔˄prioritized sweeping˅Ⲵ䙄ᖴˈ䘹ᤙᴰਟ㜭Ⲵ⣦ᘱᶕᴤᯠлањˈ⵰䟽Ҿ
ᖃࡽ⣦ᘱᴹ䖳བྷᴤᯠᰦⲴࡽ傡⣦ᘱDŽPeng & Williams˄1994˅᧿䘠Ҷањ⴨լⲴ䙄ᖴDŽӾࣘᘱ
㿴ࡂ亶ฏᶕⲴབྷ䟿ᴹ᭸㇇⌅ਟ㻛ᓄ⭘Ҿ࠭ᮠ¥઼ r ᵚ⸕ⲴᛵߥDŽKaelbling et al.˄1996˅䈳ḕҶ
ަѝⲴࠐ⿽㇇⌅DŽ

13.4 䶔⺤ᇐᙝഔᣛૂࣞ֒

к䶒ᡁԜ㘳㲁Ҷ⺞ᇊᙗ⧟ຳлⲴ Q ᆖҐDŽ䘉䟼ᡁԜ㘳㲁䶎⺞ᇊᙗᛵߥˈަѝഎᣕ࠭ᮠ
r(s,a)઼ࣘ֌䖜ᦒ࠭ᮠ¥(s,a)ਟ㜭ᴹᾲ⦷Ⲵ䗃ࠪDŽֻྲˈ൘ Tesauro˄1995˅Ⲵ㾯⌻ৼ䱶ỻሩᔸ
〻ᒿѝˈ䗃ࠪⲴࣘ֌ᱟާᴹപᴹⲴᾲ⦷ᙗⲴˈഐѪ⇿⅑〫ࣘ䴰㾱᧧僠ᆀߣᇊDŽ㊫լⲴˈ൘ᴹಚ
༠ⲴՐᝏಘ઼᭸ᓄಘⲴᵪಘӪѝˈሶࣘ֌઼എᣕᔪ᪨Ѫ䶎⺞ᇊᙗ䗷〻䖳Ѫਸ䘲DŽ൘䘉ṧⲴᛵߥ
лˈ࠭ᮠ¥(s,a)઼ r(s,a)ਟ㻛ⴻ֌ᱟ俆‫ݸ‬สҾ s ઼ a ӗ⭏䗃ࠪⲴᾲ⦷࠶ᐳˈ❦ਾ᤹↔࠶ᐳᣭਆ䲿
ᵪⲴ䗃ࠪDŽᖃ䘉Ӌᾲ⦷࠶ᐳѫ㾱‫׍‬䎆Ҿ s ઼ a ᰦ˄ֻྲˈᆳԜн‫׍‬䎆ԕࡽⲴ⣦ᘱ઼ࣘ֌˅ˈᡁ
Ԝਟ〠䘉њ㌫㔏Ѫ䶎⺞ᇊᙗ傜ቄਟཛߣㆆ䗷〻DŽ

ᵜ㢲ѝᡁԜᢺ༴⨶⺞ᇊ䰞仈Ⲵ Q ᆖҐ㇇⌅ᢙኅࡠ䶎⺞ᇊᙗⲴ MDPDŽѪ䗮ࡠ䘉њⴞⲴˈᡁ


Ԝഎ亮൘⺞ᇊᙗᛵߥлⲴ㇇⌅᧘ሬ↕僔ˈ൘䴰㾱ᰦሩަ‫↓؞ࠪڊ‬DŽ

൘䶎⺞ᇊᙗᛵߥлˈᡁԜᗵ享‫ݸ‬䟽ᯠਉ䘠ᆖҐಘⲴⴞḷˈԕ㘳㲁ࣘ֌Ⲵ䗃ࠪн޽ᱟ⺞ᇊᙗ
±
ⲴᛵߥDŽᖸ᰾ᱮˈа⿽а㡜ॆⲴᯩ⌅ᱟᢺањㆆ⮕±Ⲵ٬V 䟽ᇊѹѪᓄ⭘↔ㆆ⮕ᰦ᭦ࡠᣈ㇇㍟
〟എᣕⲴᵏᵋ٬˄൘䘉Ӌ䶎⺞ᇊᙗ䗃ࠪк˅DŽ

ªf º
V S ( st ) { E «¦ J i rt i »
¬i 0 ¼

ྲԕࡽ䛓ṧˈަѝഎᣕᒿࡇrt+iᱟӾ⣦ᘱsᔰ࿻䚥ᗚㆆ⮕±⭏ᡀDŽ⌘᜿↔ᔿᱟᔿ 13.1 Ⲵа㡜


ॆᖒᔿˈਾ㘵㾶ⴆҶ⺞ᇊᙗⲴᛵᖒDŽ

±
ྲԕࡽ䛓ṧˈᡁԜᇊѹᴰՈㆆ⮕±*Ѫᡰᴹ⣦ᘱsѝ֯V (s)ᴰབྷॆⲴㆆ⮕±DŽла↕ᡁԜᢺ
‫ࡽݸ‬ᔿ 13.4 ѝሩQⲴᇊѹа㡜ॆˈ޽а⅑䘀⭘ަᵏᵋ٬DŽ

Q( s, a) { E[r ( s, a)  JV * (G ( s, a))]

E[r ( s, a)]  JE[V * (G ( s, a ))]

E[r ( s, a)]  J ¦ P ( s c | s, a)V * ( s c) ˄13.8˅


sc

ަѝP(s´|s,a)Ѫ൘⣦ᘱs䟷ਆࣘ֌aՊӗ⭏лањ⣦ᘱѪs´Ⲵᾲ⦷DŽ⌘᜿ᡁԜ൘䘉䟼ᐢ㓿֯⭘
ҶP(s´|s,a)ᶕ᭩߉V*(¥(s,a))Ⲵᵏᵋ٬ˈᖒᔿѪоᾲ⦷ᙗⲴ¥Ⲵਟ㜭䗃ࠪ⴨‫ޣ‬㚄Ⲵᾲ⦷DŽ

ྲԕࡽˈਟሶ Q 䟽ᯠ㺘䗮Ѫ䙂ᖂⲴᖒᔿ˖

Q ( s, a ) E[r ( s, a)]  J ¦ P( s c | s, a) max Q ( s c, a c) ˄13.9˅


a'
sc

ᆳᱟࡽ䶒ᔿ 13.6 Ⲵа㡜ॆᖒᔿDŽᾲᤜൠ䈤ˈᡁԜᢺ䶎⺞ᇊᙗᛵߥлⲴ Q(s,a)ㆰঅൠ䟽ᇊѹ


Ѫ⺞ᇊᙗᛵߥлᇊѹⲴ䟿Ⲵᵏᵋ٬DŽ

ᡁԜᐢ㓿ᢺQⲴᇊѹа㡜ॆԕ䘲ᓄ䶎⺞ᇊᙗ⧟ຳлⲴ࠭ᮠr઼¥ˈ⧠൘ᡰ䴰㾱Ⲵᱟањᯠ䇝
㓳⌅ࡉDŽࡽ䶒ሩ⺞ᇊᙗᛵᖒ᧘ሬⲴ䇝㓳⌅ࡉ˄ᔿ 13.7˅н㜭ཏ൘䶎⺞ᇊᙗᶑԦл᭦ᮋDŽֻྲˈ
㘳㲁ањ䶎⺞ᇊᙗഎᣕ࠭ᮠr(s,a)ˈ⇿⅑䟽༽<s,a>䖜ᦒᰦӗ⭏н਼ⲴഎᣕDŽ䘉ṧˈণ֯ Q̂ 㺘٬
㻛ࡍ࿻ॆѪ↓⺞ⲴQ࠭ᮠˈ䇝㓳㿴ࡉӽՊнᯝⲴ᭩ਈ Q̂ (s,a)Ⲵ٬DŽㆰ㾱Ⲵ䈤ˈ↔䇝㓳㿴ࡉн᭦
ᮋDŽ↔䳮仈Ⲵ䀓ߣਟ䙊䗷‫؞‬᭩䇝㓳㿴ࡉˈԔަ֯⭘ᖃࡽ Qˆ ٬઼‫Ⲵ↓؞‬ՠ䇑Ⲵањ㺠߿Ⲵ࣐ᵳᒣ
൷DŽ⭘ Qˆ nᶕԓ㺘ㅜn⅑ᗚ⧟ѝagentⲴՠ䇑ˈл䶒‫؞‬᭩ਾⲴ䇝㓳㿴ࡉ䏣ԕ‫؍‬䇱 Qˆ ᭦ᮋࡠQDŽ

Qˆ n ( s, a) m (1  D n )Qˆ n 1 ( s, a )  D n [r  J max Qˆ n 1 ( s c, a c)] ˄13.10˅


ac

ަѝ
1
Dn ˄13.11˅
1  visits n ( s, a)
ަѝs઼aѪㅜn⅑ᗚ⧟ѝᴤᯠⲴ⣦ᘱ઼ࣘ֌ˈ㘼фvisitsn(s,a)Ѫ↔⣦ᘱ-ࣘ֌ሩ൘䘉n⅑ᗚ⧟
޵˄वᤜㅜn⅑ᗚ⧟˅㻛䇯䰞Ⲵᙫ⅑ᮠDŽ

൘↔‫↓؞‬ҶⲴ㿴ࡉѝ‫ޣ‬䭞ᙍᜣ൘Ҿሩ Q̂ Ⲵᴤᯠ∄⺞ᇊᙗᛵߥлᴤѪᒣ㕃DŽ⌘᜿ˈྲ᷌൘ᔿ
13.10 ѝᢺ¢n䇮㖞Ѫ 1ˈਟᗇࡠ⺞ᇊᙗᛵᖒлⲴ䇝㓳㿴ࡉDŽ֯⭘䖳ሿⲴ¢٬ˈ䈕亩ਟԕ㻛ᖃࡽ
Ⲵ Q̂ (s,a)൷ॆԕӗ⭏ᯠⲴᴤᯠ٬DŽ൘ᔿ 13.11 ѝ¢nⲴ٬䲿nⲴ໎䮯㘼߿ሿˈഐ↔ᖃ䇝㓳䘋㹼ᰦ
ᴤᯠ〻ᓖ䙀⑀ਈሿDŽ൘䇝㓳ѝԕаᇊ䙏⦷߿ሿ¢ˈਟԕ䗮ࡠ᭦ᮋࡠ↓⺞Q࠭ᮠⲴⴞⲴDŽк䶒㔉
ࠪⲴ¢nⲴ䘹ᤙᱟ┑䏣᭦ᮋᙗᶑԦⲴ䘹ᤙѻаˈᆳ᤹➗л䶒Ⲵᇊ⨶˄㿱Watkn & Danyan 1992˅

ᇊ⨶ 13.2 ሩ䶎⺞ᇊᙗ傜ቄਟཛߣㆆ䗷〻ⲴQᆖҐ᭦ᮋᙗDŽ㘳㲁ањQᆖҐagent൘а䶎⺞ᇊᙗMDP
ѝˈᒦфᴹᴹ⭼Ⲵഎᣕ (s, a ) | r ( s, a ) |d c DŽ↔QᆖҐagent֯⭘ᔿ 13.10 Ⲵ䇝㓳㿴ࡉˈࡍ࿻ॆ㺘 Q̂ (s,a)
Ѫԫ᜿ᴹ䲀٬ˈᒦф֯⭘ᣈ㇇ഐᆀ 0ݤ<1ˈԔn(i,s,a)Ѫሩᓄࣘ֌aㅜi⅑ᓄ⭘Ҿ⣦ᘱsⲴ䘝ԓDŽྲ᷌⇿њ
⣦ᘱ-ࣘ֌ሩ㻛ᰐ䲀仁㑱䇯䰞ˈ0İ¢n<1ˈᒦф

f f

¦ D n (i ,s ,a )
i 1
f, ¦ [D
i 1
n (i , s ,a ) ]2  f

䛓Ѹሩᡰᴹs઼aˈᖃnėĞᰦˈ Q̂ n(s,a) ėQ(s,a)ˈᾲ⦷Ѫ 1DŽ

㲭❦ Q ᆖҐ઼ᴹ‫Ⲵޣ‬໎ᕪ㇇⌅ਟ㻛䇱᰾൘аᇊᶑԦл᭦ᮋˈ൘֯⭘ Q ᆖҐⲴᇎ䱵㌫㔏
ѝˈ䙊ᑨ䴰㾱ᮠԕॳ䇑Ⲵ䇝㓳ᗚ⧟ԕ᭦ᮋDŽֻྲˈTesauro Ⲵ㾯⌻ৼ䱶ỻሩᔸ֯⭘ 150 зњሩ
ᔸỻተ䘋㹼䇝㓳ˈ⇿⅑वᤜᮠॱњ⣦ᘱ-ࣘ֌䖜ᦒDŽ

13.5 ᰬ䰪ᐤࡡᆜҖ(temporal difference learning ⷢᰬᐤ࠼ᆜҖ)


Q ᆖҐ㇇⌅ⲴᆖҐ䗷〻ᱟᗚ⧟ൠ߿ሿሩ⴨䛫⣦ᘱⲴ Q ٬Ⲵՠ䇑ѻ䰤ⲴᐞᔲDŽ൘䘉њ᜿ѹ
кˈQ ᆖҐᱟᴤᒯ⌋Ⲵᰦ䰤ᐞ࡛˄temporal difference˅㇇⌅ѝⲴ⢩ֻDŽᰦ䰤ᐞ࡛ᆖҐ㇇⌅ᆖҐ
䗷〻ᱟ߿ሿ agent ൘н਼Ⲵᰦ䰤‫ࠪڊ‬ՠ䇑ѻ䰤ⲴᐞᔲDŽഐѪᔿ 13.10 Ⲵ㿴ࡉ߿ሿҶሩḀ⣦ᘱⲴ
Q̂ ٬ՠ䇑ԕ৺ަ・ণਾ㔗Ⲵ Q̂ ՠ䇑ѻ䰤ⲴᐞˈᡁԜҏਟԕ䇮䇑㇇⌅ᶕ߿ሿ↔⣦ᘱоᴤ䘌Ⲵਾ
㔗ᡆࡽ䎻⣦ᘱѻ䰤ⲴᐞᔲDŽ

Ѫ䘋а↕᧒䇘䘉а䰞仈ˈഎᗶалQᆖҐˈᆳⲴ䇝㓳㿴ࡉ䇑㇇ࠪⲴ Q̂ (st,at)Ⲵ䇝㓳٬ᱟԕ
Q̂ (st+1,at+1)㺘⽪Ⲵˈަѝst+1ᱟᓄ⭘ࣘ֌atࡠ⣦ᘱstⲴ㔃᷌DŽԔQ(1)(st,at)Ѫ↔অ↕ࡽⷫ䇑㇇Ⲵ䇝㓳
٬˖

Q (1) ( st , at ) { rt  J max Qˆ ( st 1 , a)
a

䇑㇇Q(st,at)䇝㓳٬Ⲵਖа⿽ᯩ⌅ᱟสҾє↕Ⲵ㿲ሏࡠⲴഎᣕ˖

Q ( 2 ) ( st , at ) { rt  Jrt 1  J 2 max Qˆ ( st  2 , a)
a
ԕ৺൘а㡜Ⲵᛵߥл n ↕Ⲵഎᣕ˖

Q ( n ) ( st , at ) { rt  Jrt 1    J ( n 1) rt  n 1  J n max Qˆ ( st  n , a)


a

Sutton ӻ㓽Ҷ␧ਸ䘉Ӌн਼䇝㓳ՠ䇑Ⲵа㡜ᯩ⌅ˈ〠Ѫ TD(¬)DŽ䘉аᜣ⌅ᱟ֯⭘ᑨ䟿 0İ


¬İ1 ᶕਸᒦӾн਼ࡽⷫ䐍⿫ѝ㧧ᗇⲴՠ䇑ˈ㿱лᔿ˖

> @
Q O ( st , at ) { (1  O ) Q (1) ( st , at )  OQ ( 2) ( st , at )  O2 Q (3) ( st , at )  

¬
Q ⲴањㅹԧⲴ䙂ᖂᇊѹѪ˖

Q O ( st , at ) rt  J [(1  O ) max Qˆ ( s t , at )  OQ O ( st 1 , at 1 )]
a

⌘᜿ྲ᷌ᡁԜ䘹ᤙ¬=0ˈࡉᗇࡠ৏ᶕⲴ䇝㓳ՠ䇑Q(1)ˈᆳਚ㘳㲁 Q̂ ՠ䇑ѝⲴঅ↕ᐞᔲDŽᖃ
¬໎བྷᰦˈ↔㇇⌅䟽⛩䙀⑀䖜〫ࡠᴤ䘌Ⲵࡽⷫ↕ѝDŽ൘ᶱㄟᛵߥ¬=1 ᰦˈਚ㘳㲁㿲ሏࡠⲴrt+i
¬
٬ˈᖃࡽⲴ Q̂ ՠ䇑ሩަ⋑ᴹ䍑⥞DŽ⌘᜿ᖃ Q̂ =Qᰦˈ⭡Q 㔉ࠪⲴ䇝㓳٬ሩҾ 0ݬİ1 Ⲵᡰᴹ
¬٬䜭⴨਼DŽ

TD(¬)Ⲵࣘᵪᱟˈ൘ḀӋᶑԦлˈྲ᷌㘳㲁ᴤ䘌Ⲵࡽⷫˈ䇝㓳Պᴤᴹ᭸DŽֻྲˈᖃagent
¬
䚥ᗚᴰՈㆆ⮕䘹ᤙࣘ֌ᰦˈ¬=1 ⲴQ ሶᨀ‫׋‬ሩⵏᇎQ٬Ⲵᆼ㖾ՠ䇑ˈн䇪 Q̂ ᴹཊѸн㋮⺞DŽ
ਖаᯩ䶒ˈྲ᷌ࣘ֌ᒿࡇⲴ䘹ᤙᱟ⅑ՈⲴˈ䛓ѸሩᵚᶕⲴ㿲ሏrt+iਟ㜭ᴹ䈟ሬᙗDŽ

¬
Peng & Williams˄1994˅ᨀ‫׋‬Ҷ䘋а↕Ⲵ䇘䇪઼ᇎ傼㔃᷌ˈᱮ⽪ҶQ ൘ањ䰞仈亶ฏкⲴ
ঃ䎺ᙗ㜭DŽDayan(1992)ᱮ⽪Ҷ൘аᇊᶑԦл㿱㊫լⲴTD(¬)ᯩ⌅ᓄ⭘ࡠᆖҐV*࠭ᮠѝˈሩҾ 0
ݬİ1 Ⲵԫ᜿¬٬䜭ਟ↓⺞᭦ᮋDŽTesauro(1995) ൘ަTD-Gammon〻ᒿ㾯⌻ৼ䱶ỻሩᔸѝ֯
⭘ҶTD(¬)ᯩ⌅DŽ

13.6 Ԅṭׁѣ⌑ौ

㠣↔ˈ൘ Q ᆖҐѝਟ㜭ᴰާᴹ㓖ᶏᙗⲴ‫ٷ‬ᇊᱟަⴞḷ࠭ᮠ㻛㺘⽪ѪањᱮᔿⲴḕ᢮㺘ˈ
ሩ⇿њн਼䗃‫ޕ‬٬˄ণ⣦ᘱ-ࣘ֌ሩ˅ᴹањ㺘亩DŽഐ↔ᡁԜⲴ䇘䇪Ⲵ㇇⌅ᢗ㹼а⿽ᵪỠⲴᆖ
Ґᯩ⌅ ˈᒦфнՊቍ䈅䙊䗷ӾᐢⴻࡠⲴ⣦ᘱ-ࣘ֌ሩѝ⌋ॆԕՠ䇑ᵚⴻࡠⲴ⣦ᘱ-ࣘ֌ሩⲴ Q
٬DŽ䘉њᵪỠᆖҐ‫ٷ‬ᇊ൘᭦ᮋᙗ䇱᰾ѝ৽᱐ࠪᶕˈᆳ䇱᰾Ҷਚᴹ⇿њਟ㜭Ⲵ⣦ᘱ-ࣘ֌㻛ᰐ䲀
仁㑱Ⲵ䇯䰞ˈᆖҐ䗷〻᡽Պ᭦ᮋDŽ൘བྷⲴᡆᰐ䲀Ⲵオ䰤ѝˈᡆ㘵ᢗ㹼ࣘ֌Ⲵᔰ䬰ᖸབྷᰦˈ䘉ᱮ
❦ᱟн࠷ᇎ䱵Ⲵ‫ٷ‬ᇊDŽ֌Ѫ㔃᷌ˈᴤᇎ䱵Ⲵ㌫㔏䙊ᑨਸᒦҶަԆㄐ䇘䇪Ⲵ࠭ᮠ䙬䘁ᯩ⌅ԕ৺䘉
䟼䇘䇪Ⲵ Q ᆖҐ䇝㓳㿴ࡉDŽ

ᖸᇩ᱃ᢺ৽ੁՐ᫝䘉ṧⲴ࠭ᮠ䙬䘁㇇⌅㔃ਸࡠ Q ᆖҐ㇇⌅ѝˈ䙊䗷⭘⾎㓿㖁㔌ᴯԓḕ᢮
㺘ˈᒦфᢺ⇿њ Q̂ (s,a)ᴤᯠ֌Ѫ䇝㓳ṧֻDŽֻྲˈᡁԜਟᢺ⣦ᘱ s ઼ࣘ֌ a 㕆⸱Ѫ㖁㔌䗃‫ˈޕ‬
ᒦф䇝㓳㖁㔌ԕ䗃ࠪ Q̂ Ⲵⴞḷ٬ˈ൘㔉ᇊᔿ 13.7 ઼ᔿ 13.10 Ⲵ䇝㓳㿴ࡉⲴᶑԦлˈਖа⿽ᴹᰦ
൘ᇎ䐥ѝᴤᡀ࣏Ⲵᯩ⌅ᱟሩ⇿њࣘ֌䇝㓳ањঅ⤜Ⲵ㖁㔌ˈ֯⭘⣦ᘱ֌Ѫ䗃‫ ˈޕ‬Q̂ Ѫ䗃ࠪDŽ䘈
ᴹа⿽䙊ᑨ֯⭘Ⲵᯩ⌅ᱟ䇝㓳ањ㖁㔌ˈᆳԕ⣦ᘱ֌Ѫ䗃‫ˈޕ‬նሩ⇿њࣘ֌䗃ࠪањ Q̂ ٬DŽഎ
ᗶㅜ 1 ㄐѝᡁԜ䇘䇪Ҷ൘ỻⴈ⣦ᘱк֯⭘㓯ᖒ࠭ᮠ઼ LMS ㇇⌅ᶕ䙬䘁ՠ䇑࠭ᮠDŽ

൘ᇎ䐥ѝˈᐢᔰਁࠪҶ䇨ཊᡀ࣏Ⲵ໎ᕪᆖҐ㌫㔏ˈᆳԜ䙊䗷㔃ਸ䘉ṧⲴ࠭ᮠ䙬䘁㇇⌅ᶕԓ
ᴯḕ᢮㺘DŽTesauro Ⲵᡀ࣏Ⲵ TD-Gammon 〻ᒿ֯⭘Ҷ⾎㓿㖁㔌઼৽ੁՐ᫝㇇⌅ˈо TD(¬)䇝
㓳㿴ࡉ⴨㔃ਸDŽZhang & Dietterich(1996)֯⭘⴨լⲴ৽ੁՐ᫝о TD(¬)Ⲵ㔃ਸ⭘Ҿ job-shop 䈳
ᓖԫ࣑DŽ Crites & Barto˄1996˅᧿䘠Ҷањ⾎㓿㖁㔌໎ᕪᆖҐᯩ⌅ˈ⭘Ҿ⭥ở䈳ᓖԫ࣑DŽ
Thrun(1996)ᣕ੺ҶањสҾ⾎㓿㖁㔌Ⲵ Q ᆖҐˈᆳਟᆖҐᑖᴹ༠㓣઼ᩴ‫ۿ‬ཤՐᝏಘⲴ〫ࣘᵪ
ಘӪⲴสᵜ᧗ࡦ䗷〻DŽMahadevan & Connell(1991)᧿䘠ҶањสҾ㚊㊫⣦ᘱⲴ Q ᆖҐᯩ⌅ˈᓄ
⭘ҾㆰঅⲴ〫ࣘᵪಘӪ᧗ࡦ䰞仈DŽ

㲭❦䘉Ӌ㌫㔏㧧ᗇҶᡀ࣏ˈሩҾަԆⲴԫ࣑ˈаնᕅ‫ޕ‬Ҷ⌋ॆ࠭ᮠ䙬䘁ಘˈ໎ᕪᆖҐሶн
㜭᭦ᮋDŽ䘉ṧⲴᴹ䰞仈Ⲵԫ࣑⭡Boyan & Moore(1995)ˈBaird(1995)઼Gordon(1995)ӻ㓽DŽ⌘᜿
ᵜㄐࡽ䶒䇘䇪Ⲵ᭦ᮋᙗᇊ⨶ਚᓄ⭘Ҿ Qˆ 㺘⽪Ѫ᰾⺞Ⲵ㺘ᖒᔿᰦˈѪҶⴻࡠഠ䳮ᡰ൘ˈ㘳㲁֯⭘
ањ⾎㓿㖁㔌㘼нᱟ᰾⺞Ⲵ㺘ᶕ㺘⽪ Q̂ DŽྲ᷌ᆖҐಘᴤᯠ㖁㔌ԕᴤྭൠ३䝽⢩ᇊ䖜ᦒⲴ<si,ai>
Ⲵ䇝㓳Q٬ˈਈॆҶⲴ㖁㔌ᵳ٬ҏՊ‫؞‬᭩ަԆⲴԫ᜿䖜ᦒⲴ Q̂ ՠ䇑DŽഐѪ䘉Ӌᵳ٬ਈॆՊ໎࣐
ަԆ䖜ᦒⲴ Q̂ ՠ䇑Ⲵ䈟ᐞˈ৏ᶕᇊ⨶ѝⲴ䇱᰾↕僔н޽ᡀ・DŽ‫ޣ‬Ҿᑖᴹ⌋ॆ࠭ᮠ䙬䘁ಘⲴ໎ᕪ
ᆖҐⲴ⨶䇪࠶᷀⭡Gordon(1995)઼Tsitsiklis(1994)֌ࠪDŽBaird(1995)ᨀࠪҶสҾởᓖⲴᯩ⌅ˈᆳ
䙊䗷ⴤ᧕ᴰሿॆሩ⴨䛫⣦ᘱⲴՠ䇑ѝⲴᐞᔲᒣᯩ઼ᶕ䀓ߣ䘉а䳮仈˄ҏ㻛〠ѪBellman↻⮉䈟
ᐞBellman residual error˅DŽ

13.7 фࣞᘷ㿺ࡈⲺ㚊㌱

‫ ۿ‬Q ᆖҐ䘉ṧⲴ໎ᕪᆖҐᯩ⌅ˈо䮯ᵏ⹄ウⲴ⭘Ҿ䀓ߣ傜ቄਟཛߣㆆ䗷〻Ⲵࣘᘱ㿴ࡂᯩ
⌅ᴹ⵰㍗ᇶⲴ㚄㌫DŽ䘉ӋᰙᵏⲴᐕ֌䙊䗷‫ٷ‬ᇊ agent ᤕᴹᆳᡰ༴⧟ຳⲴ࠭ᮠ¥(s,a)઼ r(s,a)Ⲵᆼ
㖾⸕䇶DŽഐ↔ˈᆳѫ㾱䀓ߣⲴ䰞仈ᱟ⭘ᴰሿⲴ䇑㇇䟿ᗇࡠᴰՈㆆ⮕ˈ‫ٷ‬ᇊ⧟ຳਟ㻛ᆼ㖾ൠ⁑
ᤏˈн䴰㾱ⴤ᧕ⲴӔӂDŽQ ᆖҐⲴ፝ᯠѻ༴൘Ҿᆳ‫ٷ‬ᇊнާᴹ¥(s,a)઼ r(s,a)Ⲵ⸕䇶ˈᆳн㜭
൘޵䜘⁑ᤏⲴ⣦ᘱオ䰤ѝ〫ࣘˈ㘼ᗵ享൘⧠ᇎц⭼ѝ〫ࣘᒦ㿲ሏਾ᷌DŽ൘ਾа⿽ᛵߥлᡁԜѫ
㾱㘳㲁Ⲵᱟ agent Ѫ᭦ᮋࡠањਟ᧕ਇⲴㆆ⮕ᗵ享ᢗ㹼Ⲵⵏᇎц⭼ࣘ֌ᮠ䟿ˈ㘼нᱟ享㣡䍩Ⲵ
䇑㇇䘝ԓ⅑ᮠDŽ৏ഐᱟ൘䇨ཊᇎ䱵Ⲵ亶ฏѝˈ∄ྲ⭏ӗ䰞仈ˈ൘ཆ䜘ц⭼ѝᢗ㹼ࣘ֌Ⲵᰦ䰤઼
䍩⭘ᔰ䬰∄䇑㇇ᔰ䬰ᴤ٬ᗇ‫⌘ޣ‬DŽ൘ⵏᇎ⧟ຳѝ〫ࣘ䘋㹼ᆖҐˈᒦф㿲ሏަ㔃᷌Ⲵ㌫㔏䙊ᑨ〠
Ѫ൘㓯(online)㌫㔏ˈ㘼ѫ㾱䙊䗷⁑ර⁑ᤏࣘ֌ⲴᆖҐ㻛〠Ѫ⿫㓯˄offline˅㌫㔏DŽ

䙊䗷㘳㲁 Bellman ㅹᔿˈਟԕ␵ᾊൠⴻࡠᰙᵏⲴᯩ⌅઼䘉䟼䇘䇪Ⲵ໎ᕪᆖҐ䰞仈ѻ䰤Ⲵᇶ


࠷⴨‫ޣ‬ᙗDŽBellman ㅹᔿᖒᡀҶ䀓ߣ MDP Ⲵࣘᘱ㿴ࡂᯩ⌅Ⲵส⹰ˈަᖒᔿྲл˖

(s  S )V * ( s ) E[r ( s, S ( s))  JV * (G ( s, S ( s)))]

䈧⌘᜿Bellmanㅹᔿ઼ࡽ䶒ᔿ 13.2 ѝᇊѹⲴᴰՈㆆ⮕ѻ䰤䶎ᑨ㍗ᇶⲴ㚄㌫DŽBellman(1957)


䇱᰾ҶᴰՈㆆ⮕±*┑䏣к䘠ㅹᔿˈф┑䏣↔ㅹᔿⲴㆆ⮕±ѪањᴰՈㆆ⮕DŽࣘᘱ㿴ࡂᯩ䶒Ⲵ
ᰙᵏᐕ֌वᤜBellman-Fordᴰ⸝䐟ᖴ㇇⌅˄Bellman 1958; Ford & Fulkerson 1962˅DŽᆳ䙊䗷н
ᯝᴤᯠ⇿њമ㔃⛩ࡠ㓸⛩Ⲵՠ䇑䐍⿫ˈᶕᆖҐമѝⲴ䐟ᖴˈสҾ㔃⛩䛫ትⲴ䐍⿫DŽ൘↔㇇⌅ѝ
മⲴ਴䗩ԕ৺ⴞḷ㔃⛩ᐢ⸕Ⲵ‫ٷ‬ᇊˈㅹԧҾ¥(s,a)઼r(s,a)ᐢ⸕Ⲵ‫ٷ‬ᇊDŽBarto et al.˄1995˅䇘
䇪Ҷ໎ᕪᆖҐ઼ࣘᘱ㿴ࡂⲴ㍗ᇶ㚄㌫DŽ

13.8 ቅ㔉ૂ㺛‫ݻ‬䈱⢟

ᵜㄐⲴ㾱⛩वᤜ˖
x ໎ᕪᆖҐ䀓ߣ㠚⋫ agent ᆖҐ᧗ࡦㆆ⮕Ⲵ䰞仈DŽᆳ‫ٷ‬ᇊ䇝㓳ؑ᚟ⲴᖒᔿѪሩ⇿њ⣦
ᘱ-ࣘ֌䖜ᦒ㔉ࠪⲴᇎ٬എᣕؑਧDŽagent ⲴⴞḷᱟᆖҐањ㹼ࣘㆆ⮕ˈᆳ֯ agent
Ӿԫ᜿䎧࿻⣦ᘱ᭦ࡠⲴᙫഎᣕѪᴰབྷDŽ
x ᵜㄐӻ㓽Ⲵ໎ᕪᆖҐ㇇⌅䘲ਸа㊫㻛〠Ѫ傜ቄਟཛߣㆆ䗷〻Ⲵ䰞仈DŽ൘傜ቄਟཛ
ߣㆆ䗷〻ѝˈᓄ⭘ԫ᜿ࣘ֌ࡠԫ᜿⣦ᘱкⲴ䗃ࠪਚਆߣҾ↔ࣘ֌઼⣦ᘱ˄оԕࡽ
Ⲵࣘ֌ᡆ⣦ᘱᰐ‫˅ޣ‬DŽ傜ቄਟཛߣㆆ䗷〻㾶ⴆҶ㤳തᖸᒯⲴ䰞仈ˈवᤜ䇨ཊᵪಘ
Ӫ᧗ࡦˈᐕল㠚ࣘॆ઼䈳ᓖ䰞仈DŽ
x Q ᆖҐᱟ໎ᕪᆖҐⲴа⿽ᖒᔿDŽަѝ agent ᆖҐⲴᱟа㓴⣦ᘱ઼ࣘ֌кⲴՠ䇑࠭
ᮠDŽ⺞࠷ൠ䇢ˈՠ䇑࠭ᮠ Q(s,a)㻛ᇊѹѪ agent ᓄ⭘ࣘ֌ a ࡠ⣦ᘱ s кਟ㧧ᗇⲴᴰ
བྷᵏᵋᣈ㇇〟㍟എᣕDŽQ ᆖҐⲴՈ⛩ᱟˈণ֯൘ᆖҐಘнާᴹަࣘ֌ᘾṧᖡ૽⧟ຳ
Ⲵ‫ݸ‬傼⸕䇶ᛵߥлˈ↔㇇⌅ӽਟᓄ⭘DŽ
x ਟԕ䇱᰾ˈ൘䘲ᖃ‫ٷ‬ᇊлˈྲ᷌ᆖҐಘⲴ‫ٷ‬䇮 Q̂ (s,a)㻛㺘⽪Ѫањḕ᢮㺘ˈфሩ⇿
њ<s,a>ሩᴹঅ⤜Ⲵ㺘亩ˈ䛓Ѹ Q ᆖҐਟԕ᭦ᮋࡠ↓⺞Ⲵ Q ࠭ᮠDŽ൘⺞ᇊᙗ઼䶎⺞
ᇊᙗⲴ MDP л↔㇇⌅䜭ਟ᭦ᮋDŽ൘ᇎ䐥ѝ Q ᆖҐণ֯൘㿴⁑䘲ѝⲴ䰞仈ѝҏ䴰㾱
ᮠॳ⅑Ⲵ䇝㓳ᗚ⧟DŽ
x Q ᆖҐᱟа㊫ᴤᒯ⌋Ⲵ〠Ѫᰦ䰤ᐞᔲ㇇⌅ѝⲴа⿽DŽа㡜䈤ᶕˈᰦ䰤ᐞᔲ㇇⌅䙊䗷
нᯝ߿ሿ agent ൘н਼ᰦ䰤޵ӗ⭏Ⲵՠ䇑Ⲵᐞᔲᶕ䘋㹼ᆖҐDŽ
x ໎ᕪᆖҐоᓄ⭘Ҿ傜ቄਟཛߣㆆ䗷〻Ⲵࣘᘱ㿴ࡂᴹ㍗ᇶ㚄㌫DŽަᐞᔲ‫ޣ‬䭞൘Ҿˈ
শਢк䘉Ӌࣘᘱ㿴ࡂᯩ⌅‫ٷ‬ᇊ agent ᤕᴹ⣦ᘱ䖜ᦒ࠭ᮠ¥(s,a)઼എᣕ࠭ᮠ r(s,a)Ⲵ⸕
䇶DŽ⴨৽ˈQ ᆖҐ䘉ṧⲴ໎ᕪᆖҐ㇇⌅‫ٷ‬ᇊᆖҐಘ㕪ቁ䘉Ӌ⸕䇶DŽ

൘໎ᕪᆖҐᯩ䶒䇨ཊᐕ֌ѝˈ䙊ᑨⲴѫ仈ᱟ䘝ԓൠ߿ሿⲴਾ㔗⣦ᘱⲴՠ䇑ѻ䰤ⲴᐞᔲDŽ֯
⭘䘉⿽ᯩ⌅ⲴḀӋᴰᰙⲴᐕ֌ਟ㿱 Samuel(1959)ˈᆳⲴ㾯⌻ৼ䱶ỻᆖҐ〻ᒿ䈅മ䙊䗷ਾ㔗⣦ᘱ
Ⲵՠ䇑ᶕ⭏ᡀ‫ࡽݸ‬⣦ᘱⲴ䇝㓳٬ˈӾ㘼ᆖࡠ㾯⌻ৼ䱶ỻⲴՠ䇑࠭ᮠDŽࠐѾ਼ᰦˈBellman-Ford
ⲴঅⴞⲴᴰ⸝䐟ᖴ㇇⌅㻛ᔰਁࠪᶕ˄Bellman 1958; Ford & Fulkerson 1962˅ˈᆳᢺࡠⴞⲴⲴ䐍
⿫٬Ӿ㔃⛩Ր᫝ࡠᆳⲴ䛫ትDŽ൘ᴰՈ᧗ࡦᯩ䶒Ⲵ⹄ウሬ㠤Ҷ֯⭘⴨լᯩ⌅ᶕ䀓ߣ傜ቄਟཛߣㆆ
䗷〻˄Bellman1961; Blackwell 1965˅DŽHolland˄1986˅ⲴᆖҐ࠶㊫㌫㔏Ⲵ㓴Ầᔿ˄bucket
brigade˅ᯩ⌅֯⭘Ҷ㊫լⲴᯩ⌅൘ᔦ䘏എᣕⲴᛵߥлՐ᫝ؑ⭘DŽBarto et al.˄1983˅䇘䇪а⿽
ᰦ䰤ؑ⭘࠶䝽Ⲵᯩ⌅ˈሬ㠤Ҷ Sutton˄1988˅Ⲵ䇪᮷ˈަѝᇊѹҶ TD(¬)ᯩ⌅ᒦ䇱᰾Ҷ൘¬
=0 ᰦᆳⲴ᭦ᮋᙗDŽDayan(1992)ᢺ䘉њ㔃᷌ᢙኅࡠ¬Ⲵԫ᜿٬DŽWatkin˄1989˅ӻ㓽Ҷ⭘ Q ᆖ
Ґ൘എᣕ઼ࣘ֌䖜ᦒ࠭ᮠᵚ⸕Ⲵᛵߥл㧧ਆᴰՈㆆ⮕DŽ൘䘉Ӌᯩ⌅кⲴ᭦ᮋᙗ䇱᰾ᴹࠐњਈ
⿽DŽ䲔Ҷᵜㄐኅ⽪Ⲵ᭦ᮋᙗ䇱᰾ཆˈਟ㿱˄Baird 1995; Bertsekas 1987; Tsitsiklis 1994, Singh ઼
Sutton 1996˅DŽ
໎ᕪᆖҐӽᱟањ⍫䏳Ⲵ⹄ウ亶ฏDŽֻྲ McCallum(1995)઼ Littman˄1996˅䇘䇪Ҷ໎ᕪ
ᆖҐⲴᢙኅˈԕ䘲ᓄᴹ䳀㯿⣦ᘱਈ䟿⹤ൿ傜ቄਟཛ‫ٷ‬ᇊⲴᛵߥDŽ䇨ཊᖃࡽⲴ⹄ウ㠤࣋Ҿᢺ䘉Ӌ
ᯩ⌅ॷ㓗ࡠᴤᓎབྷᴤᇎ䱵Ⲵ䰞仈ѝDŽֻྲ Maclin ઼ Shavlik˄1996˅᧿䘠Ҷа⿽ᯩ⌅ˈަѝ໎
ᕪᆖҐ agent ਟ᧕ਇᯭᮉ㘵Ⲵнᆼ㖾ᔪ䇞ˈสҾ KBANN ㇇⌅˄ㅜ 12 ㄐ˅ⲴањᢙኅDŽLin
˄1992˅㘳㲁Ҷ䙊䗷ᨀ‫׋‬ᔪ䇞ࣘ֌ᒿࡇᶕᯭᮉⲴ֌⭘DŽSingh˄1993˅઼ Lin˄1993˅ᔪ䇞֯⭘
ቲ⅑ॆⲴࣘ֌ᶕॷ㓗䘉Ӌ㇇⌅DŽDietterich & Flann˄1995˅᧒㍒ҶสҾ䀓䟺Ⲵᯩ⌅઼໎ᕪᆖҐ
Ⲵ䳶ᡀˈMitchell & Thrun˄1993˅᧿䘠Ҷᓄ⭘ EBNN ㇇⌅˄ㅜ 12 ㄐ˅ࡠ Q ᆖҐѝDŽRing
˄1994˅㘳㲁Ҷ agent ൘ཊњԫ࣑ѝⲴᤱ㔝ᆖҐDŽ

䘁ᵏ‫ޣ‬Ҿ໎ᕪᆖҐⲴ䈳ḕ⭡ Kaelbling et al.˄1996˅; Barto(1992); Barto et al.(1995); Dean et


al.˄1993˅֌ࠪDŽ
Ґ仈

13.1 㔉ࠪമ 13-2 ᡰ⽪䰞仈Ⲵਖа⿽ᴰՈㆆ⮕DŽ

13.2 㘳㲁лമᱮ⽪Ⲵањ⺞ᇊᙗṬᆀц⭼ˈަѝਜ਼ᴹ੨᭦ⴞḷ⣦ᘱ GDŽ䘉䟼֌Ҷḷ䇠Ⲵ䖜


ᦒⲴ・ণഎᣕѪ 10ˈ㘼ަԆ䖜ᦒ䜭Ѫ 0DŽ

(a)㔉ࠪṬᆀц⭼ѝ⇿њ⣦ᘱⲴV* ٬DŽ㔉ࠪ⇿њ䖜ᦒⲴQ(s,a)٬DŽᴰਾˈ߉ࠪањᴰՈㆆ
⮕ˈ֯⭘¤=0.8DŽ

(b)䈅᭩ਈഎᣕ࠭ᮠr(s,a)ˈ֯Q(s,a)ਈॆˈնн᭩ਈᴰՈㆆ⮕DŽ䈅‫؞‬᭩r(s,a)ˈ֯Q(s,a)ਈ
ॆˈնн᭩ਈV*(s,a)DŽ

(c)⧠൘㘳㲁ᓄ⭘ Q ᆖҐࡠ↔Ṭᆀц⭼ˈ‫ٷ‬ᇊ Q̂ ٬㺘㻛ࡍ࿻ॆѪ 0DŽ‫ٷ‬ᇊ agent ᔰ࿻Ҿᐖл


ⲴᯩṬ❦ਾ亪ᰦ䪸⋯⵰ઘ䗩ⲴṬᆀ〫ࣘˈⴤ㠣䗮ࡠ੨᭦ⴞḷ⣦ᘱˈᆼᡀㅜањ䇝㓳ᛵ㢲DŽ䈅߉
ࠪ↔ᛵ㢲Ⲵ㔃᷌ሬ㠤ଚӋ Qˆ ٬Ⲵ‫؞‬᭩ˈ㔉ࠪ‫↓؞‬ਾⲴ٬DŽ⧠ྲ᷌ agent ㅜҼ⅑䘀⭘਼ṧⲴᛵ
㢲ˈ޽⅑എㆄ↔䰞仈DŽ਼ṧ൘ㅜйњᛵ㢲ਾഎㆄ↔䰞仈DŽ

插图——原书页码:388

13.3 㘳㲁оањ䲿ᵪлỻⲴሩᇦሩᔸ Tic-Tac-ToeDŽ⺞࠷ൠ䇢ˈ‫ٷ‬ᇊሩᇦ൘ᴹཊњ䘹ᤙᰦԕ


൷रⲴᾲ⦷䘹ᤙ䎠ỻˈ䲔䶎ᴹањᕪࡦᙗⲴ䎠ỻ˄䘉ᰦᆳ䟷ਆᱮ❦↓⺞Ⲵ↕ᆀ˅DŽ

(a)൘↔ᛵߥлˈሶᆖҐᴰՈⲴ Tic-Tac-Toe ㆆ⮕ᖒᡀањ Q ᆖҐ䰞仈DŽ൘↔䶎⺞ᇊᙗ傜ቄ


ਟཛߣㆆ䗷〻ѝˈօѪ⣦ᘱǃࣘ֌ԕ৺എᣕ˛

(b)ྲ᷌ሩᇦ䘹ᤙᴰՈⲴ䎠ỻ㘼нᱟ䲿ᵪ䎠ỻˈ֐Ⲵ〻ᒿ㜭੖㜌࡙˛

13.4 ൘䇨ཊMDPѝˈᴹਟ㜭᢮ࡠєњㆆ⮕±1઼±2ˈྲ᷌agentᔰ࿻Ҿ⣦ᘱs1ˈࡉ±1ՈҾ
± 2 ˗ ྲ ᷌ agent ᔰ ࿻ Ҿ ਖ а ⣦ ᘱ s2 ˈ ࡉ ± 2 Ո Ҿ ± 1 DŽ ᦒ 䀰 ѻ V S 1 ( s1 ) ! V S 2 ( s1 ) ն
V S 2 ( s 2 ) ! V S 1 ( s 2 ) DŽ䀓䟺ѪӰѸᙫᆈ൘ањㆆ⮕ˈ㜭ሩҾԫ᜿ањࡍ࿻⣦ᘱs֯V±(s)ᴰབྷॆ
˄ ণ ᴰ Ո ㆆ ⮕ ± * ˅ DŽ ᦒ 䀰 ѻ ˈ 䀓 䟺 Ѫ Ӱ Ѹ а њ MDP ᙫ ᴹ а њ ㆆ ⮕ ± * ˈ ֯
(S , s )V S ( s ) t V S ( s ) DŽ
*

You might also like