Professional Documents
Culture Documents
ᵪಘᆖҐ䘉䰘ᆖ、ᡰⲴ⌘ޣ䰞仈ᱟ˖䇑㇇ᵪ〻ᒿྲօ䲿⵰㓿傼〟㍟㠚ࣘᨀ儈ᙗ㜭˛䘁ᒤ
ᶕˈᵪಘᆖҐ㻛ᡀ࣏ൠᓄ⭘Ҿᖸཊ亶ฏˈӾỰ⍻ؑ⭘Ӕ᱃Ⅺ䇸Ⲵᮠᦞ᥆ᧈ〻ᒿˈࡠ㧧ਆ⭘
ᡧ䰵䈫ޤ䏓Ⲵؑ䗷└㌫㔏ˈࡠ㜭൘儈䙏ޜ䐟к㠚ࣘ㹼傦Ⲵ⊭䖖DŽ਼ᰦˈ䘉њᆖ、Ⲵส
⨶䇪઼㇇⌅ҏᴹҶ䟽བྷⲴ䘋ኅDŽ
䘉ᵜᮉᶀⲴⴞḷᱟኅ⧠ᵪಘᆖҐѝṨᗳⲴ㇇⌅઼⨶䇪DŽᵪಘᆖҐӾᖸཊᆖ、੨᭦Ҷᡀ᷌
઼ᾲᘥˈवᤜ㔏䇑ᆖǃӪᐕᲪ㜭ǃଢᆖǃؑ䇪ǃ⭏⢙ᆖǃ䇔⸕、ᆖǃ䇑㇇༽ᵲᙗ઼᧗ࡦ䇪
ㅹDŽᡁؑˈ⹄ウᵪಘᆖҐⲴᴰ֣䙄ᖴᱟӾ䘉Ӌᆖ、Ⲵ㿲⛩ⴻᖵᵪಘᆖҐˈᒦфԕ↔ᶕ⨶䀓
䰞仈Ⲵ㛼Ჟǃ㇇⌅ԕ৺ަѝ䳀ਜ਼ⲴٷᇊDŽ䘉Ӌ൘ԕᖰᖸ䳮ˈࡠڊഐѪ൘䘉а亶ฏ㕪ቁवᇩᒯ
⌋Ⲵ䍴ᯉDŽ䘉ᵜҖⲴѫ㾱ⴞⲴቡᱟᨀ䘉ṧⲴаԭ䍴ᯉDŽ
⭡Ҿ㍐ᶀⲴཊᆖ、ᙗˈ䘉ᵜҖн㾱≲䈫㘵ާᴹᓄⲴ⸕䇶㛼Ჟˈ㘼ᱟ൘ᗵ㾱ᰦӻ㓽ަԆ
аӋᆖ、Ⲵสᵜᾲᘥˈྲ㔏䇑ᆖǃӪᐕᲪ㜭ǃؑ䇪ㅹDŽӻ㓽Ⲵ䟽⛩ᱟоᵪಘᆖҐޣ㌫ᴰᇶ
࠷Ⲵ䛓ӋᾲᘥDŽᵜҖਟԕѪ䇑㇇ᵪ、ᆖоᐕ〻ǃ㔏䇑ᆖ઼⽮Պ、ᆖㅹуъⲴབྷᆖ⭏ᡆ⹄ウ
⭏ⲴᮉᶀˈҏਟѪ䖟Ԧ⹄ウӪઈᡆӾъӪઈⲴ৲㘳DŽᤷሬ䘉ᵜҖ߉ⲴєᶑࡉѪ˖1.
ᆳᱟ൘ṑབྷᆖ⭏ਟԕ⨶䀓Ⲵ˗2.ᆳᓄ䈕वਜ਼ঊ༛⭏൘ᔰ⹄ウᵪಘᆖҐࡽ㾱ᦼᨑⲴᇩDŽ
ᤷሬ䘉ᵜҖ߉Ⲵㅜйᶑࡉᱟ˖ᆳᓄ䈕փ⧠⨶䇪઼ᇎ䐥є㘵Ⲵᒣ㺑DŽᵪಘᆖҐ⨶䇪㠤
࣋Ҿഎㆄ䘉ṧⲴ䰞仈ĀᆖҐᙗ㜭ᱟᘾṧ䲿⵰㔉ᇊⲴ䇝㓳ṧֻⲴᮠ䟿ਈॆⲴ˛ā઼ĀሩҾн਼
㊫රⲴᆖҐԫ࣑ˈଚњᆖҐ㇇⌅ᴰ䘲ਸ˛ā࡙⭘ᶕ㠚㔏䇑ᆖǃ䇑㇇༽ᵲᙗ઼䍍ਦᯟ࠶᷀Ⲵ⨶
䇪ᡀ᷌ˈ䘉ᵜҖ䇘䇪Ҷ䘉а㊫⨶䇪䰞仈DŽ਼ᰦᵜҖҏ㾶ⴆҶᖸཊᇎ䐥ᯩ䶒Ⲵᇩ˖ӻ㓽Ҷ䘉
а亶ฏⲴѫ㾱㇇⌅ˈᒦ䱀᰾Ҷ㇇⌅Ⲵ䘀㹼䗷〻DŽаӋ㇇⌅Ⲵᇎ⧠઼ᮠᦞਟԕ൘ӂ㚄㖁к䙊䗷
㖁൰ http://www.cs.cmu.edu/~tom/mlbook.html ᗇࡠDŽަѝवᤜ⭘ҾӪ㝨䇶࡛Ⲵ⾎㓿㖁㔌ǃ⭘
Ҿؑ䍧࠶᷀ⲴߣㆆṁᆖҐǃ৺࠶᷀᮷ᵜ᮷ẓⲴ䍍ਦᯟ࠶㊫ಘ㠚ⲴⓀԓ⸱઼ᡰ䴰ᮠᦞDŽᡁᖸ
ᝏ䉒䛓Ӌᑞࣙᡁࡋᔪ䘉Ӌ൘㓯䍴ⓀⲴ਼һˈवᤜ Jason RennieǃPaul HsiungǃJeff Shufeltǃ
Matt GlickmanǃScott DaviesǃJoseph O’SullivanǃKen LangǃAndrew McCallum ઼ Thorsten
JoachimsDŽ
㠤䉒
൘߉䘉ᵜҖⲴ䗷〻ѝˈᡁᒨ䘀ൠᗇࡠҶᵪಘᆖҐ亶ฏᖸཊᆖ、࠶᭟ⲴᢰᵟуᇦⲴᑞ
ࣙDŽ⋑ᴹԆԜⲴᑞࣙ䘉ᵜҖᱟнਟ㜭ᆼᡀⲴDŽᡁ␡␡ൠᝏ◰л䶒Ⲵ、ᆖᇦԜˈԆԜ㣡ᰦ䰤Ự
䰵ᵜҖⲴ㥹はˈᒦфԕԆԜ㠚亶ฏⲴу䮯ሩᡁ䘋㹼ҶᤷሬDŽ
˄ĂĂ˅
ᡁҏᖸᝏ䉒ᡰབྷᆖⲴᖸཊ䇢ᐸ઼ᆖ⭏ˈԆԜᇎൠ⍻䈅ҶᵜҖⲴᖸཊ㥹はᒦᨀࠪҶԆԜ
Ⲵᔪ䇞DŽቭ㇑⋑ᴹ䏣ཏⲴ⡸䶒ᶕᝏ䉒кⲮⲴᆖ⭏ǃ䇢ᐸ઼ަԆ⍻䈅Ҷ㥹はⲴӪˈᡁ㾱ᝏ䉒
л䶒սˈᝏ䉒ԆԜ⢩࡛ᴹᑞࣙⲴᔪ䇞઼䇘䇪DŽ
˄ĂĂ˅
ᡁᝏ䉒 Joan Mitchell ᔪ・ҶᵜҖⲴ㍒ᕅDŽᡁҏᝏ䉒 Jean Harpley ᑞࣙ㕆䗁ҶᖸཊᨂമDŽ
ETP Harrison Ⲵ Jane Loftus ᑞࣙᮤ⨶ҶᵜҖⲴはDŽᡁⲴ㕆䗁ˈMcGraw Hill ࠪ⡸⽮Ⲵ Eric
Munson ൘亩ⴞⲴᮤњ䗷〻ѝᨀҶ啃઼࣡㿱DŽ
䙊ᑨˈањӪᴰ䈕ᝏ䉒ⲴᱟԆⲴ਼һǃᴻ৻઼ᇦᓝDŽሩҾᡁˈቔަ㾱㺘䗮㠚ᐡⲴᝏ◰DŽ
ᡁᖸ䳮ᜣ䊑ᴹӪ∄ᡁ൘ Carnegie Mellon ᤕᴹᴤྭⲴᲪ㘵Ӂ䳶Ⲵ⧟ຳ઼ᴤཊⲴ唾࣋ࣙⲴᴻ
৻DŽ൘䘉Ӌᖸཊᑞࣙ䗷ᡁⲴӪᖃѝˈᡁ⢩࡛ᝏ䉒 Sebastian Thrunˈ൘䘉њ亩ⴞⲴ㠚㠣㓸ˈ
Ԇаⴤሩᡁ䘋㹼⵰㋮⾎啃࣡ǃᢰᵟᤷሬㅹ᭟ᤱDŽᡁⲴ⡦⇽ˈоԕᖰаṧⲴ啃࣡ᡁᒦ൘ᴰ
ᚠᖃⲴᰦى䰞Āᐢ㓿ᆼᡀҶੇ˛āᴰਾˈᡁаᇊ㾱ᝏ䉒ᡁⲴᇦӪ˖MeghanˈShannon ઼ JoanDŽ
ԆԜ൘н⸕н㿹ѝԕᯩᔿሩ↔ҖࠪҶ䍑⥞DŽ䘉ᵜҖᱟ⥞㔉ԆԜⲴDŽ
Tom M. Mitchell
ㅢ1ㄖ 㔠䇰
㠚Ӿ䇑㇇ᵪ㻛ਁ᰾ԕᶕˈӪԜቡᜣ⸕䚃ᆳԜ㜭н㜭ᆖҐDŽྲ᷌ᡁԜ⨶䀓Ҷ䇑㇇ᵪᆖҐⲴ
൘ᵪࡦˈণᘾṧ֯ᆳԜṩᦞ㓿傼ᶕ㠚ࣘᨀ儈ˈ䛓Ѹᖡ૽ሶᱟオࡽⲴDŽᜣ䊑алˈ൘ᵚᶕˈ
䇑㇇ᵪ㜭Ӿ५⯇䇠ᖅѝᆖҐˈ㧧ਆ⋫⯇ᯠ⯮⯵Ⲵᴰᴹ᭸ᯩ⌅˗տᆵ㇑⨶㌫㔏࠶᷀տᡧⲴ⭘⭥
⁑ᔿˈԕ䱽վ㜭Ⓚ⎸㙇˗њӪ䖟Ԧࣙ⨶䐏䑚⭘ᡧⲴޤ䏓ˈᒦѪަ䘹ᤙᴰᝏޤ䏓Ⲵ൘㓯ᯠ
䰫ĂĂDŽሩ䇑㇇ᵪᆖҐⲴᡀ࣏⨶䀓ሶᔰ䗏ࠪޘᯠⲴᓄ⭘亶ฏˈᒦ֯ަ䇑㇇㜭઼࣋ਟᇊࡦᙗк
ॷࡠᯠⲴቲ⅑DŽ਼ᰦˈ䘿ᖫൠ⨶䀓ᵪಘᆖҐⲴؑ༴⨶㇇⌅ˈҏՊᴹࣙҾᴤྭൠ⨶䀓Ӫ㊫Ⲵ
ᆖҐ㜭࣋DŽ
ⴞࡽˈᡁԜ䘈н⸕䚃ᘾṧ֯䇑㇇ᵪⲴᆖҐ㜭઼࣋Ӫ㊫ტ㖾DŽ❦㘼аӋ䪸ሩ⢩ᇊᆖҐԫ
࣑Ⲵ㇇⌅ᐢ㓿ӗ⭏DŽޣҾᆖҐⲴ⨶䇪䇔䇶ᐢᔰ䙀↕ᖒᡀDŽӪԜᔰਁࠪҶᖸཊᇎ䐥ᙗⲴ䇑㇇
ᵪ〻ᒿᶕᇎ⧠н਼㊫රⲴᆖҐˈаӋ୶ъॆⲴᓄ⭘ҏᐢ㓿ࠪ⧠DŽֻྲሩҾ䈝丣䇶࡛䘉ṧⲴ䈮
仈ˈ㠣ӺѪ→ˈสҾᵪಘᆖҐⲴ㇇⌅᰾ᱮ㜌䗷ަԆⲴᯩ⌅DŽ൘ᮠᦞ᥆ᧈ亶ฏˈᵪಘᆖҐ㇇⌅
⨶ᡰᖃ❦ൠᗇࡠᓄ⭘ˈӾवਜ਼䇮༷㔤ᣔ䇠ᖅǃُ䍧⭣䈧ǃ䠁㶽Ӕ᱃ǃ५⯇䇠ᖅㅹ㊫լؑⲴ
བྷරᮠᦞᓃѝਁ⧠ᴹԧ٬ⲴؑDŽ䲿⵰ሩ䇑㇇ᵪⲴ⨶䀓Ⲵᰕ⳺ᡀ⟏ˈᵪಘᆖҐᗵሶ൘䇑㇇ᵪ
、ᆖ઼ᢰᵟѝᢞ╄䎺ᶕ䎺䟽㾱Ⲵ䀂㢢ʽ
䙊䗷аӋ⢩ᇊⲴᡀቡᡁԜਟԕⴻࡠ䘉䰘ᢰᵟⲴ⧠⣦˖䇑㇇ᵪᐢ㓿㜭ཏᡀ࣏ൠ䇶࡛Ӫ㊫Ⲵ
䇢䈍˄Waibel 1989˗Lee 1989˅˗亴⍻㛪⚾ᛓ㘵Ⲵᓧ༽⦷˄Cooper et al. 1997˅˗Ự⍻ؑ⭘
Ⅺ䇸˗൘儈䙏ޜ䐟к傮傦˄Pomerleau 1989˅˗ԕ᧕䘁Ӫ㊫ц⭼ߐߋⲴ≤ᒣሩᔸ㾯⌻ৼ䱶ỻķ䘉
ṧⲴ⑨ᠿ˄Tesauro 1992, 1995˅DŽᐢᴹҶᖸཊ⨶䇪ᡀ᷌㜭ཏሩ䇝㓳ṧֻᮠ䟿ǃٷ䇮オ䰤བྷሿǃ
઼ᆖᗇٷ䇮䭉䈟⦷䘉й㘵䰤Ⲵสᵜޣ㌫䘋㹼⭫DŽᡁԜ↓൘ᔰ㧧ਆӪ㊫઼ࣘ⢙ᆖҐⲴ
⁑රˈ⭘ԕ⨶䀓ᆳԜ઼䇑㇇ᵪⲴᆖҐ㇇⌅䰤Ⲵޣ㌫˄ֻྲˈLaird et al. 1986˗Anderson 1991˗
Qin et al. 1992˗Chi & Bassock 1989˗Ahn & Brewer 1993˅DŽ൘䗷৫Ⲵॱᒤѝᰐ䇪ᱟᓄ⭘ǃ㇇
⌅ǃ⨶䇪ˈ䘈ᱟ⭏⢙㌫㔏Ⲵ⹄ウ䜭ਆᗇҶ٬ᗇ⌘ⴞⲴ䘋↕DŽᵪಘᆖҐᴰ䘁Ⲵࠐᓄ⭘㻛ᖂ㓣
൘㺘 1-1 ѝDŽLangley & Simon˄1995˅ԕ৺Rumelhart et al.˄1994˅䈳ḕҶᵪಘᆖҐⲴаӋ
ަԆᓄ⭘DŽ
㺘 1-1 ᵪಘᆖҐⲴаӋᡀ࣏ᓄ⭘
x ᆖҐ䇶࡛Ӫ㊫Ⲵ䇢䈍
ᡰᴹᴰᡀ࣏Ⲵ䈝丣䇶࡛㌫㔏䜭֯⭘ҶḀᖒᔿⲴᵪಘᆖҐᢰᵟDŽֻྲˈSphinx ㌫㔏˄৲㿱
Lee 1989˅ਟᆖҐ⢩ᇊ䇢䈍㘵Ⲵ䈝丣䇶࡛ㆆ⮕ˈӾỰ⍻ࡠⲴ䈝丣ؑਧѝ䇶࡛ࠪสᵜⲴ丣㍐
˄phoneme˅઼অ䇽DŽ⾎㓿㖁㔌ᆖҐᯩ⌅ ˄ֻྲ Waibel et al. 1989˅઼䳀ᔿ傜ቄਟཛ⁑ර˄hidden
Markov model˅ⲴᆖҐᯩ⌅˄ֻྲ Lee 1989˅൘䈝丣䇶࡛㌫㔏ѝҏ䶎ᑨᴹ᭸ˈᆳԜਟԕ䇙㌫
㔏㠚ࣘ䘲ᓄн਼Ⲵ䇢䈍㘵ǃ䇽≷ǃ哖ݻ仾⢩ᙗ઼㛼Ჟಚ丣ㅹㅹDŽ㊫լⲴᢰᵟ൘ᖸཊؑਧ䀓
䟺䈮仈ѝᴹᓄ⭘▌࣋DŽ
x ᆖҐ傮傦䖖䖶
ķ
䈁⌘˖а㊫լ伎㹼ỻⲴ⑨ᠿˈৼᯩᤱॱӄᆀˈ䙊䗷᧧僠ᆀᶕߣᇊỻᆀ〫ࣘⲴ↕ᮠDŽ
ᵪಘᆖҐᯩ⌅ᐢ㻛⭘Ҿ䇝㓳䇑㇇ᵪ᧗ࡦⲴ䖖䖶ˈ֯ަ൘㊫රⲴ䚃䐟к↓⺞㹼傦DŽֻྲ
ALVINN ㌫㔏˄Pomerleau 1989˅ᐢ㓿࡙⭘ᆳᆖՊⲴㆆ⮕⤜㠚൘儈䙏ޜ䐟ⲴަԆ䖖䖶ѻ䰤྄
傠ˈԕ 70 㤡䟼Ⲵᰦ䙏ޡ㹼傦Ҷ 90 㤡䟼DŽ㊫լⲴᢰᵟਟ㜭൘ᖸཊสҾՐᝏಘⲴ᧗ࡦ䰞仈ѝ
ᗇࡠᓄ⭘DŽ
x ᆖҐ࠶㊫ᯠⲴཙ᮷㔃ᶴ
ᵪಘᆖҐᯩ⌅ᐢ㓿㻛⭘ҾӾབྷ㿴⁑Ⲵᮠᦞᓃѝਁ⧠䳀㯿Ⲵа㡜㿴ᖻDŽֻྲˈߣㆆṁᆖ
Ґ㇇⌅ᐢ㓿㻛㖾ഭഭᇦ㡚オ઼㡚ཙተ˄NASA˅⭘ᶕ࠶㊫ཙփˈᮠᦞᶕ㠚ㅜҼᑅ⍋傜ཙ᮷ਠ
ཚオ䈳ḕ˄Fayyad et al. 1995˅DŽ䘉а㌫㔏⧠൘㻛⭘Ҿ㠚ࣘ࠶㊫ཚオ䈳ḕѝⲴᡰᴹཙփˈަ
ѝवਜ਼Ҷ 3T ᆇ㢲ⲴമۿᮠᦞDŽ
x ᆖҐԕц⭼㓗Ⲵ≤ᒣሩᔸ㾯⌻ৼ䱶ỻ
ᴰᡀ࣏Ⲵঊᔸ㊫˄ྲ㾯⌻ৼ䱶ỻ˅䇑㇇ᵪ〻ᒿᱟสҾᵪಘᆖҐ㇇⌅ⲴDŽֻྲˈц⭼ᴰྭⲴ
㾯⌻ৼ䱶ỻ〻ᒿ TD-Gammon˄Tesauro 1992, 1995˅ᱟ䙊䗷аⲮз⅑ԕкⲴ઼㠚ᐡሩᔸᶕᆖ
Ґަㆆ⮕ⲴDŽ⧠൘ᆳⲴ≤ᒣ㜭оӪ㊫Ⲵц⭼ߐߋᖃDŽ㊫լⲴᢰᵟ㻛ᓄ⭘Ҿ䇨ཊᇎ䱵䰞仈ˈ
ަѝ䴰㾱儈᭸ൠᩌ㍒ᓎབྷⲴᩌ㍒オ䰤DŽ
ᵜҖ䪸ሩᵪಘᆖҐ䘉њ亶ฏˈ᧿䘠ҶཊᆖҐ㤳රǃ㇇⌅ǃ⨶䇪ԕ৺ᓄ⭘DŽᵪಘᆖҐӾ
ᵜ䍘кᱟањཊᆖ、Ⲵ亶ฏDŽᆳ੨ਆҶӪᐕᲪ㜭ǃᾲ⦷㔏䇑ǃ䇑㇇༽ᵲᙗ⨶䇪ǃ᧗ࡦ䇪ǃؑ
䇪ǃଢᆖǃ⭏⨶ᆖǃ⾎㓿⭏⢙ᆖㅹᆖ、Ⲵᡀ᷌DŽ㺘 1-2 ᖂ㓣Ҷ䘉Ӌᆖ、ѝᖡ૽ᵪಘᆖҐⲴ
ޣ䭞ᙍᜣDŽᵜҖⲴ㍐ᶀสҾн਼ᆖ、Ⲵᡀ᷌ˈ❦㘼䈫㘵нᗵ㋮䙊⇿ањᆖ、DŽᶕ㠚䘉Ӌᆖ、
Ⲵޣ䭞⨶䇪ሶ֯⭘䶎уъⲴ䇽≷䇢䀓ˈަѝн⟏ᚹⲴᵟ䈝઼ᾲᘥՊ൘䴰㾱ᰦ࣐ԕӻ㓽DŽ
㺘 1-2 аӋᆖ、઼ᆳԜሩᵪಘᆖҐⲴᖡ૽
x ӪᐕᲪ㜭
ᆖҐᾲᘥⲴㅖਧ㺘⽪DŽѪᩌ㍒䰞仈ⲴᵪಘᆖҐDŽѪᨀ儈䰞仈≲䀓㜭࣋䙄ᖴⲴᆖҐDŽ֯
⭘ݸ傼Ⲵ⸕䇶઼䇝㓳ᮠᦞа䎧ᕅሬᆖҐDŽ
x 䍍ਦᯟᯩ⌅
Ѫ䇑㇇ٷ䇮ᾲ⦷ⲴสⲴ䍍ਦᯟ⌅ࡉDŽᵤ㍐䍍ਦᯟ࠶㊫ಘDŽՠ䇑ᵚ㿲⍻ࡠਈ䟿Ⲵ٬Ⲵ㇇
⌅DŽ
x 䇑㇇༽ᵲᙗ⨶䇪
н਼ᆖҐԫ࣑ѝപᴹⲴ༽ᵲᙗⲴ⨶䇪䗩⭼ˈԕ䇑㇇䟿ǃ䇝㓳ṧֻᮠ䟿ǃࠪ䭉ᮠ䟿ㅹ㺑䟿DŽ
x ᧗ࡦ䇪
ѪҶՈॆ亴ᇊⴞḷˈᆖҐሩ༴⨶䗷〻䘋㹼᧗ࡦˈᆖҐ亴⍻㻛᧗ࡦⲴ䗷〻Ⲵлањ⣦ᘱDŽ
x ؑ䇪
⟥઼ؑᇩⲴᓖ䟿DŽᆖҐⲴᴰሿ᧿䘠䮯ᓖᯩ⌅DŽ㕆⸱ٷ䇮ᰦˈᆳⲴᴰ֣㕆⸱઼оᴰ֣䇝
㓳ᒿࡇⲴޣ㌫DŽ
x ଢᆖ
ĀྕൾⲴࡳ࠰ā˄Occam’s razor˅ķ˖ᴰㆰঅⲴٷ䇮ᱟᴰྭⲴDŽӾ㿲ሏࡠⲴᮠᦞ⌋ॆⲴ⨶
⭡࠶᷀DŽ
x ᗳ⨶ᆖ઼⾎㓿⭏⢙ᆖ
ᇎ䐥Ⲵᑲᇊᖻ˄power law of practice˅ˈ䈕ᇊᖻᤷࠪሩҾᖸབྷ㤳തⲴᆖҐ䰞仈ˈӪԜⲴ৽
ᓄ䙏ᓖ䲿⵰ᇎ䐥⅑ᮠⲴᑲ㓗ᨀ儈DŽ◰ਁӪᐕ⾎㓿㖁㔌ⲴᆖҐ⁑ᔿⲴ⾎㓿⭏⢙ᆖ⹄ウDŽ
x 㔏䇑ᆖ
ķ
䈁⌘˖ҏ〠Ā੍ஜᖻ˄Law of Parsimony’āᡆĀ㢲㓖ᖻ˄Law of Economy˅āˈѫ㾱ᙍᜣѪㆰঅⲴ⨶䇪
˄ᡆٷ䇮˅ՈҾ༽ᵲⲴˈഐ㤡ഭଢᆖᇦྕൾ˄1285~1349˅仁㑱֯⭘䘉аࡉˈ᭵〠ѪĀྕൾࡳ࠰āDŽ
൘ՠ䇑ᴹ䲀ᮠᦞṧᵜкⲴٷ䇮㋮ᓖᰦࠪ⧠Ⲵ䈟ᐞ˄ֻྲٿᐞ઼ᯩᐞ˅Ⲵ⭫DŽ㖞ؑ४䰤ˈ
㔏䇑Ự傼DŽ
1.1 ᆜҖ䰤从Ⲻḽᨅ䘦
䇙ᡁԜӾࠐњᇎ䱵ⲴᆖҐԫ࣑ᔰ⹄ウᵪಘᆖҐDŽṩᦞᵜҖⲴⴞⲴˈᡁԜ㔉ᆖҐањᇭ
ᒯⲴᇊѹˈԕ֯ަवᤜԫօ䇑㇇ᵪ〻ᒿ䙊䗷㓿傼ᶕᨀ儈Ḁԫ࣑༴⨶ᙗ㜭Ⲵ㹼ѪDŽᴤ߶⺞ൠ䇢ˈ
//࡙⭘㓿傼᭩ழ㌫㔏㠚䓛Ⲵᙗ㜭//
ֻྲˈሩҾᆖҐл㾯⌻䐣ỻķⲴ䇑㇇ᵪ〻ᒿˈᆳਟԕ䙊䗷઼㠚ᐡлỻ㧧ਆ㓿傼ˈᆳᣵ䍏
Ⲵԫ࣑ᱟ৲о㾯⌻䐣ỻሩᔸˈᆳⲴᙗ㜭⭘ᆳ䎒ỻⲴ㜭࣋ᶕ㺑䟿DŽ䙊ᑨˈѪҶᖸྭൠᇊѹањ
ᆖҐ䰞仈ˈᡁԜᗵ享᰾⺞䘉ṧйњ⢩ᖱ˖ԫ࣑Ⲵ㊫˗㺑䟿ԫ࣑ᨀ儈Ⲵḷ߶˗㓿傼ⲴᶕⓀDŽ
㾯⌻䐣ỻᆖҐ䰞仈˖
x ԫ࣑ T˖л㾯⌻䐣ỻ
x ᙗ㜭ḷ߶ P˖∄䎋ѝࠫ䍕ሩⲴⲮ࠶∄
x 䇝㓳㓿傼 E˖઼㠚ᐡ䘋㹼ሩᔸ
ᡁԜਟԕ⭘ԕкᯩ⌅ᇊѹᖸཊᆖҐ䰞仈ˈֻྲᆖҐ߉䇶࡛ǃᆖҐ㠚ࣘ傮傦ᵪಘӪ⊭䖖DŽ
߉䇶࡛ᆖҐ䰞仈˖
x ԫ࣑ T˖䇶઼࡛࠶㊫മۿѝⲴ߉᮷ᆇ
x ᙗ㜭ḷ߶ P˖࠶㊫Ⲵ↓⺞⦷
x 䇝㓳㓿傼 E˖ᐢ⸕࠶㊫Ⲵ߉᮷ᆇᮠᦞᓃ
ᵪಘӪ傮傦ᆖҐ䰞仈˖
x ԫ࣑ T˖䙊䗷㿶㿹Րᝏಘ൘ഋ䖖䚃儈䙏ޜ䐟к傮傦
ķ
䈁⌘˖ѪҶᴤྭ⨶䀓ᵜֻˈл䶒ㆰ㾱ӻ㓽ал䘉䐣ỻDŽỻⴈѪ 8h8 ᯩṬˈ␡㢢ỻṬнਟ⵰ᆀDŽਟঅ
↕㹼䎠ˈӖਟ⇿↕䐘ሩᯩаᆀঅ䐣ᡆ䘎䐣ˈ㻛䐘䎺Ⲵᆀ㻛ᵰࠪተDŽࡠ䗮ሩᯩᓅ㓯ⲴᆀᡀѪ⦻ˈਟഎੁ㹼䎠
˄ᡀѪ⦻ࡽਚਟࡽ㹼˅ˈ৸ਟ䳄オṬ伎㹼DŽлമѪ㾯⌻䐣ỻỻⴈ⽪ֻ˄䎧⣦ᘱ˅DŽ
x ᙗ㜭ḷ߶ P˖ᒣ൷ᰐᐞ䭉㹼傦䟼〻˄ᐞ䭉⭡Ӫ㊫Ⲵⴁⶓ㻱ᇊ˅
x 䇝㓳㓿傼 E˖⌘㿶Ӫ㊫傮傦ᰦᖅࡦⲴа㌫ࡇമ઼ۿ傮傦ᤷԔ
䘉䟼ሩᆖҐⲴᇊѹᖸᇭᒯˈ䏣ԕवᤜབྷཊᮠᜟҾ㻛〠ѪĀᆖҐāⲴԫ࣑ˈቡۿᡁԜᰕᑨ
֯⭘Ⲵ䘉њ䇽аṧDŽ਼ᰦˈᆳҏवᤜҶԕ䶎ᑨㆰ᰾Ⲵᯩᔿ䙊䗷㓿傼㠚ᡁᨀ儈Ⲵ䇑㇇ᵪ〻ᒿDŽ
ֻྲˈањݱ䇨⭘ᡧᴤᯠᮠᦞᶑⴞⲴᮠᦞᓃ㌫㔏ˈҏㅖਸᡁԜሩᆖҐ㌫㔏Ⲵᇊѹ˖ᆳṩᦞӾ
ᮠᦞᓃᴤᯠᗇࡠⲴ㓿傼ᨀ儈ᆳഎㆄᮠᦞḕ䈒Ⲵ㜭࣋DŽоަᣵᗳ䘉㹼ѪоĀᆖҐā䘉њ䇽ᰕ
ᑨ䈸䇪Ⲵ䶎↓ᔿਜ਼ѹ⏶ˈᡁԜ㍒ᙗㆰঅൠ䟷⭘ᡁԜⲴ、ᢰරᇊѹüüа㊫䇑㇇ᵪ〻ᒿ䙊
䗷㓿傼ᨀ儈Ⲵ䗷〻DŽ൘䘉њ㤳⮤ˈᡁԜՊਁ⧠ᖸཊ䰞仈ᡆཊᡆቁ䴰㾱䖳༽ᵲⲴ䀓ߣ࣎⌅DŽ
䘉䟼ᡁԜᒦ䶎㾱࠶᷀ĀᆖҐā䘉њঅ䇽Ⲵᰕᑨਜ਼ѹDŽ㘼ᱟ㾱㋮⺞ൠᇊѹа㊫ᤜᡁԜᝏޤ䏓
ⲴᆖҐᖒᔿⲴ䰞仈ˈ᧒㍒䀓ߣ䘉㊫䰞仈Ⲵᯩ⌅ˈᒦ⨶䀓ᆖҐ䰞仈Ⲵส㔃ᶴ઼䗷〻DŽ
1.2 䇴䇗жѠᆜҖ㌱㔕
ѪҶ╄⽪аӋᵪಘᆖҐⲴสᵜ䇮䇑ᯩ⌅઼䙄ᖴˈ㘳㲁䇮䇑ањᆖҐл㾯⌻䐣ỻⲴ〻ᒿDŽ
ᡁԜⲴⴞḷᱟ䇙ᆳ䘋ޕ㾯⌻䐣ỻц⭼䭖ḷ䎋DŽᡁԜ䟷⭘ᴰᱮ㘼᱃㿱Ⲵḷ߶㺑䟿ᆳⲴᙗ㜭˖൘
ц⭼䭖ḷ䎋кᢃ䎒Ⲵ∄䎋ঐᙫ৲䎋⅑ᮠⲴⲮ࠶∄DŽ
1.2.1 䘿䇣㓹ᯯᕅ
ᡁԜ䶒ѤⲴㅜањ䇮䇑䰞仈ᱟ䘹ਆ䇝㓳㓿傼Ⲵ㊫රˈ֯㌫㔏Ӿѝ䘋㹼ᆖҐDŽ㔉ᆖҐಘᨀ
Ⲵ䇝㓳㓿傼ሩᆳⲴᡀ䍕ᴹ䟽བྷⲴᖡ૽DŽањޣ䭞ᙗᱟ䇝㓳㓿傼㜭Ѫ㌫㔏Ⲵߣㆆᨀⴤ
᧕ᡆ䰤᧕Ⲵ৽侸DŽֻྲˈሩҾᆖҐл㾯⌻䐣ỻˈ㌫㔏ਟԕӾⴤ᧕Ⲵ˄direct˅䇝㓳ṧֻˈণ
ỻⴈ⣦ᘱ઼ᓄⲴ↓⺞䎠ᆀѝᆖҐDŽਖаᛵߥˈᆳਟ㜭ӵᴹ䰤᧕˄indirect˅Ⲵؑˈ
वਜ਼ᖸཊ䗷৫Ⲵሩᔸᒿࡇ઼ᴰ㓸㔃ተDŽሩҾਾаᛵߥˈޣҾঊᔸѝ䖳ᰙ䎠ᆀⲴ↓⺞ᙗᗵ享
Ӿሩᔸᴰ㓸Ⲵ䗃䎒ᶕ᧘ᯝDŽ䘉ᰦᆖҐಘ৸仍ཆ䶒Ѥањؑ⭘࠶䝽˄credit assignment˅䰞仈ˈ
ҏቡᱟ㘳㲁⇿а⅑䎠ᆀሩᴰ㓸㔃᷌Ⲵ䍑⥞〻ᓖDŽؑ⭘࠶䝽ਟ㜭ᱟањ䶎ᑨ䳮ԕ䀓ߣⲴ䰞仈ˈ
ഐѪྲ᷌ਾ䶒лᗇᖸᐞˈ䛓Ѹণ֯䎧ࡍⲴ䎠ᆀᱟᴰ֣Ⲵˈ䘉ⴈỻҏՊ䗃ᦹDŽᡰԕ䙊ᑨӾⴤ᧕
Ⲵ䇝㓳৽侸ᶕᆖҐ∄䰤᧕ⲴㆰঅDŽ
䇝㓳㓿傼ⲴㅜҼњ䟽㾱ᙗᱟᆖҐಘਟԕ൘ཊབྷ〻ᓖк᧗ࡦ䇝㓳ṧֻᒿࡇDŽֻྲˈᆖҐ
ಘਟ㜭䎆ᯭᮉ㘵䘹ਆỻⴈ⣦ᘱˈ઼ᨀ⇿а⅑Ⲵ↓⺞〫ࣘDŽᡆ㘵ˈᆖҐಘਟ㜭㠚ᐡᨀࠪᆳ
䇔Ѫ⢩࡛ഠᜁⲴỻተᒦੁᯭᮉ㘵䈒䰞↓⺞Ⲵ䎠ᆀDŽᡆ㘵ˈᆖҐಘਟԕᆼࡦ᧗ޘỻተ઼˄䰤᧕
Ⲵ˅䇝㓳࠶㊫ˈቡ⋑ۿᴹᯭᮉ㘵ᰦᆳ઼㠚ᐡሩᔸ䘋㹼ᆖҐаṧDŽ⌘ሩҾᴰਾаᛵߥᆖҐ
ಘਟ㜭䘹ᤙԕлєᛵߥѝⲴа˖ㅜаˈ䈅傼ᆳ䘈ᵚ㘳㲁䗷Ⲵޘᯠỻተ˗ㅜҼˈ൘ᆳⴞࡽ
ਁ⧠Ⲵᴰཿ᭸Ⲵ䐟㓯Ⲵᗞሿਈॆкሩᔸˈԕ⼘ᆳⲴᢰ㜭DŽਾ㔝Ⲵㄐ㢲㘳㲁аӋᆖҐṶᷦˈ
वᤜҶԕлࠐᛵߥ˖䇝㓳㓿傼ᱟԕ䎵ѾᆖҐಘ᧗ࡦⲴ䲿ᵪ䗷〻ᨀ˗ⲴᆖҐಘਟੁᯭᮉ㘵
ᨀࠪн਼㊫රⲴḕ䈒˗ԕ৺ᆖҐಘ䙊䗷㠚ࣘ᧒㍒⧟ຳᶕᩌ䳶䇝㓳ṧֻDŽ
䇝㓳㓿傼Ⲵㅜйњ䟽㾱ᙗᱟˈ䇝㓳ṧֻⲴ࠶ᐳ㜭ཊྭൠ㺘⽪ᇎֻ࠶ᐳˈ㘼ᴰ㓸㌫㔏Ⲵ
ᙗ㜭 P ᱟ䙊䗷ਾ㘵ᶕ㺑䟿ⲴDŽа㡜㘼䀰ˈᖃ䇝㓳ṧֻⲴ࠶ᐳ઼ሶᶕⲴ⍻䈅ṧֻⲴ࠶ᐳլ
ᰦˈᆖҐާᴹᴰབྷⲴਟؑᓖDŽሩҾᡁԜⲴ㾯⌻䐣ỻᆖҐˈᙗ㜭ᤷḷ P ᱟ䈕㌫㔏൘ц⭼䭖ḷ
䎋к䎒ỻⲴⲮ࠶∄DŽྲ᷌ᆳⲴ䇝㓳㓿傼 E ӵ⭡઼ᆳ㠚ᐡሩᔸⲴ䇝㓳㓴ᡀˈׯᆈ൘ањ᰾ᱮ
Ⲵড䲙˖䘉њ䇝㓳ਟ㜭н㜭࠶ݵൠ㺘⽪䈕㌫㔏ԕਾ㻛⍻䈅ᰦⲴᛵᖒDŽֻྲˈᆖҐಘਟ㜭൘䇝
㓳ѝӾᶕᵚ䙷ࡠ䗷ḀӋ䶎ᑨޣ䭞ᙗⲴỻተˈ㘼ᆳԜ৸䶎ᑨਟ㜭㻛Ӫ㊫ц⭼ߐߋ䟷⭘DŽᇎ䱵кˈ
ᆖҐⲴṧֻ䙊ᑨоᴰ㓸㌫㔏㻛䇴ՠᰦⲴṧֻᴹаᇊᐞᔲˈᆖҐಘᗵ享㜭Ӿѝ䘋㹼ᆖҐ˄Ѯֻ
ᶕ䈤ˈц⭼㓗Ⲵ㾯⌻䐣ỻߐߋਟ㜭нՊᴹޤ䏓ᮉањ〻ᒿлỻ˅DŽ䘉Ⲵ⺞ᱟањ䰞仈ˈഐѪ
ᦼᨑҶṧֻⲴа࠶ᐳˈнаᇊՊሬ㠤ሩަԆⲴ࠶ᐳҏᴹྭⲴᙗ㜭DŽਟԕⴻࡠˈⴞࡽཊᮠᵪ
ಘᆖҐ⨶䇪䜭ᱟสҾ䇝㓳ṧֻо⍻䈅ṧֻ࠶ᐳа㠤䘉аࡽᨀDŽቭ㇑ᡁԜ䴰㾱䘉ṧⲴࡽᨀԕׯ
ᗇࡠ⨶䇪Ⲵ㔃᷌ˈն਼ṧᗵ享䇠տ൘ᇎ䐥ѝ䘉њٷ䇮㓿ᑨᱟнѕṬᡀ・ⲴDŽ
л䶒㔗㔝䘋㹼㇇⌅䇮䇑ˈᡁԜߣᇊ㌫㔏ሶ䙊䗷઼㠚ᐡሩᔸᶕ䇝㓳DŽ䘉ṧⲴྭ༴ᱟн䴰㾱
ཆ⭼Ⲵ䇝㓳㘵ˈᡰԕਟԕ䇙㌫㔏ӗ⭏ᰐ䲀ཊⲴ䇝㓳ᮠᦞˈਚ㾱ᰦ䰤ݱ䇨DŽ⧠൘ᴹҶањᆼᮤ
ⲴᆖҐԫ࣑DŽ
㾯⌻䐣ỻᆖҐ䰞仈˖
x ԫ࣑ T˖л㾯⌻䐣ỻ
x ᙗ㜭ḷ߶ P˖ц⭼䭖ḷ䎋кࠫ䍕ሩⲴⲮ࠶∄
x 䇝㓳㓿傼 E˖઼㠚ᐡ䘋㹼ሩᔸ
ѪҶᆼᡀ䘉њᆖҐ㌫㔏Ⲵ䇮䇑ˈ⧠൘䴰㾱䘹ᤙ˖
1. 㾱ᆖҐⲴ⸕䇶Ⲵ⺞࠷㊫ර
2. ሩҾ䘉њⴞḷ⸕䇶Ⲵ㺘⽪
3. аᆖҐᵪࡦ
1.2.2 䘿ⴤḽ࠳ᮦ
лањ䇮䇑䘹ᤙᱟߣᇊ㾱ᆖҐⲴ⸕䇶Ⲵ⺞࠷㊫රˈԕ৺ᢗ㹼〻ᒿᘾṧ֯⭘䘉Ӌ⸕䇶DŽᡁ
ԜӾањሩҾԫօỻተ䜭㜭ӗ⭏ਸ⌅˄legal˅䎠ᆀⲴ㾯⌻䐣ỻঊᔸ〻ᒿᔰDŽ䛓Ѹˈᴰ㓸Ⲵ
〻ᒿӵ享ᆖՊӾ䘉Ӌਸ⌅Ⲵ䎠ᆀѝ䘹ᤙᴰ֣ⲴDŽ䘉њᆖҐԫ࣑ԓ㺘Ҷаབྷ㊫ԫ࣑˖ਸ⌅䎠ᆀ
ᇊѹҶḀњݸ傼ᐢ⸕Ⲵᐘབྷᩌ㍒オ䰤ˈնᴰ֣Ⲵᩌ㍒ㆆ⮕ᵚ⸕DŽᖸཊᴰՈॆ䰞仈䜭ਟᖂҾ↔
㊫ˈֻྲሩҾ⭏ӗ䗷〻Ⲵ䈳ᓖ઼᧗ࡦ䰞仈ˈ⭏ӗѝⲴ⇿а↕䜭ᖸᾊˈն䈳ᓖ䘉Ӌ↕僔Ⲵᴰ
֣ㆆ⮕ᵚ⸕DŽ
ѪҶᆖҐӾਸ⌅䎠ᆀѝࠪ䘹ᤙˈᖸ᰾ᱮˈ㾱ᆖҐⲴؑ㊫රቡᱟањ〻ᒿᡆ࠭ᮠˈᆳ
ሩ ԫ օ 㔉 ᇊ Ⲵ ỻ ተ 㜭 䘹 ࠪ ᴰ ྭ Ⲵ 䎠 ⌅ DŽ ਟ 〠 ↔ ࠭ ᮠ Ѫ ChooseMove ˈ ᒦ ⭘ 䇠 ⌅
ChooseMove:BM ᶕ㺘⽪䘉њ࠭ᮠԕਸ⌅ỻተ䳶ਸѝⲴỻⴈ⣦ᘱѪ䗃ˈޕᒦӾਸ⌅䎠ᆀ
䳶ਸѝӗ⭏Ḁњ䎠ᆀѪ䗃ࠪDŽ൘ޣҾᵪಘᆖҐⲴᡰᴹ䇘䇪ѝˈᡁԜਁ⧠ਟԕᢺሩԫ࣑ T
ᨀ儈ᙗ㜭 P Ⲵ䰞仈ㆰॆѪᆖҐ䊑 ChooseMove 䘉ṧḀњ⢩ᇊⲴⴞ ⴞḷ࠭ᮠ˄target function˅
Ⲵ䰞仈DŽᡰԕⴞḷ࠭ᮠⲴ䘹ᤙᱟањޣ䭞Ⲵ䇮䇑䰞仈DŽ
ሩҾԫỻተˈⴞḷ࠭ᮠ V Ⲵ߶⺞٬ᓄ䈕ᱟཊቁ˛ᖃ❦ԫօሩ䖳ྭⲴỻተ䍻Ҹ䖳儈
Ⲵ࠶ᮠⲴ䇴ՠ࠭ᮠ䜭䘲⭘DŽ❦㘼ˈᴰྭ൘䛓Ӌӗ⭏ᴰ֣ሩᔸⲴՇཊᯩ⌅ѝᇊѹањ⢩ᇊⲴⴞ
ḷ࠭ᮠ VDŽਟԕⴻࡠˈ䘉ሶ֯ᗇ䇮䇑ањ䇝㓳㇇⌅ਈᗇㆰঅDŽഐ↔ˈሩҾ䳶ਸ B ѝⲴԫⲴ
ỻተ⣦ᘱ bˈᡁԜྲлᇊѹⴞḷ࠭ᮠ V(b)˖
1. ྲ᷌ b ᱟаᴰ㓸Ⲵ㜌ተˈ䛓Ѹ V(b)=100
2. ྲ᷌ b ᱟаᴰ㓸Ⲵ䍏ተˈ䛓Ѹ V(b)=-100
3. ྲ᷌ b ᱟаᴰ㓸Ⲵ઼ተˈ䛓Ѹ V(b)=0
❦㘼ˈ⭡Ҿ䘉њᇊѹⲴ䙂ᖂᙗˈᆳⲴ䘀㇇᭸⦷н儈ˈᡰԕ䘉њᇊѹሩҾ㾯⌻䐣ỻ∄䎋㘵
нਟ⭘DŽ䲔Ҷᰐޣ㍗㾱Ⲵࡽй㓸ተⲴᛵߥˈሩҾḀањỻⴈ⣦ᘱ˄ᛵߥ 4˅b㾱ߣᇊᆳⲴ
٬V˄b˅䴰㾱ੁࡽᩌ㍒ࡠ䗮㓸ተⲴᡰᴹ䐟㓯ʽ⭡Ҿ䘉њᇊѹн㜭⭡㾯⌻䐣ỻ〻ᒿ儈᭸ൠ䘀
㇇ˈ䘉њᇊѹ㻛〠ѪнਟⲴᇊѹDŽDŽᖃࡽⲴⴞḷᱟਁ⧠ањਟⲴᇊѹVˈᆳ㜭ཏ㻛㾯
⌻䐣ỻ〻ᒿ⭘ᶕ൘ਸ⨶Ⲵᰦ䰤䇴ՠỻተᒦ䘹ਆ䎠⌅DŽ
䘉ṧˈ䘉ᛵߥⲴᆖҐԫ࣑㻛ㆰॆᡀਁ⧠ањ⨶ᜣⴞḷ࠭ᮠ V Ⲵਟ᧿䘠DŽ䙊ᑨ㾱
ᆼ㖾ൠᆖҐ䘉ṧањ V ⲴਟⲴᖒᔿᱟ䶎ᑨഠ䳮ⲴDŽһᇎкˈᡁԜ㓿ᑨᐼᵋᆖҐ㇇⌅ӵ
ᗇࡠⴞḷ࠭ᮠⲴḀњ䘁
䘁լ˄approximation˅ˈ⭡Ҿ䘉њഐᆖҐⴞḷ࠭ᮠⲴ䗷〻ᑨ㻛〠Ѫ࠭
ᮠ䙬䘁˄function approximation˅DŽ൘ᖃࡽⲴ䇘䇪ѝˈ⭘ Vˆ ᶕ㺘⽪〻ᒿѝᇎ䱵ᆖҐࡠⲴ࠭ᮠˈ
ԕ४࡛⨶ᜣⴞḷ࠭ᮠ VDŽ
1.2.3 䘿ⴤḽ࠳ᮦⲺ㺞⽰
㠣↔ˈᡁԜᐢ㓿⺞ᇊҶⴞḷ࠭ᮠ Vˈ᧕лᶕᗵ享䘹ᤙањ㺘⽪ˈ㻛ᆖҐ〻ᒿ⭘ᶕ᧿䘠㾱
ᆖҐⲴ࠭ᮠ Vˆ DŽሩ↔ҏᴹᖸཊ䇮䇑䘹ᤙDŽֻྲˈਟԕሶ Vˆ 㺘⽪Ѫаᕐབྷ㺘ˈሩҾ⇿њᜏа
Ⲵỻⴈ⣦ᘱ bˈ㺘ѝᴹᜏаⲴ㺘亩ᶕ⺞ᇊᆳⲴ⣦ᘱ٬ Vˆ (b)DŽᡆ㘵ˈਟԕ䇙〻ᒿ⭘ањ㿴ࡉ䳶
ਸᶕ३䝽ỻተⲴ⢩ᖱԕ㺘⽪ Vˆ ˈᡆ䟷⭘ањо亴ᇊѹỻⴈ⢩ᖱᴹⲴޣҼ⅑ཊ亩ᔿ࠭ᮠˈᡆ
㘵⭘Ӫᐕ⾎㓿ݳ㖁㔌DŽ䙊ᑨˈ䘹ᤙ䘉њ᧿䘠वਜ਼ањ䟽㾱Ⲵᵳ㺑䗷〻DŽаᯩ䶒ˈᡁԜᙫᐼᵋ
䘹ਆањ䶎ᑨᴹ㺘ᖱ࣋Ⲵ᧿䘠ˈԕᴰབྷਟ㜭ൠ䙬䘁⨶ᜣⲴⴞḷ࠭ᮠ VDŽਖаᯩ䶒ˈ䎺ᴹ㺘ᖱ
࣋Ⲵ᧿䘠䴰㾱䎺ཊⲴ䇝㓳ᮠᦞˈ֯〻ᒿ㜭Ӿᆳ㺘⽪Ⲵཊٷ䇮ѝࠪڊ䘹ᤙDŽѪҶㆰॆ䇘䇪ˈ
⧠൘䘹ᤙањㆰঅⲴ㺘⽪⌅˖ሩҾԫօ㔉ᇊⲴỻⴈ⣦ᘱˈ࠭ᮠ Vˆ ਟԕ䙊䗷ԕлỻⴈ৲ᮠⲴ
㓯ᙗ㓴ਸᶕ䇑㇇˖
z x1˖ỻⴈк唁ᆀⲴᮠ䟿
z x2˖ỻⴈк㓒ᆀⲴᮠ䟿
z x3˖ỻⴈк唁⦻Ⲵᮠ䟿
z x4˖ỻⴈк㓒⦻Ⲵᮠ䟿
z x5˖㻛㓒ᆀေ㛱Ⲵ唁ᆀᮠ䟿˄ণՊ൘ла⅑㻛㓒ਲ਼ᦹⲴᆀ˅
z x6˖㻛唁ᆀေ㛱Ⲵ㓒ᆀᮠ䟿
ҾᱟˈᆖҐ〻ᒿᢺ Vˆ (b)㺘⽪Ѫањ㓯ᙗ࠭ᮠ
Vˆ (b)=w0+w1x1+w2x2+w3x3+w4x4+w5x5+w6x6
ަѝw0ࡠw6Ѫᮠᆇ㌫ᮠˈᡆਛᵳˈ⭡ᆖҐ㇇⌅ᶕ䘹ᤙDŽ൘ߣᇊḀањỻⴈ⣦ᘱⲴ࠶٬ᰦˈ
w1 ࡠ w6ߣᇊҶн਼Ⲵỻⴈ⢩ᖱⲴሩ䟽㾱ᙗˈ㘼ᵳw0Ѫањ䱴࣐Ⲵᑨ䟿DŽ
ᾲᤜалⴞࡽѪ→Ⲵ䇮䇑DŽᡁԜᐢ㓿䈖㓶䱀䘠Ҷ䘉њᆖҐ䰞仈ⲴරˈণѪᆳ䘹ᤙа
㊫රⲴ䇝㓳㓿傼ǃањ㾱ᆖҐⲴⴞḷ࠭ᮠ઼䘉њⴞḷ࠭ᮠⲴа㺘⽪⌅DŽ⧠൘ⲴᆖҐԫ࣑ᱟ˖
㾯⌻䐣ỻ〻ᒿⲴ䜘࠶䇮䇑
x ԫ࣑ T˖л㾯⌻䐣ỻ
x ᙗ㜭ḷ߶ P˖ц⭼䭖ḷ䎋кࠫ䍕ሩⲴⲮ࠶∄
x 䇝㓳㓿傼 E˖઼㠚ᐡ䘋㹼䇝㓳ሩᔸ
x ⴞḷ࠭ᮠ˖V˖B
x ⴞḷ࠭ᮠⲴ㺘⽪˖ Vˆ (b)=w0+w1x1+w2x2+w3x3+w4x4+w5x5+w6x6
ࡽйᶑᱟሩᆖҐԫ࣑Ⲵ䈤᰾ˈਾєᶑࡦᇊҶѪᇎ⧠䘉њᆖҐ〻ᒿⲴ䇮䇑ᯩṸDŽ⌘䘉њ
䇮䇑Ⲵޣ䭞⭘ᱟᢺᆖҐ㾯⌻䐣ỻᡈ⮕Ⲵ䰞仈ㆰॆѪᆖҐⴞḷ࠭ᮠ᧿䘠ѝ㌫ᮠw0ࡠw6٬Ⲵ
䰞仈DŽ
1.2.4 䘿࠳ᮦ䙲䘇㇍⌋
ѪҶᆖҐⴞḷ࠭ᮠ Vˆ ˈ䴰㾱а㌫ࡇ䇝㓳ṧֻˈ⇿ањṧֻ᧿䘠Ҷ⢩ᇊⲴỻⴈ⣦ᘱb઼
ᆳⲴ䇝㓳٬Vtrain(b)DŽᦒ䀰ѻˈ⇿ањ䇝㓳ṧֻᱟᖒᔿѪ<bˈVtrain(b)>ⲴᒿڦDŽѮֻᶕ䈤ˈл
䶒Ⲵ䇝㓳ᇎֻ᧿䘠Ҷањ唁ỻ㜌࡙˄⌘x2=0 㺘⽪㓒ỻᐢ㓿⋑ᴹᆀҶ˅Ⲵỻⴈ⣦ᘱbˈᆳⲴ
ⴞḷ࠭ᮠ٬Vtrain(b)Ѫ 100DŽ
<<x1=3ˈx2=0ˈx3=1ˈx4=0ˈx5=0ˈx6=0>ˈ+100>
л᮷᧿䘠Ҷањ䗷〻ˈᆳݸӾᆖҐಘਟᗇⲴ䰤᧕䇝㓳㓿傼ѝሬࠪк䶒Ⲵ䇝㓳ṧֻˈ❦ਾ
䈳ᮤᵳ٬wiԕᴰ֣ᤏਸ䘉Ӌ䇝㓳ṧֻDŽ
1.2.4.1 զ䇗䇣㓹ٲ
ṩᦞԕкⲴᆖҐ⁑රˈᆖҐಘਟԕᗇࡠⲴ䇝㓳ؑӵᱟሩᔸᴰਾⲴ㜌䍏DŽ ਖаᯩ䶒ˈ
ᡁԜ䴰㾱䇝㓳ṧֻѪ⇿њỻⴈ⣦ᘱ䍻Ҹањ࠶٬DŽ㔉ሩᔸ㔃ᶏᰦⲴỻⴈ⣦ᘱ䇴࠶ᱟᇩ᱃Ⲵˈ
㘼㾱㔉ሩᔸ㔃ᶏࡽⲴབྷ䟿ѝ䰤ỻተ䇴࠶ቡн䛓Ѹᇩ᱃ҶDŽഐѪˈаⴈỻⲴᴰ㓸䗃䎒ᵚᗵ㜭䈤
᰾䘉ⴈỻᖃѝⲴ⇿ањỻⴈ⣦ᘱⲴྭᡆൿDŽֻྲˈণ֯Ḁњ〻ᒿ䗃ҶаⴈỻˈӽՊᴹ䘉ṧⲴ
ᛵߥˈ䘉ⴈỻࡽ䶒Ⲵỻተᓄ䈕㔉Ҹᖸ儈Ⲵ䇴ԧˈཡ䍕Ⲵഐ൘Ҿਾᶕ㌏㌅Ⲵ䎠⌅DŽ
ቭ㇑ՠ䇑ѝ䰤ỻተ䇝㓳٬ާᴹ൘Ⲵ⁑㋺ᙗˈնԔӪ䇦ⲴᱟᴹањㆰঅⲴᯩ⌅তਆᗇ
Ҷ㢟ྭ㔃᷌DŽ䘉ᯩ⌅ሩҾԫօѝ䰤ỻተbⲴ䇝㓳٬Vtrain(b)ㅹҾ Vˆ (Successor(b))ˈަѝ Vˆ ᱟ
ᆖҐಘ䟷⭘ⲴሩVⲴ䘁լˈSuccessor(b) 㺘⽪bѻਾ䖞ࡠ〻ᒿ䎠ỻᰦⲴỻⴈ⣦ᘱ˄ҏቡᱟ〻
ᒿ䎠Ҷа↕઼ሩഎᓄа↕ਾⲴỻተ˅DŽ
䘉ՠ䇑䇝㓳٬Ⲵᯩ⌅ਟ㻛ᖂ㓣Ѫ˖
䇝㓳٬ՠ䇑⌅ࡉ
ᡆ䇨䘉ⴻ䎧ᶕᴹ⛩ཷˈਚ֯⭘ᖃࡽⲴ Vˆ ᶕՠ䇑䇝㓳٬ˈ䘉а䇝㓳٬৸㻛⭘ᶕᴤᯠ Vˆ DŽ
ն䈧⌘ˈᡁԜᱟ൘⭘ਾ㔝ỻተSuccessor(b)Ⲵՠ䇑٬ᶕՠ䇑ỻተbⲴ٬DŽࠝⴤ㿹ˈᡁԜਟԕ
ⴻࡠ䎺᧕䘁⑨ᠿ㔃ᶏⲴỻተⲴ Vˆ 䎺䎻ੁ㋮⺞DŽһᇎкˈ൘⢩ᇊᶑԦл˄ሶ൘ㅜ 13 ㄐ䇘䇪˅
䘉สҾሩਾ㔗ỻተ䘋㹼ՠ䇑Ⲵ䘝ԓՠ䇑䇝㓳٬Ⲵᯩ⌅ˈᐢ㻛䇱᰾ਟԕ䘁Ѿᆼ㖾ൠ᭦ᮋࡠ
Vtrainՠ䇑٬DŽ
1.2.4.2 ᵹٲ䈹᮪
࢙лⲴһᛵቡᱟѪ䘉њᆖҐ㇇⌅䘹ᤙᴰ䘲ਸ䇝㓳ṧֻ{<b, Vtrain(b)>}ⲴᵳwiDŽㅜа↕ᗵ享
ᇊѹᴰ֣ᤏਸ˄best fit˅䇝㓳ᮠᦞⲴਜ਼ѹDŽаᑨ⭘Ⲵᯩ⌅ᱟᢺᴰ֣Ⲵٷ䇮˄ᡆᵳੁ䟿䳶ਸ˅
ᇊѹѪ֯䇝㓳٬઼ٷ䇮 Vˆ 亴⍻ࠪⲴ٬䰤Ⲵ䈟ᐞᒣᯩEᴰሿDŽ
E{ ¦
b ,V train ( b ) ! 䇝㓳ṧֻ
(Vtrain ( b ) Vˆ ( b )) 2
㠣↔ˈᡁԜⲴⴞḷቡᱟራᵳ٬˄ㅹԧൠˈራ Vˆ ˅ˈ֯ሩҾ㿲⍻ࡠⲴ䇝㓳ᮠᦞ E ٬ᴰ
ሿॆDŽㅜ 6 ㄐሶ䇘䇪൘ӰѸᶑԦлˈᴰሿॆ䈟ᐞᒣᯩ઼ㅹԧҾራ㔉ᇊ㿲⍻䇝㓳ᮠᦞлⲴᴰ
ਟ㜭ٷ䇮DŽ
ᐢ㓿⸕䚃аӋ㇇⌅ਟԕᗇࡠ㓯ᙗ࠭ᮠⲴᵳ֯↔ᇊѹⲴ E ᴰሿॆDŽ൘䘉䟼䴰㾱ањ㇇⌅ˈ
ᆳਟԕ൘ᴹҶᯠⲴ䇝㓳ṧֻᰦ䘋а↕᭩䘋ᵳ٬ˈᒦфᆳሩՠ䇑Ⲵ䇝㓳ᮠᦞѝⲴᐞ䭉ᴹྭⲴڕ
༞ᙗDŽањ䘉ṧⲴ㇇⌅㻛〠ᴰሿ൷ᯩ⌅˄least mean squares˅ˈᡆਛ LMS 䇝㓳⌅ࡉDŽሩҾ
⇿а䇝㓳ṧֻˈᆳᢺᵳ٬ੁ߿ሿ䘉њ䇝㓳ᮠᦞ䈟ᐞⲴᯩੁ⮕ᗞ䈳ᮤDŽྲㅜ 4 ㄐ䇘䇪Ⲵ䛓ṧˈ
䘉њ㇇⌅ਟ㻛ⴻሩਟ㜭Ⲵٷ䇮˄ᵳ٬˅オ䰤䘋㹼䲿ᵪⲴởᓖл䱽ᩌ㍒ˈԕ֯䈟ᐞᒣᯩ઼ E
ᴰሿॆDŽLMS ㇇⌅ᱟ䘉ṧᇊѹⲴ˖
LMS ᵳ٬ᴤᯠ⌅ࡉ
ሩҾ⇿ањ䇝㓳ṧֻ<bˈVtrain(b)>
x ֯⭘ᖃࡽⲴᵳ䇑㇇ Vˆ (b)
x ሩ⇿ањᵳ٬wi䘋㹼ྲлᴤᯠ
wiĕwi+(Vtrain(b)- Vˆ (b)) xi
䘉䟼¨ᱟањሿⲴᑨᮠ˄∄ྲ 0.1˅⭘ᶕ䈳ᮤᵳ٬ᴤᯠⲴᑵᓖDŽѪҶⴤ㿲ൠ⨶䀓䘉њᵳ
٬ᴤᯠ⌅ࡉⲴᐕ⨶ˈ䈧⌘ᖃ䈟ᐞ˄Vtrain(b)- Vˆ (b)˅Ѫ 0 ᰦˈᵳнՊ㻛᭩ਈDŽᖃ
(Vtrain(b)- Vˆ (b))Ѫ↓ᰦ˄ֻྲˈᖃ Vˆ (b)ཚվᰦ˅⇿ањᵳ٬Պṩᦞަሩᓄ⢩ᖱ٬໎࣐аᇊⲴ
∄ֻDŽ䘉Պᨀॷ Vˆ (b)Ⲵ٬㘼߿ሿ䈟ᐞDŽ⌘ྲ᷌Ḁњ৲ᮠxiѪ 0ˈ䛓ѸᆳⲴ٬нՊഐ䘉њ䈟
ᐞ㘼᭩ਈˈ䘉ṧ֯ׯਚᴹ䛓Ӌ൘䇝㓳ṧֻⲴỻተѝ⺞ᇎࠪ⧠Ⲵ⢩ᖱⲴᵳ٬㻛ᴤᯠDŽԔӪਲ਼
Ⲵᱟˈ൘аᇊⲴᶑԦлˈ䘉ㆰঅⲴᵳ٬䈳ᮤᯩ⌅㻛䇱᰾ਟԕ᭦ᮋࡠVtrain ٬Ⲵᴰሿ䈟ᐞ
ᒣᯩ䙬䘁˄ቡۿㅜ 4 ㄐᡰ䇘䇪Ⲵ˅DŽ
1.2.5 ᴶ㓾Ⲻ䇴䇗
㾯⌻䐣ỻᆖҐ㌫㔏Ⲵᴰ㓸䇮䇑ਟԕ㠚❦ൠ⭘ഋњᾊⲴ〻ᒿ⁑ඇᶕ᧿䘠ˈ䘉Ӌ⁑ඇ൘ᖸ
ཊᆖҐ㌫㔏ѝᱟṨᗳ㓴ԦDŽ䘉ഋњ⁑ඇ㻛ᖂ㓣൘മ 1-1 ѝˈᆳԜᱟ˖
ᢗ㹼㌫㔏˄Performance system˅ˈ䘉њ⁑ඇᱟ⭘ᆖՊⲴⴞḷ࠭ᮠᶕ䀓ߣ㔉ᇊⲴԫ࣑ˈ
൘↔ቡᱟሩᔸ㾯⌻䐣ỻDŽᆳᢺᯠ䰞仈˄ᯠаⴈỻ˅ⲴᇎֻѪ䗃ˈޕӗ⭏а㓴䀓ㆄ䐟㓯˄ሩ
ᔸশਢ䇠ᖅ˅Ѫ䗃ࠪDŽ൘䘉䟼ˈᢗ㹼㌫㔏䟷⭘Ⲵ䘹ᤙла↕䎠⌅Ⲵㆆ⮕ᱟ⭡ᆖࡠⲴ䇴ՠ࠭
ᮠ Vˆ ᶕߣᇊⲴDŽᡰԕᡁԜᵏᖵᆳⲴᙗ㜭Պ䲿⵰䇴ՠ࠭ᮠⲴᰕ⳺߶⺞㘼ᨀ儈DŽ
插图——原书页码: 12
Experiment Generator-䈅傼⭏ᡀಘ
Performance System-ᢗ㹼㌫㔏
Critic-䢤ᇊಘ
Training examples-䇝㓳ṧֻ
Generalizer-⌋ॆಘ
Hypothesis-ٷ䇮
മ 1-1 㾯⌻䐣ỻᆖҐ〻ᒿⲴᴰ㓸䇮䇑
䢤ᇊಘ˄Critic˅ˈᆳԕሩᔸⲴ䐟㓯ᡆশਢ䇠ᖅѪ䗃ˈޕ䗃ࠪⴞḷ࠭ᮠⲴа㌫ࡇ䇝㓳ṧ
ֻDŽྲമᡰ⽪ˈ⇿ањ䇝㓳ṧֻሩᓄ䐟㓯ѝⲴḀњỻⴈ⣦ᘱ઼ⴞḷ࠭ᮠ㔉䘉њṧֻⲴ䇴ՠ٬
VtrainDŽ൘ᡁԜⲴֻᆀѝˈ䢤ᇊಘሩᓄᔿ 1.1 㔉ࠪⲴ䇝㓳⌅ࡉDŽ
⌋ॆಘ˄Generalizer˅ˈᆳԕ䇝㓳ṧֻѪ䗃ˈޕ䗃ࠪањٷ䇮ˈѪᆳሩⴞḷ࠭ᮠⲴ
ՠ䇑DŽᆳӾ⢩ᇊⲴ䇝㓳ṧֻѝ⌋ॆˈ⥌⍻ања㡜࠭ᮠˈ֯ަ㜭ཏ㾶ⴆ䘉Ӌṧֻԕ৺ṧֻѻ
ཆⲴᛵᖒDŽ൘ᡁԜⲴֻᆀѝˈ⌋ॆಘሩᓄLMS㇇⌅ˈ䗃ࠪٷ䇮ᱟ⭘ᆖҐࡠⲴᵳ٬w0 ,..., w6᧿
ˆ
䘠Ⲵ࠭ᮠ V DŽ
ᇎ傼⭏ᡀಘ˄Experiment Generator˅ˈᆳԕᖃࡽⲴٷ䇮˄ᖃࡽᆖࡠⲴ࠭ᮠ˅Ѫ䗃ˈޕ
䗃ࠪањᯠⲴ䰞仈˄ֻྲˈᴰࡍⲴỻተ˅ᢗ㹼㌫㔏৫᧒㍒DŽᆳⲴ䀂㢢ᱟ䘹ᯠⲴ㓳Ґ䰞仈ˈ
ԕ֯ᮤњ㌫㔏ⲴᆖҐ䙏⦷ᴰབྷॆDŽ൘ᡁԜⲴֻᆀѝˈᇎ傼⭏ᡀಘ䟷⭘Ҷ䶎ᑨㆰঅⲴㆆ⮕˖ᆳ
ᙫᱟ㔉ࠪањ਼ṧⲴࡍỻተᶕᔰᯠⲴаⴈỻDŽᴤᆼழⲴㆆ⮕ਟ㜭㠤࣋Ҿ㋮ᗳ䇮䇑ỻᆀս
㖞ԕ᧒㍒ỻⴈオ䰤Ⲵ⢩ᇊ४ฏDŽ
ᙫփᶕⴻˈᡁԜѪ㾯⌻䐣ỻ〻ᒿⲴ䇮䇑ቡᱟӗ⭏ᢗ㹼㌫㔏ǃ䢤ᇊಘǃ⌋ॆಘ઼ᇎ傼⭏
ᡀಘⲴ⢩ᇊᇎֻDŽᖸཊᵪಘᆖҐ㌫㔏䙊ᑨਟԕ⭘䘉ഋњ䙊⭘⁑ඇᶕ⭫DŽ
插图——原书页码: 13
Board->move- ỻⴈo䎠ᆀ
Board->value- ỻⴈo࠶٬
Polynomial- ཊ亩ᔿ
മ 1-2 㾯⌻䐣ỻᆖҐ〻ᒿⲴ䇮䇑䗷〻ᾲ䘠
ᡁԜٷᇊⵏᇎ࠭ᮠ V Ⲵਸ⨶Ⲵ䘁լ⺞ᇎਟ㻛㺘⽪Ѫ䘉ᖒᔿDŽ䛓Ѹ䰞仈ਈᡀ䘉ᆖҐ
ᢰᵟᱟ⺞؍㜭ਁ⧠ањਸ⨶Ⲵ䘁լDŽㅜ 13 ㄐᨀҶа⨶䇪࠶᷀ˈ㺘᰾ሩҾḀӋ㊫රⲴ
ᩌ㍒䰞仈ˈ൘ᖃѕṬⲴࡽᨀлˈ䘉ᯩ⌅⺞ᇎ᭦ᮋࡠᵏᵋⲴ䇴ՠ࠭ᮠDŽᖸᒨ䘀ˈᇎ䐥㓿傼
㺘᰾䘉ᆖҐ䇴ՠ࠭ᮠⲴ䙄ᖴ㓿ᑨᱟᡀ࣏Ⲵˈ⭊㠣൘㜭㻛䇱᰾Ⲵᛵᖒѻཆҏᱟྲ↔DŽ
ᐢ㓿䇮䇑Ⲵ〻ᒿ㜭ᆖᗇ䏣ཏྭ㘼ࠫ䍕Ӫ㊫Ⲵ㾯⌻䐣ỻߐߋੇ˛ᡆ䇨н㜭DŽ䜘࠶ൠˈ䘉ᱟ
ഐѪ Vˆ Ⲵ㓯ᙗ࠭ᮠ㺘⽪ཚㆰঅԕ㠤Ҿн㜭ᖸྭᦅ䘉ỻⲴᗞ࿉ѻ༴DŽ❦㘼ˈྲ᷌㔉оа
њᴤᆼழⲴⴞḷ࠭ᮠ㺘⽪⌅ˈ䘉䙊⭘Ⲵ䙄ᖴһᇎкਟԕ䶎ᑨᡀ࣏DŽֻྲˈTesauro(1992, 1995)
ᣕҶᆖҐл㾯⌻ৼ䱶ỻⲴ〻ᒿⲴ㊫լ䇮䇑ˈᯩ⌅ᱟᆖҐањ䶎ᑨ㊫լⲴỻተ䇴ՠ࠭ᮠDŽᆳ
Ⲵ〻ᒿ֯⭘Ӫᐕ⾎㓿ݳ㖁㔌㺘⽪ᆖࡠⲴ䇴ՠ࠭ᮠˈᆳ㘳㲁ሩỻተⲴᆼᮤ᧿䘠㘼нᱟỻⴈⲴࠐ
њ৲ᮠDŽ㓿শҶаⲮз⅑ԕкⲴ㠚ᡁ⭏ᡀⲴ䇝㓳∄䎋ਾˈԆⲴ〻ᒿ㜭ཏ઼а⍱ⲴӪ㊫㾯⌻ৼ
䱶ỻ䘹аҹ儈лDŽ
ᖃ❦䘈ਟ㜭Ѫ㾯⌻䐣ỻᆖҐԫ࣑䇮䇑ᖸཊަԆⲴ㇇⌅DŽֻྲˈаਟ㜭ਚㆰঅൠᆈۘ䇝
㓳ṧֻˈ❦ਾ৫ራ؍ᆈⲴĀᴰ᧕䘁Ⲵāᛵᖒᶕ३䝽ᯠⲴᛵߥ˄ᴰ䘁䛫㇇⌅ˈㅜ 8 ㄐ˅DŽᡆ
㘵ਟԕӗ⭏བྷ䟿ى䘹Ⲵ㾯⌻䐣ỻ〻ᒿˈᒦ䇙ᆳԜӂ∄䎋ˈ⮉؍ᴰᡀ࣏Ⲵ〻ᒿᒦ䘋а↕⭘⁑
ᤏ䘋ॆⲴᯩᔿᶕษ㛢ᡆਈᔲᆳԜ˄䚇Ր㇇⌅ˈㅜ 9 ㄐ˅DŽӪ㊫լѾ䚥ᗚਖа䙄ᖴራᆖҐ
ㆆ⮕ˈԆԜ࠶᷀ᡆੁ㠚ᐡ䀓䟺∄䎋ѝ⻠ࡠⲴᡀ䍕Ⲵഐ˄สҾ䀓䟺ⲴᆖҐˈㅜ 11 ㄐ˅DŽк䶒
Ⲵ䇮䇑ᱟ䘉Ӌ㊫ѝⲴањㆰঅⲴ㇇⌅ˈᆳᱟѪҶ㔉ᡁԜӺਾⲴ䪸ሩ⢩ᇊ㊫࡛Ⲵԫ࣑ⲴᆖҐ
ᯩ⌅Ⲵ䇮䇑ྐᇊสDŽ
1.3 ᵰಞᆜҖⲺжӑ㿸⛯ૂ䰤从
൘ᵪಘᆖҐᯩ䶒ˈањᴹ᭸Ⲵ㿲⛩ᱟᵪಘᆖҐ䰞仈㓿ᑨᖂ㔃Ҿᩌ㍒䰞仈ˈণሩ䶎ᑨབྷⲴ
ٷ䇮オ䰤䘋㹼ᩌ㍒ˈԕ⺞ᇊᴰ֣ᤏਸ㿲ሏࡠⲴᮠᦞ઼ᆖҐಘᐢᴹ⸕䇶Ⲵٷ䇮DŽֻྲˈ㘳㲁а
лк䶒Ⲵ㾯⌻䐣ỻᆖҐ〻ᒿ䗃ࠪⲴٷ䇮オ䰤DŽ䘉њٷ䇮オ䰤वਜ਼ᡰᴹਟ⭡ᵳw0ࡠw6Ⲵн਼٬
Ⲵ䇴ՠ࠭ᮠDŽҾᱟᆖҐಘⲴԫ࣑ቡᱟᩌ㍒䘉њབྷⲴオ䰤ˈራо䇝㓳ᮠᦞᴰ֣ᤏਸⲴٷ䇮DŽ
䪸ሩᤏਸᵳ٬ⲴLMS㇇⌅䙊䗷䘝ԓ䈳ᮤᵳ٬ᇎ⧠Ҷ䘉њⴞⲴˈ⇿ᖃٷ䇮Ⲵ䇴ՠ࠭ᮠ亴⍻ࠪ
ањо䇝㓳ᮠᦞᴹٿᐞⲴ٬ᰦቡሩ⇿њᵳ٬䘋㹼ṑ↓DŽᖃᆖҐಘ㘳㲁Ⲵٷ䇮㺘⽪ᇊѹҶањ
䘎㔝Ⲵ৲ᮠॆⲴ▌൘ٷ䇮オ䰤ᰦˈ䘉њ㇇⌅ᖸᴹ᭸DŽ
ᵜҖⲴᖸཊㄐ㢲㔉ࠪҶሩаӋสᵜ㺘⽪˄ֻྲˈ㓯ᙗ࠭ᮠǃ䙫䗁᧿䘠ǃߣㆆṁǃӪᐕ⾎
㓿ݳ㖁㔌˅ᇊѹⲴٷ䇮オ䰤Ⲵᩌ㍒㇇⌅DŽ䘉Ӌн਼Ⲵٷ䇮㺘⽪⌅䘲ਸҾᆖҐн਼Ⲵⴞḷ࠭ᮠDŽ
ሩҾަѝⲴ⇿аٷ䇮㺘⽪⌅ˈሩᓄⲴᆖҐ㇇⌅ਁᥕн਼൘㔃ᶴⲴՈ࣯ᶕ㓴㓷ሩٷ䇮オ䰤
Ⲵᩌ㍒DŽ
㠚㠣㓸ˈᵜҖ䜭䍟ク⵰䘉ᢺᆖҐ䰞仈㿶Ѫᩌ㍒䰞仈Ⲵⴻ⌅ˈӾ㘼䙊䗷ᩌ㍒ㆆ⮕઼ᆖ
Ґಘ᧒㍒Ⲵᩌ㍒オ䰤Ⲵ൘㔃ᶴᶕ⭫ᆖҐᯩ⌅DŽᡁԜҏՊਁ⧠ˈ䘉㿲⛩ሩҾᖒᔿॆൠ࠶
᷀㾱ᩌ㍒Ⲵٷ䇮オ䰤Ⲵབྷሿǃਟ࡙⭘Ⲵ䇝㓳ṧֻⲴᮠ䟿ԕ৺ањо䇝㓳ᮠᦞа㠤Ⲵٷ䇮㜭⌋
ॆࡠᵚ㿱ᇎֻⲴ㖞ؑᓖ䘉й㘵ѻ䰤Ⲵޣ㌫䶎ᑨᴹ⭘DŽ
1.3.1 ᵰಞᆜҖⲺ䰤从
㾯⌻䐣ỻֻᆀᨀࠪҶᵪಘᆖҐᯩ䶒ᖸཊᲞ䙽䰞仈DŽᵪಘᆖҐ䘉䰘ᆖ、ˈ઼ᵜҖⲴ㔍བྷ䜘
࠶ˈ䜭㠤࣋Ҿഎㆄ㊫լл䶒Ⲵ䰞仈˖
x Ӿ⢩ᇊⲴ䇝㓳ᮠᦞᆖҐа㡜Ⲵⴞḷ࠭ᮠᆈ൘ӰѸṧⲴ㇇⌅˛ྲ᷌ᨀҶݵ
䏣Ⲵ䇝㓳ᮠᦞˈӰѸṧⲴᶑԦлՊ֯⢩ᇊⲴ㇇⌅᭦ᮋࡠᵏᵋⲴ࠭ᮠ˛ଚњ㇇
⌅ሩଚӋ䰞仈઼㺘⽪Ⲵᙗ㜭ᴰྭDŽ
x ཊቁ䇝㓳ᮠᦞᱟݵ䏣Ⲵ˛ᘾṧࡠᆖҐࡠⲴٷ䇮Ⲵ㖞ؑᓖо䇝㓳ᮠᦞⲴᮠ
䟿৺ᨀ㔉ᆖҐಘⲴٷ䇮オ䰤⢩ᙗѻ䰤Ⲵа㡜ޣ㌫˛
x ᆖҐಘᤕᴹⲴݸ傼⸕䇶ᱟᘾṧᕅሬӾṧֻ䘋㹼⌋ॆⲴ䗷〻Ⲵ˛ᖃݸ傼⸕䇶
ӵӵᱟ䘁լ↓⺞ᰦˈᆳԜՊᴹᑞࣙੇ˛
x ሩҾ䘹ᤙᴹ⭘Ⲵਾ㔝䇝㓳㓿傼ˈӰѸṧⲴㆆ⮕ᴰྭ˛䘉њㆆ⮕Ⲵ䘹ᤙՊᘾṧ
ᖡ૽ᆖҐ䰞仈Ⲵ༽ᵲᙗ˛
x ᘾṧᢺᆖҐԫ࣑ㆰॆѪањᡆཊњ࠭ᮠ䙬䘁䰞仈˛ᦒаᯩᔿˈ㌫㔏䈕䈅മ
ᆖҐଚӋ࠭ᮠ˛䘉њ䗷〻ᵜ䓛㜭㠚ࣘॆੇ˛
x ᆖҐಘᘾṧ㠚ࣘൠ᭩ਈ㺘⽪⌅ᶕᨀ儈㺘⽪઼ᆖҐⴞḷ࠭ᮠⲴ㜭࣋˛
1.4 ྸ䰻䈱ᵢҜ
䘉ᵜҖӻ㓽ҶᵪಘᆖҐⲴѫ㾱㇇⌅઼䙄ᖴ˗н਼ᆖҐԫ࣑ਟ㹼ᙗ઼⢩ᇊ㇇⌅㜭࣋Ⲵ⨶䇪
㔃᷌˗ԕ৺ᵪಘᆖҐᓄ⭘Ҿ䀓ߣ⧠ᇎ䰞仈ⲴֻᆀDŽਚ㾱ਟ㜭ˈㄐⲴ߉䜭࣋ҹо䰵䈫亪ᒿ
ᰐޣDŽ❦㘼аӋӂ䎆ᙗᱟнਟ䚯ⲴݽDŽྲ᷌ᵜҖ㻛⭘ᮉ、Җˈᡁᔪ䇞俆ݸᆼᡀㅜа઼
ㅜҼㄐˈ։лㄐสᵜਟԕԕԫ亪ᒿ䰵䈫DŽ䮯ᓖѪањᆖᵏⲴᵪಘᆖҐ䈮〻ਟԕवᤜࡽг
ㄐԕ৺仍ཆⲴࠐњᴰᝏޤ䏓Ⲵㄐ㢲DŽл䶒ㆰ㾱⍿㿸алㄐDŽ
x ㅜ 2 ㄐवᤜสҾㅖਧ઼䙫䗁㺘⽪ⲴᾲᘥᆖҐDŽҏ䇘䇪Ҷٷ䇮Ⲵа㡜ࡠ⢩↺ٿ
ᒿ㔃ᶴˈԕ৺ᆖҐѝᕅޕᖂ㓣ٿ㖞Ⲵᗵ㾱ᙗDŽ
x ㅜ 3 ㄐवᤜߣㆆṁᆖҐ઼䗷ᓖᤏਸ䇝㓳ᮠᦞⲴ䰞仈DŽ䘉аㄐҏࢆ᷀Ҷྕൾ
ࡳ࠰üü䈕ࡉᔪ䇞൘оᮠᦞа㠤Ⲵٷ䇮ѝ䘹ᤙᴰ⸝ٷ䇮DŽ
x ㅜ 4 ㄐवᤜӪᐕ⾎㓿㖁㔌Ⲵ⸕䇶ˈ⢩࡛ᱟ⹄ウᐢѵⲴ৽ੁՐ㇇⌅ˈԕ৺ở
ᓖл䱽Ⲵа㡜ᯩ⌅DŽ䘉аㄐवਜ਼ањ䈖㓶ⲴสҾ⾎㓿㖁㔌ⲴӪ㝨䇶࡛ᇎֻˈ
䈕ֻᆀ䴰㾱Ⲵᮠᦞ઼㇇⌅ਟԕ൘з㔤㖁кᗇࡠDŽ
x ㅜ 5 ㄐ㔉ࠪҶᶕ㠚㔏䇑઼ՠ䇑⨶䇪Ⲵสᾲᘥˈ⵰䟽Ҿ֯⭘ᴹ䲀Ⲵṧᵜᮠᦞ
䇴ՠٷ䇮Ⲵ㋮ᓖDŽ䘉аㄐवਜ਼Ҷ⭘Ҿՠ䇑ٷ䇮㋮ᓖⲴ㖞ؑオ䰤ˈ઼ሩн਼ᆖ
Ґ㇇⌅Ⲵ㋮ᓖ䘋㹼∄䖳Ⲵᯩ⌅DŽ
x ㅜ 6 ㄐӻ㓽ᵪಘᆖҐⲴ䍍ਦᯟ㿲⛩DŽᰒवᤜҶ֯⭘䍍ਦᯟ࠶᷀⭫䶎䍍ਦᯟ
ᆖҐ㇇⌅ˈ৸वᤜҶⴤ᧕༴⨶ᾲ⦷Ⲵ䍍ਦᯟ㇇⌅DŽ䘉аㄐवᤜањᓄ⭘䍍ਦ
ᯟ࠶㊫ಘᶕ࠶㊫᮷ᵜ᮷ẓⲴ䈖㓶ֻᆀˈᡰ䴰Ⲵᮠᦞ઼䖟Ԧਟԕ൘з㔤㖁кᗇ
ࡠDŽ
x ㅜ 7 ㄐ㾶ⴆҶ䇑㇇ᆖҐ⨶䇪ˈवᤜਟ㜭䘁լ↓⺞˄Probably Approximately
CorrectˈPAC˅ᆖҐ⁑ර઼ࠪ䭉⭼䲀˄Mistake-Bound˅ᆖҐ⁑රDŽᵜㄐ䇘䇪
Ҷ㚄ਸཊњᆖҐᯩ⌅Ⲵ࣐ᵳཊᮠ˄Weighted Majority˅㇇⌅DŽ
x ㅜ 8 ㄐ᧿䘠ҶสҾᇎֻⲴᆖҐᯩ⌅ˈवᤜᴰ䘁䛫ᆖҐˈተ䜘࣐ᵳഎᖂˈ઼ส
ҾṸֻⲴ᧘⨶DŽ
x ㅜ 9 ㄐ䇘䇪Ҷṩᦞ⭏⢙䘋ॆᔪ⁑ⲴᆖҐ㇇⌅ˈवᤜ䚇Ր㇇⌅઼䚇Ր㕆〻DŽ
x ㅜ 10 ㄐ㾶ⴆҶа㓴ᆖҐ㿴ࡉ䳶ਸⲴ㇇⌅ˈवᤜᆖҐа䱦 Horn ᆀਕⲴᖂ㓣䙫
䗁㕆〻ᯩ⌅DŽ
x ㅜ 11 ㄐवਜ਼ҶสҾ䀓䟺ⲴᆖҐˈণа֯⭘ԕࡽⲴ⸕䇶䀓䟺㿲ሏࡠⲴᇎֻˈ
❦ਾṩᦞ䘉Ӌ䀓䟺⌋ॆⲴᆖҐᯩ⌅DŽ
x ㅜ 12 ㄐ䇘䇪ҶᢺԕࡽⲴ䘁լ⸕䇶㔃ਸ䘋⧠ᴹⲴ䇝㓳ᮠᦞѝԕᨀ儈ᆖҐ㋮ᓖ
Ⲵᯩ⌅DŽ൘ަѝㅖਧ㇇⌅઼⾎㓿㖁㔌㇇⌅䜭ᴹ䇘䇪DŽ
x ㅜ 13 ㄐ䇘䇪Ҷ໎ᕪᆖҐDŽ䘉ᯩ⌅ᱟѪҶ༴⨶ᶕ㠚䇝㓳ؑѝⲴ䰤᧕Ⲵᡆ
ᔦ䘏Ⲵ৽侸DŽᵜㄐࡽ䶒ᨀ৺ⲴлỻᆖҐ〻ᒿᱟ໎ᕪᆖҐⲴањㆰঅⲴֻᆀDŽ
⇿ㄐⲴ㔃ቮवਜ਼Ҷᡰ㾶ⴆⲴѫ㾱ᾲᘥⲴሿ㔃ǃ䘋а↕䰵䈫Ⲵ৲㘳઼Ґ仈DŽަԆሩㄐ㢲Ⲵ
ᴤᯠˈवᤜᮠᦞ䳶઼㇇⌅Ⲵᇎ⧠ˈ䜭ਟӾ㖁൰ http://www.cs.cmu.edu/~tom/mlbook.html 䇯䰞
ࡠDŽ
1.5 ቅ㔉ૂ㺛ݻ䈱⢟
ᵪಘᆖҐ㠤࣋Ҿ⹄ウᔪ・㜭ཏṩᦞ㓿傼㠚ᡁᨀ儈༴⨶ᙗ㜭Ⲵ䇑㇇ᵪ〻ᒿDŽᵜㄐⲴ㾱⛩व
ᤜ˖
x ᵪಘᆖҐ㇇⌅൘ᖸཊᓄ⭘亶ฏ㻛䇱᰾ᴹᖸབྷⲴᇎ⭘ԧ٬DŽᆳԜ൘ԕлᯩ䶒⢩
࡛ᴹ⭘˖˄a˅ᮠᦞ᥆ᧈ䰞仈ˈণӾབྷ䟿ᮠᦞѝਁ⧠ਟ㜭वਜ਼൘ަѝⲴᴹԧ
٬Ⲵ㿴ᖻ˄ֻྲˈӾᛓ㘵ᮠᦞᓃѝ࠶᷀⋫⯇Ⲵ㔃᷌ˈᡆ㘵Ӿ䍒࣑ᮠᦞѝᗇࡠ
ؑ⭘䍧ⅮⲴᲞ䙽㿴ࡉ˅˗˄b˅൘ḀӋഠ䳮Ⲵ亶ฏѝˈӪԜਟ㜭䘈нާᴹᔰ
ਁࠪ儈᭸Ⲵ㇇⌅ᡰ䴰Ⲵ⸕䇶˄∄ྲˈӾമۿᓃѝ䇶࡛ࠪӪ㝨˅˗˄c˅䇑㇇
ᵪ〻ᒿᗵ享ࣘᘱൠ䘲ᓄਈॆⲴ亶ฏ˄ֻྲˈ൘ᯉ㔉ਈॆⲴ⧟ຳл䘋㹼⭏
ӗ䗷〻᧗ࡦˈᡆ䘲ᓄњӪ䰵䈫ޤ䏓Ⲵਈॆ˅DŽ
x ᵪಘᆖҐӾн਼Ⲵᆖ、੨᭦ᾲᘥˈवᤜӪᐕᲪ㜭ˈᾲ⦷઼㔏䇑ˈ䇑㇇༽ᵲᙗˈ
ؑ䇪ˈᗳ⨶ᆖ઼⾎㓿⭏⢙ᆖǃ᧗ࡦ䇪ǃԕ৺ଢᆖDŽ
x ањᆼᮤᇊѹⲴᆖҐ䰞仈䴰㾱ањ᰾⺞⭼ᇊⲴԫ࣑ǃᙗ㜭ᓖ䟿ḷ߶ԕ৺䇝㓳
㓿傼ⲴᶕⓀDŽ
x ᵪಘᆖҐ㇇⌅Ⲵ䇮䇑䗷〻ѝवਜ਼䇨ཊ䘹ᤙˈवᤜ䘹ᤙ䇝㓳㓿傼Ⲵ㊫රǃ㾱ᆖ
ҐⲴⴞḷ࠭ᮠǃ䈕ⴞḷ࠭ᮠⲴ㺘⽪ᖒᔿǃԕ৺Ӿ䇝㓳ṧֻѝᆖҐⴞḷ࠭ᮠⲴ
㇇⌅DŽ
x ᆖҐⲴ䗷〻ণᩌ㍒Ⲵ䗷〻ˈᩌ㍒वਜ਼ਟ㜭ٷ䇮Ⲵオ䰤ˈ֯ᗇࡠⲴٷ䇮ᴰㅖਸ
ᐢᴹⲴ䇝㓳ṧ઼ֻަԆݸ傼Ⲵ㓖ᶏᡆ⸕䇶DŽᵜҖⲴབྷ䜘࠶ᇩത㔅⵰ᩌ㍒
ٷ䇮オ䰤˄ֻྲˈवਜ਼ᮠ٬࠭ᮠǃ⾎㓿㖁㔌ǃߣㆆṁǃㅖਧ㿴ࡉⲴオ䰤˅
Ⲵн਼ᆖҐᯩ⌅ˈ઼⨶䇪к䘉Ӌᩌ㍒ᯩ⌅൘ӰѸᶑԦлՊ᭦ᮋࡠᴰ֣ٷ䇮DŽ
ᴹᖸཊޣҾᵪಘᆖҐᴰᯠ⹄ウᡀ᷌ⲴՈ⿰䍴Ⓚਟ䰵䈫DŽⲴޣᵲᘇवᤜljᵪಘᆖҐNJ
˄Machine Learning˅ˈlj⾎㓿䇑㇇NJ˄Neural Computation˅ ˈlj⾎㓿㖁㔌NJ˄Neural Networks˅ ˈ
lj㖾ഭ㔏䇑ॿՊᵏ࠺NJ˄Journal of the American Statistical Association˅઼ljIEEE ⁑ᔿ䇶઼࡛
ᵪಘᲪ㜭ᆖᣕNJ˄IEEE Transactions on Pattern Analysis and Machine Intelligence˅DŽҏᴹབྷ䟿
Ⲵᒤ Պ㾶ⴆҶᵪಘᆖҐⲴњᯩ䶒ˈवᤜഭ䱵ᵪಘᆖҐՊ䇞(ICML)ˈ⾎㓿ؑ༴⨶㌫㔏
(NIPS)ˈ䇑㇇ᆖҐ⨶䇪Պ䇞(CCLT)ˈഭ䱵䚇Ր㇇⌅Պ䇞(ICGA)ˈഭ䱵⸕䇶ਁ⧠઼ᮠᦞ᥆ᧈ
Պ䇞(ICKDD)ˈ⅗⍢ᵪಘᆖҐՊ䇞(ECML)ㅹDŽ
Ґ仈
1.1 㔉ࠪйᵪಘᆖҐᯩ⌅䘲ਸⲴᓄ⭘ˈйн䘲ਸⲴᓄ⭘DŽ䘹ᵜҖᵚᨀ৺Ⲵᓄ⭘ˈ
ᒦሩ⇿њᓄ⭘ԕаਕ䈍ᶕ䇴ԧDŽ
1.2 䘹аӋᵜҖᵚᨀࡠⲴᆖҐԫ࣑DŽ⭘㤡᮷߉а⇥䈍䶎↓ᔿൠ࣐ԕ᧿䘠DŽቭਟ㜭㋮
⺞ൠ᧿䘠ࠪᆳⲴԫ࣑ǃᙗ㜭㺑䟿ḷ߶઼䇝㓳㓿傼DŽᴰਾˈ㔉ࠪ㾱ᆖҐⲴⴞḷ࠭ᮠ઼ᆳⲴ㺘⽪DŽ
䇘䇪䘉њԫ࣑䇮䇑ѝ㘳㲁Ⲵѫ㾱ᣈѝDŽ
1.3 䇱᰾ᵜㄐ᧿䘠ⲴLMSᵳᴤᯠ⌅ࡉ䟷⭘Ҷởᓖл䱽ᯩ⌅֯䈟ᐞᒣᯩᴰሿॆDŽ⺞࠷ൠ
䇢ˈۿ᮷ѝ䛓ṧᇊѹᯩᐞEDŽ❦ਾ䇑㇇EሩᵳwiⲴሬᮠˈަѝٷᇊ Vˆ (b) о᮷ѝᇊѹⲴаṧˈ
wE
ᱟањ㓯ᙗ࠭ᮠDŽởᓖл䱽ᱟ䙊䗷о ᡀ∄ֻൠᴤᯠ⇿њᵳ٬ᇎ⧠ⲴDŽᡰԕˈᗵ享䇱᰾
wwi
ሩҾᡰ䙷ࡠⲴ⇿ањ䇝㓳ṧֻˈLMS䇝㓳⌅ࡉ䜭ᱟ᤹䘉њ∄ֻᶕ᭩ਈᵳ٬DŽ
䇘䇪䘉Ӌㆆ⮕ⲴՈ࣓DŽྲ᷌䇝㓳ṧֻⲴᮠ䟿ᱟപᇊⲴˈଚањ᭸᷌ᴰྭ˛ٷᇊᙗ㜭㺑䟿
ḷ߶ᱟ൘ц⭼䭖ḷ䎋к䎒ỻᴰཊDŽ
1.5 ֯⭘㊫լҾ㾯⌻䐣ỻ䰞仈Ⲵ㇇⌅ˈᇎ⧠ањᴤㆰঅⲴtic-tac-toe⑨ᠿķDŽᢺᆖҐࡠⲴ
࠭ᮠ Vˆ 㺘⽪Ѫ㠚䘹Ⲵỻተ৲ᮠⲴ㓯ᙗ㓴ਸDŽ㾱䇝㓳䘉њ〻ᒿˈਟԕ䇙ᆳ઼ᆳⲴਖањᤧ䍍
৽༽∄䎋ˈਾ㘵֯⭘ᐕᔪ・Ⲵപᇊ䇴ՠ࠭ᮠDŽ⭘മ㺘㔈ࠪⲴ〻ᒿ㜌࡙ⲴⲮ࠶∄ˈሩᓄҾ
䇝㓳⅑ᮠDŽ
৲㘳᮷⥞
ķ
䈁⌘˖䈕⑨ᠿỻⴈѪ 3X3 ᯩṬˈৼᯩӔӂ㩭ᆀˈ俆ݸᇎ⧠㠚ᯩйᆀ䘎а㓯㘵㜌DŽ
ㅢ2ㄖ ᾸᘫᆜҖૂж㡢ࡦ⢯⇀ᓅ
从特殊的训练样例中归纳出一般函数是机器学习的中心问题。本章介绍概念学
习:给定某一类别的若干正例和反例,从中获得该类别的一般定义。概念学习也可
被看作一个搜索问题,它在预定义的假设空间中搜索假设,使其与训练样例有最佳
的拟合度。多数情形下,为了高效的搜索,可以利用假设空间中一种自然形成的结
构——即一般到特殊偏序结构。本章展示了几种概念学习算法,并讨论了这些算法
能收敛得到正确假设的条件。这里还分析了归纳学习的本质,以及任意程序能从训
练数据中泛化的理由。
2.1 ԁ㔃
䇨ཊᵪಘᆖҐ䰞仈⎹৺ࡠӾ⢩↺䇝㓳ṧֻѝᗇࡠа㡜ᾲᘥDŽ∄ྲӪԜнᯝᆖҐⲴаӋа
㡜ᾲᘥ઼㊫࡛वᤜ˖呏㊫ǃ⊭䖖ǃऔཻⲴᆖҐㅹDŽ⇿њᾲᘥਟ㻛ⴻањሩ䊑ᡆһԦ䳶ਸˈ
ᆳᱟӾᴤབྷⲴ䳶ਸѝ䘹ਆⲴᆀ䳶˄ྲӾࣘ⢙Ⲵ䳶ਸѝ䘹ਆ呏㊫˅ˈᡆ㘵ᱟ൘䘉њ䖳བྷ䳶ਸѝ
ᇊѹⲴᐳቄ࠭ᮠ˄ྲ൘ࣘ⢙䳶ਸѝᇊѹⲴ࠭ᮠˈᆳሩ呏㊫ӗ⭏ true ᒦሩަԆࣘ⢙ӗ⭏ false˅DŽ
ᵜㄐ㘳㲁Ⲵ䰞仈ᱟˈ㔉ᇊаṧֻ䳶ਸԕ৺⇿њṧֻᱟҾḀаᾲᘥⲴḷ⌘ˈᘾṧ㠚ࣘ
ᾲᘥᆖҐ˄concept learning˅ˈᡆ〠Ӿṧֻѝ䙬
᧘ᯝࠪ䈕ᾲᘥⲴа㡜ᇊѹDŽ䘉а䰞仈㻛〠Ѫᾲ
䘁ᐳቄ٬࠭ᮠDŽ
定义: ᾲᘥᆖҐᱟᤷӾᴹޣḀњᐳቄ࠭ᮠⲴ䗃ޕ䗃ࠪ䇝㓳ṧֻѝˈ᧘ᯝࠪ䈕ᐳቄ࠭
ᮠDŽ
2.2 жѠᾸᘫᆜҖԱࣗ
ѪҶ㢟ྭൠ⨶䀓ᾲᘥᆖҐˈ㘳㲁ањᾲᘥᆖҐⲴֻᆀˈⴞḷᾲᘥᱟ˖ĀAldo 䘋㹼≤к䘀
ࣘⲴᰕᆀāDŽ㺘 2-1 ᧿䘠Ҷа㌫ࡇᰕᆀⲴṧֻˈ⇿њṧֻ㺘⽪ѪᙗⲴ䳶ਸDŽᙗ EnjoySport
㺘⽪䘉аཙ Aldo ᱟҀҾ䘋㹼≤к䘀ࣘDŽ䘉њԫ࣑ⲴⴞⲴᱟˈสҾḀཙⲴᙗˈԕ亴⍻
ࠪ䈕ཙ EnjoySport Ⲵ٬DŽ
൘䘉ᛵߥлˈ䟷ਆӰѸṧⲴᖒᔿᶕ㺘⽪ٷ䇮˛ਟԕݸ㘳㲁ањ䖳ѪㆰঅⲴᖒᔿˈণ
ᇎֻⲴᙗ㓖ᶏⲴਸਆᔿDŽ൘䘉䟼ˈਟԔ⇿њٷ䇮Ѫ 6 њ㓖ᶏⲴੁ䟿ˈ䘉Ӌ㓖ᶏᤷᇊҶ
ᙗ SkyǃAirTempǃHumidityǃWindǃWater ઼ Forecast Ⲵ٬DŽ⇿њᙗਟਆ٬Ѫ˖
z ⭡Ā?ā㺘⽪ԫ٬
z ᰾⺞ᤷᇊⲴᙗ٬˄ྲ AirTemp=Warm˅
z ⭡Āā㺘⽪н᧕ਇԫօ٬
ᴰа㡜Ⲵٷ䇮ᱟ⇿аཙ䜭ᱟ↓ֻˈਟ㺘⽪Ѫ˖
<?, ?, ?, ?, ?, ?>
㘼ᴰ⢩↺Ⲵٷ䇮ণ⇿аཙ䜭ᱟ৽ֻˈ㺘⽪Ѫ˖
<, , , , , >
ᐢ⸕˖
ᇎֻ䳶 X˖ਟ㜭Ⲵᰕᆀˈ⇿њᰕᆀ⭡л䶒Ⲵᙗ᧿䘠˖
Sky˄ਟਆ٬Ѫ SunnyˈCloudy ઼ Rainy˅
AirTemp˄ਟਆ٬Ѫ Warm ઼ Cold˅
Humidity˄ਟਆ٬Ѫ Normal ઼ High˅
Wind˄ਟਆ٬Ѫ Strong ઼ Weak˅
Water˄ਟਆ٬Ѫ Warm ઼ Cool˅
Forecast˄ਟਆ٬Ѫ Same ઼ Change˅
ٷ䇮䳶 H˖⇿њٷ䇮᧿䘠Ѫ 6 њᙗ SkyˈAirTempˈHumidityˈWindˈWater ઼ Forecast Ⲵ٬㓖
ᶏⲴਸਆDŽ㓖ᶏਟԕѪĀ?ā˄㺘⽪᧕ਇԫ٬˅ˈĀā˄㺘⽪ᤂ㔍ᡰᴹ٬˅ˈᡆа⢩ᇊ٬DŽ
ⴞḷᾲᘥ c: EnjoySport: Xė{0, 1}
䇝㓳ṧֻ䳶 D˖ⴞḷ࠭ᮠⲴ↓઼ֻ৽ֻ˄㿱㺘 2-1˅
≲䀓˖
H ѝⲴаٷ䇮 hˈ֯ሩҾ X ѝԫ xˈh(x)=c(x)DŽ
2.2.1 ᵥ䈣ᇐѿ
൘ᵜҖѝˈᡁԜ֯⭘ԕлⲴᵟ䈝ᶕ䇘䇪ᾲᘥᆖҐ䰞仈DŽᾲᘥᇊѹ൘ањᇎ ᇎֻ˄instance˅
䳶ਸѻкˈ䘉њ䳶ਸ㺘⽪Ѫ XDŽ൘ᵜֻѝˈX ᱟᡰᴹਟ㜭Ⲵᰕᆀˈ⇿њᰕᆀ⭡ SkyǃAirTempǃ
HumidityǃWindǃWater ઼ Forecast ޝњᙗ㺘⽪DŽᖵᆖҐⲴᾲᘥᡆ࠭ᮠ〠Ѫⴞ
ⴞḷᾲᘥ (target
concept)ˈ䇠 cDŽа㡜ᶕ䈤ˈc ਟԕᱟᇊѹ൘ᇎֻ X кⲴԫᐳቄ࠭ᮠˈণ c:Xė{0, 1}DŽ൘
䘉њֻᆀ䟼ˈⴞḷᾲᘥሩᓄҾᙗ EnjoySport Ⲵ٬ˈᖃ EnjoySport=Yes ᰦ c(x)=1ˈᖃ
EnjoySport=No ᰦ c(x)=0DŽ
൘ᆖҐⴞḷᾲᘥᰦˈᗵ享ᨀа྇䇝 䇝㓳ṧֻ˄training examples˅ˈ⇿њṧֻѪ X ѝⲴа
њᇎֻ x ԕ৺ᆳⲴⴞḷᾲᘥ٬ c(x)˄ྲ㺘 2-1 ѝⲴ䇝㓳ṧֻ˅DŽሩҾ c(x)=1 Ⲵᇎֻ㻛〠Ѫ↓ ↓
ֻ(positive example)ˈᡆ〠ѪⴞḷᾲᘥⲴᡀઈDŽሩҾ c(x)=0 ⲴᇎֻѪ৽ ৽ֻ(negative example)ˈ
ᡆ〠Ѫ䶎ⴞḷᾲᘥᡀઈDŽ㓿ᑨਟԕ⭘ᒿ<ڦx,c(x)>ᶕ᧿䘠䇝㓳ṧֻˈ㺘⽪ަवਜ਼Ҷᇎֻ x ઼
ⴞḷᾲᘥ٬ c(x)DŽㅖਧ D ⭘ᶕ㺘⽪䇝㓳ṧֻⲴ䳶ਸDŽ
2.2.2 ᖈ㓩ᆜҖٽ䇴
ᖂ㓣ᆖҐٷ䇮 ԫаٷ䇮ྲ᷌൘䏣ཏབྷⲴ䇝㓳ṧֻ䳶ѝᖸྭൠ䙬䘁ⴞḷ࠭ᮠˈᆳҏ㜭൘
ᵚ㿱ᇎֻѝᖸྭൠ䙬䘁ⴞḷ࠭ᮠDŽ
2.3 ֒Ѱᩒ㍘ⲺᾸᘫᆜҖ
ᾲᘥᆖҐਟԕⴻᱟањᩌ㍒Ⲵ䗷〻ˈ㤳തᱟٷ䇮Ⲵ㺘⽪ᡰ䳀ਜ਼ᇊѹⲴᮤњオ䰤DŽᩌ㍒
ⲴⴞḷᱟѪҶራ㜭ᴰྭൠᤏਸ䇝㓳ṧֻⲴٷ䇮DŽᗵ享⌘ࡠˈᖃٷ䇮Ⲵ㺘⽪ᖒᔿ䘹ᇊਾˈ
䛓Ѹҏቡ䳀ਜ਼ൠѪᆖҐ㇇⌅⺞ᇊҶᡰᴹٷ䇮Ⲵオ䰤DŽ䘉Ӌٷ䇮ᱟᆖҐ〻ᒿᡰ㜭㺘⽪Ⲵˈҏᱟ
ᆳ㜭ཏᆖҐⲴDŽ㘳㲁൘ EnjoySport ᆖҐԫ࣑ѝⲴᇎֻ䳶ਸ X ઼ٷ䇮䳶ਸ HDŽྲ᷌ᙗ Sky
ᴹ 3 ਟ㜭Ⲵ٬ˈ㘼 AirTempǃHumidityǃWindǃWater ઼ Forecast 䜭ਚᴹєਟ㜭٬ˈࡉ
ᇎֻオ䰤 X वਜ਼Ҷ 3×2×2×2×2×2=96 н਼ⲴᇎֻDŽ㊫լⲴ䇑㇇ਟᗇˈ൘ٷ䇮オ䰤 H ѝᴹ
䈝⌅н਼(syntactically distinct)Ⲵٷ䇮DŽ❦㘼ˈ⌘ࡠवਜ਼ᴹㅖਧⲴ
5×4×4×4×4×4=5120 䈝
ٷ䇮ԓ㺘オᇎֻ䳶ਸˈণᆳԜሶ⇿њᇎֻ䜭࠶㊫Ѫ৽ֻDŽഐ↔ˈ䈝ѹн਼(semantically distinct)
Ⲵٷ䇮ਚᴹ 1+4×3×3×3×3×3=973 њDŽ䘉䟼Ⲵ EnjoySport ֻᆀᱟањ䶎ᑨㆰঅⲴᆖҐԫ࣑ˈ
ᆳⲴٷ䇮オ䰤ሩ䖳ሿфᴹ䲀DŽཊᮠᇎ䱵ⲴᆖҐԫ࣑वਜ਼ᴤབྷⲴǃᴹᰦᱟᰐ䲀Ⲵٷ䇮オ䰤DŽ
ྲ᷌ᢺᆖҐⴻᱟањᩌ㍒䰞仈ˈ䛓Ѹᖸ㠚❦ˈሩᆖҐ㇇⌅Ⲵ⹄ウ䴰㾱㘳ḕٷ䇮オ䰤ᩌ
㍒Ⲵн਼ㆆ⮕DŽ⢩࡛ᕅ䎧ᡁԜޤ䏓Ⲵ㇇⌅ᓄ㜭ᴹ᭸ൠᩌ㍒䶎ᑨབྷⲴᡆᰐ䲀Ⲵٷ䇮オ䰤ˈԕ
ࡠᴰ֣ᤏਸ䇝㓳ᮠᦞⲴٷ䇮DŽ
2.3.1 ٽ䇴Ⲻж㡢ࡦ⢯⇀ᓅ
䇨ཊᾲᘥᆖҐ㇇⌅ѝˈᩌ㍒ٷ䇮オ䰤Ⲵᯩ⌅䎆Ҿަѝаᖸᴹ⭘Ⲵ㔃ᶴ˖ٷ䇮Ⲵа㡜
ࡠ⢩↺ᒿޣ㌫DŽ࡙⭘ٷ䇮オ䰤Ⲵ䘉㠚❦㔃ᶴˈᡁԜਟԕ൘ᰐ䲀Ⲵٷ䇮オ䰤ѝ䘋㹼ᖫᓅⲴᩌ
㍒ˈ㘼н䴰㾱᰾⺞ൠࡇѮᡰᴹⲴٷ䇮DŽѪ䈤᰾а㡜ࡠ⢩↺ᒿˈ㘳㲁ԕлєњٷ䇮˖
h1=<Sunny, ?, ?, Strong, ?, ?>
h2=<Sunny, ?, ?, ?, ?, ?>
ଚӋᇎֻਟ㻛h1઼h2ࡂ࠶Ѫ↓ֻ˛⭡Ҿh2वਜ਼Ⲵᇎֻ㓖ᶏ䖳ቁˈᆳࡂ࠶ࠪⲴ↓ֻҏ䖳ཊDŽ
ᇎ䱵кˈԫօ㻛h1ࡂ࠶Ѫ↓ֻⲴᇎֻ䜭Պ㻛h2ࡂ࠶Ѫ↓ֻˈഐ↔ˈᡁԜ䈤h2∄h1ᴤа㡜DŽ
ⴤ㿲кⲴĀ∄ĂĂᴤа㡜ā䘉ޣ㌫ਟԕྲл㋮⺞ᇊѹDŽ俆ˈݸሩXѝԫᇎֻx઼Hѝ
ԫ ٷ䇮 h ˈ ᡁ Ԝ 䈤 x ┑ 䏣 h ᖃ ф ӵ ᖃ h(x)=1 DŽ ⧠ ൘ ԕ ᇎ ֻ 䳶 ਸ Ⲵ ᖒ ᔿ ᇊ ѹ а њ
more-general-than-or-equal-toⲴޣ㌫˖㔉ᇊٷ䇮hj઼hkˈhj more-general-than-or-equal-to hkˈ
ᖃфӵᖃԫањ┑䏣hkⲴᇎ਼ֻᰦҏ┑䏣hjDŽ
(xęX)[(hk(x)=1)ė(hj(x)=1)]
ᴹ ᗵ 㾱 㘳 㲁 а ٷ䇮 ѕ Ṭ ൠ ∄ ਖ а ٷ䇮 ᴤ а 㡜 Ⲵ ᛵ ᖒ DŽ ഐ ↔ ˈ ᡁ Ԝ 䈤 hj ѕ Ṭ Ⲵ
more-general-than hk˄߉hj˚ghk˅ˈᖃфӵᖃ(hjıghk)ġ(hkıghj)DŽᴰਾˈ䘈ਟԕᇊѹ䘶ੁ
Ⲵޣ㌫Ā∄ĂĂᴤ⢩↺āѪhj more-specific-than hkˈᖃhk more-general-than hjDŽ
插图——原书页码:25
Instances: ᇎֻ䳶
Hypotheses˖ٷ䇮䳶
Specific˖⢩↺
General˖а㡜
ıgޣ㌫ᖸ䟽㾱ˈഐѪᆳ൘ٷ䇮オ䰤Hкሩԫ
ԫᾲᘥᆖҐ䰞仈ᨀҶаᴹ⭘Ⲵ㔃ᶴDŽ
ਾ䶒Ⲵㄐ㢲ሶ䱀䘠ᾲᘥᆖҐ㇇⌅ྲօ࡙⭘䘉аٿᒿ㔃ᶴˈԕᴹ᭸ൠᩌ㍒ٷ䇮オ䰤DŽ
2.4 Find-Sφሱᢴᶷཝ⢯⇀ٽ䇴
㺘 2-3 Find-S ㇇⌅
1. ሶ h ࡍॆѪ H ѝᴰ⢩↺ٷ䇮
2. ሩ⇿њ↓ֻ x
ሩhⲴ⇿њᙗ㓖ᶏai
ྲ᷌ x┑䏣ai
䛓Ѹ нڊԫօһ
ࡉ ሶhѝaiᴯᦒѪx┑䏣Ⲵ㍗䛫Ⲵᴤа㡜㓖ᶏ
3. 䗃ࠪٷ䇮 h
hĕ<, , , , , >
䘉њ h ӽᰗཚ⢩↺Ҷˈᆳᢺ䲔ҶㅜањṧֻԕཆⲴᡰᴹᇎֻ䜭ࡂ࠶Ѫ৽ֻDŽла↕ˈㅜ
2 њ䇝㓳ṧֻ˄ӽ❦Ѫ↓ֻ˅䘛֯䈕㇇⌅䘋а↕ሶ h ⌋ॆDŽ䘉⅑֯⭘Ā?āԓᴯ h ѝн㜭┑
䏣ᯠṧֻⲴᙗ٬DŽѻਾⲴٷ䇮ਈѪ˖
插图——原书页码:27
Instances: ᇎֻ䳶
Hypotheses˖ٷ䇮䳶
Specific˖⢩↺
General˖а㡜
2.5 ශグ䰪ૂُ䘿⎾䲚㇍⌋
ᵜ㢲᧿䘠ⲴᱟᾲᘥᆖҐⲴਖа䙄ᖴণى ى䘹⎸䲔㇇⌅˄Candidate-Elimination˅DŽᆳ㜭䀓
ߣ Find-S ѝⲴ㤕ᒢн䏣ѻ༴DŽFind-S 䗃ࠪⲴٷ䇮ਚᱟ H ѝ㜭ཏᤏਸ䇝㓳ṧֻⲴཊњٷ䇮ѝ
ⲴањDŽ㘼൘ى䘹⎸䲔㇇⌅ѝˈ䗃ࠪⲴᱟо䇝㓳ṧֻа㠤Ⲵᡰᴹٷ䇮Ⲵ䳶ਸDŽԔӪཷൠᱟˈ
ى䘹⎸䲔㇇⌅൘᧿䘠䘉а䳶ਸᰦн䴰㾱᰾⺞ࡇѮަᡰᴹᡀઈDŽ䘉ҏᖂ࣏Ҿ more-general-than
ٿᒿ㔃ᶴDŽ൘䘉䟼䴰㾱㔤ᣔања㠤ٷ䇮䳶ਸⲴㆰ⌱㺘⽪ˈ❦ਾ൘䙷ࡠᯠⲴ䇝㓳ṧֻᰦ䙀↕
㋮ॆ䘉а㺘⽪DŽ
2.5.1 㺞⽰
ى䘹⎸䲔㇇⌅ራᡰᴹо䇝㓳ṧֻа㠤Ⲵٷ䇮DŽѪ㋮⺞᧿䘠䘉а㇇⌅ˈ䘉䟼ݸᕅޕаӋ
สᵜⲴᇊѹDŽ俆ˈݸᡁԜ〠ањٷ䇮ᱟо䇝㓳ṧֻа
а㠤Ⲵ(consistent)ˈᖃᆳ㜭↓⺞࠶㊫䘉Ӌ
ṧֻDŽ
Consistent(h,D)į(<x,c(x)> ę D) h(x)=c(x)
⌘䘉䟼ᇊѹⲴа а㠤оࡽ䶒ᇊѹⲴ┑
┑䏣ᴹޣ䭞Ⲵн਼DŽањṧֻ x ൘ h(x)=1 ᰦ〠Ѫ┑
┑
䏣ٷ䇮 hˈн䇪 x ᱟⴞḷᾲᘥⲴ↓ֻ䘈ᱟ৽ֻDŽ❦㘼ˈ䘉аṧֻᱟо h а㠤оⴞḷᾲᘥᴹ
ˈޣণᱟ h(x)=c(x)DŽ
ى䘹⎸䲔㇇⌅㜭ཏ㺘⽪о䇝㓳ṧֻа㠤Ⲵᡰᴹٷ䇮DŽ൘ٷ䇮オ䰤ѝⲴ䘉аᆀ䳶㻛〠Ѫޣ
ਈරオ䰤(version space)ˈഐѪᆳवਜ਼ⲴᱟⴞḷᾲᘥⲴᡰᴹਸ
Ҿٷ䇮オ䰤 H ઼䇝㓳ṧֻ D Ⲵਈ
⨶ⲴਈරDŽ
ਈරオ䰤(version space)ˈḷ䇠ѪVSH,DˈᱟH
定义: ޣҾٷ䇮オ䰤H઼䇝㓳ṧֻ䳶DⲴਈ
ѝо䇝㓳ṧֻDа㠤Ⲵᡰᴹٷ䇮ᶴᡀⲴᆀ䳶DŽ
VSH,Dį{hęH|Consistent(h,D)}
2.5.2 ࡍ㺞⎾䲚㇍⌋
ᱮ❦ˈ㺘⽪ਈරオ䰤Ⲵаᯩ⌅ᱟࡇࠪަᡰᴹᡀઈDŽ䘉ṧਟӗ⭏ањㆰঅⲴ㇇⌅ˈ〠Ѫ
ࡇ㺘ਾ⎸䲔˄List-Then-Eliminate˅㇇⌅DŽަᇊѹ㿱㺘 2-4DŽ
㺘 2-4 ࡇ㺘ਾ⎸䲔㇇⌅
ࡇ㺘ਾ⎸䲔㇇⌅
1. ਈරオ䰤 VersionSpaceĕवਜ਼ H ѝᡰᴹٷ䇮Ⲵࡇ㺘
2. ሩ⇿њ䇝㓳ṧֻ<x, c(x)>
Ӿਈරオ䰤ѝ〫䲔ᡰᴹ h(x)Įc(x)Ⲵٷ䇮 h
3. 䗃ࠪ VersionSpace ѝⲴٷ䇮ࡇ㺘
ࡇ㺘ਾ⎸䲔㇇⌅俆ݸሶਈරオ䰤ࡍॆѪवਜ਼ H ѝᡰᴹٷ䇮ˈ❦ਾӾѝ৫䲔оԫа䇝
㓳ṧֻна㠤Ⲵٷ䇮DŽवਜ਼ى䘹ٷ䇮Ⲵਈරオ䰤䲿⵰㿲ሏࡠ䎺ᶕ䎺ཊⲴṧֻ㘼㕙߿ˈⴤࡠਚ
࢙ањ˄⨶ᜣᛵߥл˅оᡰᴹṧֻа㠤Ⲵٷ䇮DŽ䘉ਟ㜭ቡᱟᡰ㾱ⲴⴞḷᾲᘥDŽྲ᷌⋑ᴹݵ䏣
Ⲵᮠᦞ֯ਈරオ䰤㕙߿ࡠਚᴹањٷ䇮ˈ䛓Ѹ䈕㇇⌅ሶ䗃ࠪањ䳶ਸˈ䘉њ䳶ਸѝᡰᴹⲴٷ
䇮о䇝㓳ṧֻ䜭а㠤DŽ
ࡉкˈਚ㾱ٷ䇮オ䰤ᱟᴹ䲀Ⲵˈቡਟ֯⭘ࡇ㺘ਾ⎸䲔㇇⌅DŽᆳާᴹᖸཊՈ⛩ˈྲ㜭؍
䇱ᗇࡠᡰᴹо䇝㓳ᮠᦞа㠤Ⲵٷ䇮DŽնᱟˈ䘉а㇇⌅䶎ᑨ✖⩀ൠࡇࠪҶ H ѝᡰᴹٷ䇮ˈ䘉
ሩҾབྷཊᮠᇎ䱵Ⲵٷ䇮オ䰤ᱟн⧠ᇎⲴ㾱≲DŽ
2.5.3 ශグ䰪Ⲻᴪㆶ᱄㺞⽰
ى䘹⎸䲔㇇⌅ок䶒Ⲵࡇ㺘ਾ⎸䲔㇇⌅䚥ᗚ਼ṧⲴࡉDŽ❦㘼ˈᆳ֯⭘аᴤㆰ᰾Ⲵਈ
රオ䰤Ⲵ㺘⽪⌅DŽ൘↔ˈਈරオ䰤㻛㺘⽪ѪᆳⲴᴰа㡜Ⲵ઼ᴰ⢩↺ⲴᡀઈDŽ䘉ӋᡀઈᖒᡀҶ
а㡜઼⢩↺䗩⭼Ⲵ䳶ਸˈ䘉Ӌ䗩⭼൘ᮤњٿᒿ㔃ᶴѝࡂ࠶ࠪਈරオ䰤DŽ
插图——原书页码:31
മ 2-3 ਈරオ䰤৺ަа㡜઼⢩↺䗩⭼䳶ਸ
ਈරオ䰤ѝवਜ਼ҶᡰᴹⲴ 6 њٷ䇮ˈնਟԕㆰঅൠ⭘ S ઼ G ᶕ㺘⽪DŽ㇝ཤ㺘⽪ᇎֻ䰤Ⲵ
more-general-than ޣ㌫DŽ䘉њਈරオ䰤ሩᓄҾ㺘 2-1 ѝ᧿䘠Ⲵ EnjoySport ᾲᘥᆖҐ䰞仈৺ަ䇝㓳ṧ
ֻDŽ
ਟԕⴤ㿲ൠⴻࠪˈ֯⭘ᴰа㡜઼ᴰ⢩↺䳶ਸ㺘⽪ਈරオ䰤Ⲵ⌅ᱟਸ⨶ⲴDŽл䶒ᡁԜ㋮
⺞ൠᇊѹ S ઼ G 䘉єњ䗩⭼䳶ਸˈᒦф䇱᰾ᆳԜ⺞ᇎԓ㺘Ҷਈරオ䰤DŽ
䇱᰾˖Ѫ䇱᰾䈕ᇊ⨶ਚ䴰䇱᰾˖(1)⇿ањ┑䏣кᔿਣ䗩Ⲵh䜭൘VSH,Dѝˈ(2) VSH,DⲴ⇿њᡀઈ䜭
┑䏣ㅹᔿਣ䗩DŽѪ䇱᰾˄1˅ˈԔgѪGѝԫањᡀઈˈsѪSѝԫаᡀઈˈhѪHⲴԫаᡀઈ㘼фgıgh
ıgsDŽ⭡SⲴᇊѹˈsᗵ享㻛DѝᡰᴹⲴ↓ֻ┑䏣DŽഐѪhıg sˈ hҏ㻛Dѝᡰᴹ↓ֻ┑䏣DŽլൠˈ⭡G
Ⲵᇊѹˈgᗵ享н㻛Dѝԫа৽ֻ┑䏣ˈф⭡Ҿ gıg hˈhҏн㻛Dѝᡰᴹ৽ֻ┑䏣DŽ⭡Ҿ h㻛Dѝᡰᴹ
↓ֻ┑䏣фн㻛ަѝᡰᴹ৽ֻ┑䏣ˈഐ↔hоDа㠤ˈഐ↔hᱟVSH,DⲴᡀઈDŽ䘉䇱᰾Ҷ↕僔˄1˅DŽ˄2˅
Ⲵ䇘䇪〽ᗞᴹӋ༽ᵲˈਟԕ֯⭘৽䇱⌅ˈٷᇊVSH,DѝḀаhн┑䏣ㅹᔿਣ䗩ˈ䛓Ѹሶӗ⭏⸋˄㿱Ґ
仈 2.6˅DŽ
2.5.4 ُ䘿⎾䲚ᆜҖ㇍⌋
ى䘹⎸䲔㇇⌅䇑㇇ࠪⲴਈරオ䰤ˈवਜ਼ H ѝᡰᴹо䇝㓳ṧֻⲴ㿲ሏࡠⲴᒿࡇа㠤Ⲵٷ
䇮DŽᔰˈਈරオ䰤㻛ࡍॆѪ H ѝᡰᴹٷ䇮Ⲵ䳶ਸDŽণሶ G 䗩⭼䳶ਸࡍॆѪ H ѝᴰа
㡜Ⲵٷ䇮˖
G0ĕ{<?, ?, ?, ?, ?, ?>}
ᒦሶ S 䗩⭼䳶ਸࡍॆѪᴰ⢩↺ٷ䇮˖
S0ĕ{<, , , , , >}
䘉єњ䗩⭼䳶ਸवਜ਼Ҷᮤњٷ䇮オ䰤DŽഐѪHѝᡰᴹٷ䇮䜭∄S0ᴤа㡜ˈф∄G0ᴤ⢩↺DŽ
㇇⌅൘༴⨶⇿њ䇝㓳ṧֻᰦˈS઼G䗩⭼䳶ਸ࠶࡛㻛⌋ॆ઼⢩ॆˈӾਈරオ䰤ѝ䙀↕⎸৫о
ṧֻна㠤Ⲵٷ䇮DŽ൘ᡰᴹ䇝㓳ṧֻ༴⨶ᆼਾˈᗇࡠⲴਈරオ䰤ቡवਜ਼Ҷᡰᴹоṧֻа㠤Ⲵ
ٷ䇮ˈ㘼фਚवਜ਼䘉ṧⲴٷ䇮DŽ䘉а㇇⌅൘㺘 2-5 ѝ᧿䘠˖
㺘 2-5 ֯⭘ਈරオ䰤Ⲵى䘹⎸䲔㇇⌅
⌘↓઼ֻ৽ֻᱟᘾṧ਼ᰦᖡ૽ S ઼ G ⲴDŽ
ሶ G 䳶ਸࡍॆѪ H ѝᶱབྷа㡜ٷ䇮
ሶ S 䳶ਸࡍॆѪ H ѝᶱབྷ⢩↺ٷ䇮
ሩ⇿њ䇝㓳ṧֻ dˈ䘋㹼ԕл˖
ྲ᷌ d ᱟа↓ֻ
Ӿ G ѝ〫৫ᡰᴹо d на㠤Ⲵٷ䇮
ሩ S ѝ⇿њо d на㠤Ⲵٷ䇮 s
Ӿ S ѝ〫৫ s
ᢺ s ⲴᡰᴹⲴᶱሿ⌋ॆᔿ h ࣐ ࡠޕS ѝˈަѝ h ┑䏣
h о d а㠤ˈ㘼ф G ⲴḀњᡀઈ∄ h ᴤа㡜
Ӿ S ѝ〫৫ᡰᴹ䘉ṧⲴٷ䇮˖ᆳ∄ S ѝਖаٷ䇮ᴤа㡜
ྲ᷌ d ᱟањ৽ֻ
Ӿ S ѝ〫৫ᡰᴹо d на㠤Ⲵٷ䇮
ሩ G ѝ⇿њо d на㠤Ⲵٷ䇮 g
Ӿ G ѝ〫৫ g
ᢺ g ⲴᡰᴹⲴᶱሿ⢩ॆᔿ h ࣐ ࡠޕG ѝˈަѝ h ┑䏣
h о d а㠤ˈ㘼ф S ⲴḀњᡀઈ∄ h ᴤ⢩↺
Ӿ G ѝ〫৫ᡰᴹ䘉ṧⲴٷ䇮˖ᆳ∄ G ѝਖаٷ䇮ᴤ⢩↺
⌘㇇⌅ѝⲴˈवᤜሩ㔉ᇊٷ䇮Ⲵᶱሿ⌋ॆᔿ઼ᶱሿ⢩ॆᔿⲴ䇑㇇ˈᒦ⺞ᇊ䛓Ӌ䶎
ᶱሿ઼䶎ᶱབྷⲴٷ䇮DŽާփⲴᇎ⧠ᖃ❦䎆Ҿᇎ઼ֻٷ䇮Ⲵ㺘⽪ᯩᔿDŽ❦㘼ˈਚ㾱䘉Ӌ
㻛㢟ྭൠᇊѹҶˈ䈕㇇⌅ቡਟᓄ⭘ҾԫᾲᘥᆖҐ઼ԫٷ䇮オ䰤DŽ൘ԕлሶᇎ䱵╄⽪㇇⌅
Ⲵ䘀㹼↕僔ˈӾѝਟԕⴻࡠ൘ EnjoySport 䘉њֻᆀѝˈ䘉Ӌᱟᘾṧᇎ⧠ⲴDŽ
2.5.5 ㇍⌋Ⲻ⽰ׁ
插图——原书页码:34
മ 2-4 ى䘹⎸䲔㇇⌅↕僔 1
S0઼G0ѪᴰࡍⲴ䗩⭼䳶ਸˈ࠶࡛ሩᓄᴰ⢩↺઼ᴰа㡜ٷ䇮DŽ䇝㓳ṧֻ 1 ઼ 2 ֯ᗇS䗩⭼ਈᗇᴤа㡜ˈ
ྲFind-S㇇⌅ѝаṧDŽ䘉ӋṧֻሩG䗩⭼⋑ᴹᖡ૽DŽ
ᖃㅜањ䇝㓳ṧֻࠪ⧠ᰦ˄䘉䟼Ѫа↓ֻ˅ˈى䘹⎸䲔㇇⌅ỰḕS䗩⭼ˈᒦਁ⧠ᆳ䗷Ҿ⢩
↺ҶüüഐѪᆳн㜭㾶ⴆ䈕↓ֻDŽ䘉а䗩⭼ቡ㻛؞᭩Ѫ㍗䛫ᴤа㡜Ⲵٷ䇮ˈԕ㾶ⴆᯠⲴṧֻDŽ
؞᭩ਾⲴ䗩⭼൘മ 2-4 ѝᱮ⽪ѪS1DŽG䗩⭼н䴰㾱؞᭩ˈഐѪG0㜭ཏ↓⺞ൠ㾶ⴆ䈕ṧֻDŽᖃ
༴⨶ㅜҼњ䇝㓳ṧֻᰦ˄ҏᱟˉ↓ֻ˅ˈ਼ṧൠˈ䴰㾱ሶS䘋а↕⌋ॆࡠS2 ˈGӽᰗнਈ
˄G2=G1=G0˅DŽ⌘ሩཤєњ↓ֻⲴ༴⨶䶎ᑨ㊫լҾFind-S㇇⌅DŽ
൘ཤє↕Ⲵ㇇⌅ѝˈ↓ֻ֯ᗇਈරオ䰤ⲴS䗩⭼䙀⑀⌋ॆDŽ㘼৽ֻᢞ╄Ⲵ䀂㢢ᚠྭ৽ˈ
֯ᗇG䗩⭼䙀⑀⢩ॆDŽ㘳㲁ㅜйњ䇝㓳ṧֻˈྲമ 2-5 ᡰ⽪DŽ䘉а৽ֻᱮ⽪ˈG䗩⭼䗷Ҿа
㡜ҶDŽҏቡᱟ䈤ˈGѝⲴٷ䇮䭉䈟ൠሶ䈕ֻࡔᇊѪ↓ֻҶDŽഐ↔G䗩⭼ѝⲴٷ䇮ᗵ享㻛⢩ॆˈ
֯ᆳ㜭ሩᯠⲴ৽ֻ↓⺞࠶㊫DŽྲമ 2-5 ᡰ⽪ˈ䘉䟼ᴹࠐਟ䘹Ⲵᶱሿᴤ⢩↺Ⲵٷ䇮DŽ䘉Ӌޘ
䜭ᡀѪᯠⲴG3䗩⭼䳶ਸⲴᡀઈDŽ
插图——原书页码:35
മ 2-5 ى䘹⎸䲔㇇⌅↕僔 2
ṧֻ 3 ᱟа৽ֻˈᆳᢺG2䗩⭼⢩ॆѪG3DŽ⌘൘G3ѝᴹཊњਟ䘹Ⲵᶱབྷа㡜ٷ䇮DŽ
插图——原书页码:36 к
മ 2-6 ى䘹⎸䲔㇇⌅↕僔 3
↓ֻ֯S䗩⭼ᴤа㡜ˈӾS3ਈѪS4DŽG3Ⲵањᡀઈҏᗵ享㻛ࡐ䲔ˈഐѪᆳн∄S4䗩⭼ᴤа㡜DŽ
൘༴⨶ᆼ䘉 4 њṧֻਾˈ䗩⭼䳶ਸS4઼G4ࡂ࠶ࠪⲴਈරオ䰤वਜ਼Ҷоṧֻа㠤Ⲵᡰᴹٷ
䇮Ⲵ䳶ਸDŽᮤњਈරオ䰤ˈवਜ਼䛓Ӌ⭡S4઼G4⭼ᇊⲴٷ䇮䜭൘മ 2-7 ѝ⽪ࠪDŽ䘉аਈරオ䰤
н䎆Ҿ䇝㓳ṧᵜࠪ⧠Ⲵ⅑ᒿ˄ഐѪᴰ㓸ᆳवਜ਼Ҷо䇝㓳ṧֻ䳶а㠤Ⲵᡰᴹٷ䇮˅DŽྲ᷌ᨀ
ᴤཊⲴ䇝㓳ᮠᦞˈS઼G䗩⭼ሶ㔗㔝অ䈳〫ࣘᒦӂ䶐䘁ˈࡂ࠶ࠪ䎺ᶕ䎺ሿⲴਈරオ䰤ᶕDŽ
插图——原书页码:36 л
2.6 ީӄශグ䰪ૂُ䘿⎾䲚Ⲻ䈪᱄
2.6.1 ُ䘿⎾䲚㇍⌋ᱥੜՐ᭬ᮑࡦ↙⺤Ⲻٽ䇴
⭡ى䘹⎸䲔㇇⌅ᗇࡠⲴਈරオ䰤㜭ཏ᭦ᮋࡠ᧿䘠ⴞḷᾲᘥⲴٷ䇮ⲴᶑԦᱟ˄1˅൘䇝㓳
ṧֻѝ⋑ᴹ䭉䈟˄2˅൘ H ѝ⺞ᇎवਜ਼᧿䘠ⴞḷᾲᘥⲴ↓⺞ٷ䇮DŽᇎ䱵кˈྲ᷌䙷ࡠᯠⲴ䇝
㓳ṧֻˈਟԕⴁ⍻ਈරオ䰤ԕࡔᇊަоⵏ↓Ⲵⴞḷᾲᘥѻ䰤ᱟ䘈ᴹ࠶↗ˈԕ৺Ѫ㋮⺞⺞ᇊ
ⴞḷᾲᘥ䘈䴰㾱ཊቁ䇝㓳ṧֻDŽᖃ S ઼ G 䗩⭼䳶ਸ᭦ᮋࡠঅњⲴਟ⺞ᇊⲴٷ䇮ᰦˈⴞḷᾲ
ᘥⵏ↓㧧ᗇDŽ
ྲ᷌䇝㓳ᮠᦞѝवਜ਼䭉䈟Պᘾṧ˛∄ྲˈԕкֻᆀѝㅜҼњṧֻ㻛䭉䈟ൠḷ⽪Ѫа৽
ֻDŽ䘉ᛵߥлˈᖸнᒨˈ㇇⌅㛟ᇊՊӾਈරオ䰤ѝࡐ䲔↓⺞ⲴⴞḷᾲᘥDŽഐѪᆳՊࡐ䲔ᡰ
ᴹоṧֻна㠤Ⲵٷ䇮ˈᡰԕ൘䙷ࡠ䘉а䭉䈟Ⲵ৽ֻᰦˈ㇇⌅ሶӾਈරオ䰤ѝ〫৫↓⺞Ⲵⴞ
ḷᾲᘥDŽᖃ❦ˈྲ᷌㔉ᇊ䏣ཏⲴ䇝㓳ᮠᦞˈᴰ㓸ˈᡁԜՊਁ⧠ S ઼ G 䗩⭼᭦ᮋᗇࡠањオ
Ⲵਈරオ䰤ˈӾ㘼ᗇ⸕䇝㓳ᮠᦞᴹ䈟DŽオⲴਈරオ䰤㺘⽪ H ѝ⋑
⋑ᴹٷ䇮㜭ཏоṧֻа㠤DŽ
լⲴᛵᖒՊࠪ⧠൘ਖа⧟ຳѝ˖ᖃ䇝㓳ṧֻ↓⺞ˈնⴞḷᾲᘥн㜭⭡ٷ䇮㺘⽪ᯩᔿᡰ᧿
䘠˄∄ྲⴞḷᾲᘥᱟḀࠐњᙗ⢩ᖱⲴ᷀ਆˈ㘼ٷ䇮オ䰤ਚ᭟ᤱਸਆⲴᖒᔿ˅DŽԕਾᡁԜሶ
䈖㓶㘳㲁䘉Ӌਟ㜭ᙗDŽⴞࡽˈᡁԜਚ㘳㲁ṧֻᮠᦞᱟ↓⺞Ⲵᒦфⴞḷᾲᘥ⺞ᇎ൘ٷ䇮オ䰤ѝDŽ
2.6.2 сж↛䴶㾷ӶѾṭⲺ䇣㓹ṭׁ
ࡠ䘉䟼ᡁԜ䜭ٷᇊ䇝㓳ṧֻ⭡Ḁњཆ䜘Ⲵᯭᮉ㘵ᨀDŽٷᜣᆖҐಘਟԕѫᇠᇎ傼䘋〻ˈ
ла↕ᆳ㾱㠚ᐡ䘹ᤙањᇎֻˈ❦ਾӾཆ⭼˄㠚❦⭼ᡆањᯭᮉ㘵˅㧧ᗇ䈕ᇎֻⲴ↓⺞࠶㊫
㔃᷌DŽ䘉а൪Ჟਟ࠶ѪєᛵߥˈаᱟᆖҐಘ൘㠚❦⭼ѝ䘋㹼ᇎ傼˄ྲ䙐аᓗᯠẕ❦ਾ䇙
㠚❦⭼ߣᇊަᱟ⢒പ˅ˈᡆ൘ањᯭᮉ㘵ᤷሬлᆖҐ˄ᨀࠪаᓗᯠẕằⲴ䇮䇑ˈ❦ਾ䇙ᯭ
ᮉ㘵ᶕࡔᯝᆳᱟ⢒പ˅ ḕ䈒˄query˅ᶕԓ㺘ᆖҐಘᔪ・Ⲵ䘉њᇎֻˈ❦ਾ⭡
DŽᡁԜ䘉䟼⭘ḕ
ཆ⭼ᶕሩᆳ࠶㊫DŽ
а㡜ᶕ䈤ˈᾲᘥᆖҐⲴᴰՈḕ䈒ㆆ⮕ˈᱟӗ⭏ᇎֻԕ┑䏣ᖃࡽਈරオ䰤ѝབྷ㠤ॺᮠⲴٷ
䇮DŽྲ↔ˈਈරオ䰤Ⲵབྷሿਟԕ൘䙷ࡠ⇿њᯠṧֻᰦ߿ॺˈ↓⺞Ⲵⴞḷᾲᘥቡਟ൘ªlog2|VS|º
⅑ᇎ傼ਾᗇࡠDŽ䘉ᴹ⛩䊑⧙Ā20 䰞ā⑨ᠿˈ䙊䗷䰞仈Ⲵᱟˋഎㆄ䙀⑀㧧ᗇ䰞仈Ⲵᴰ㓸ㆄ
Ṹˈ⧙ 20 䰞⑨ᠿⲴㆆ⮕ᱟᨀⲴ䰞仈ᴰྭ㜭ᢺى䘹ㆄṸ߿ॺDŽ㲭❦൘മ 2-3 Ⲵਈරオ䰤ѝˈ
ᡁԜਟԕ⭏ᡀањᇎֻሶަ㋮⺞ൠ࠶ॺDŽնа㡜ᛵߥлˈਟ㜭ᰐ⌅ᶴ䙐ࠪ䘉ṧⲴ㋮⺞࠶ॺⲴ
ᇎֻDŽ䘉ṧˈḕ䈒Ⲵᮠⴞਟ㜭ՊཊҾªlog2|VS|ºDŽ
2.6.3 ᙄṭֵ⭞уᇂޞᆜҖᾸᘫ
൘к䶒Ⲵֻᆀѝˈྲ᷌䲔Ҷ 4 њṧֻѻཆ⋑ᴹᴤཊⲴ䇝㓳ṧֻˈնᵪಘ⧠൘㾱ሩᵚ㿱䗷
Ⲵᇎֻ䘋㹼࠶㊫DŽ㲭❦മ 2-3 Ⲵਈරオ䰤ѝӽवਜ਼ཊњٷ䇮ˈণⴞḷᾲᘥ䘈ᵚᆼޘᆖҐࡠˈ
ӽ❦ᴹਟ㜭ሩᯠṧֻ䘋㹼аᇊਟؑᓖⲴ࠶㊫DŽѪ⽪㤳䘉а䗷〻ˈٷᇊᵪಘ䴰㾱ሩ㺘 2-6 ѝⲴ
4 њᯠᇎֻ䘋㹼࠶㊫DŽ
㺘 2-6 ᖵ࠶㊫Ⲵᯠᇎֻ
Instance Sky AirTemp Humidity Wind Water Forecast EnjoySport
A Sunny Warm Normal Strong Cool Change ?
B Rainy Cold Normal Light Warm Same ?
C Sunny Warm Normal Light Warm Same ?
D Sunny Cold Normal Strong Warm Same ?
լൠˈᇎֻ B 㻛ਈරオ䰤ѝⲴ⇿њٷ䇮ࡂ࠶Ѫ৽ֻDŽᡰԕ䘉њᇎֻਟ㻛᭮ᗳൠࡂ࠶
Ѫ৽ֻˈণ֯ᾲᘥᱟнᆼޘᆖҐⲴDŽሩ䘉аᶑԦⲴ⍻䈅Ⲵᴹ᭸ᯩ⌅ᱟˈࡔᯝᇎֻн┑䏣 G
ѝⲴᡰᴹᡀઈ˄ѪӰѸ˛˅DŽ
ᇎֻ C Ⲵᛵߥᴹᡰн਼DŽਈරオ䰤ѝॺᮠⲴٷ䇮ࡂ࠶ަѪ↓ֻˈॺᮠࡂ࠶Ѫ৽ֻDŽഐ
↔ˈᆖҐಘᰐ⌅ਟؑൠ࠶㊫䘉аṧֻˈ䲔䶎ᨀᴤཊⲴ䇝㓳ṧֻDŽ⌘ࡠˈᇎֻ C оࡽа
㢲ᨀࠪⲴањᴰՈḕ䈒਼DŽ䘉ᱟਟԕ亴㿱ⲴˈഐѪᴰᴹ࠶㊫↗ѹᙗⲴᇎֻҏаᇊᴰ㜭ᨀ
ᯠⲴ࠶㊫ؑDŽ
2.7 ᖈ㓩څ㖤
ྲкᡰ䘠ˈ൘㔉ᇊ↓⺞Ⲵ䇝㓳ṧֻᒦф؍䇱ࡍٷ䇮オ䰤वਜ਼ⴞḷᾲᘥᰦˈى䘹⎸䲔㇇
⌅ਟԕ᭦ᮋࡠⴞḷᾲᘥDŽྲ᷌ⴞḷᾲᘥн൘ٷ䇮オ䰤ѝᘾѸ࣎˛ᱟਟ䇮䇑аवਜ਼ᡰᴹٷ䇮
Ⲵオ䰤ᶕ䀓ߣ䘉аഠ䳮˛ٷ䇮オ䰤ⲴབྷሿሩҾ㇇⌅᧘ᒯࡠᵚ㿱ᇎֻⲴ㜭࣋ᴹӰѸᖡ૽˛ٷ
䇮オ䰤Ⲵབྷሿሩᡰ䴰䇝㓳ṧֻⲴᮠ䟿ᴹӰѸᖡ૽˛䘉Ӌ䜭ᱟᖂ㓣᧘⨶ѝⲴаӋสᵜ䰞仈DŽ䘉
䟼ᡁԜ൘ى䘹⎸䲔㇇⌅ѝ㘳ሏ䘉Ӌ䰞仈DŽ❦㘼ਟԕⴻࡠˈ䘉䟼Ⲵ࠶᷀ѝᗇࡠⲴ㔃䇪ਟԕᓄ⭘
ҾԫⲴᾲᘥᆖҐ㌫㔏DŽ
2.7.1 жѠᴿٽⲺڅ䇴グ䰪
ྲ᷌ᜣ؍䇱ٷ䇮オ䰤वਜ਼ⴞḷᾲᘥˈањ᰾ᱮⲴᯩ⌅ᱟᢙབྷٷ䇮オ䰤ˈ֯⇿њਟ㜭Ⲵٷ
䇮䜭वਜ਼൘DŽа⅑֯⭘ EnjoySport 䘉њֻᆀˈަѝᡁԜሶٷ䇮オ䰤䲀ࡦѪਚवਜ਼ᙗ٬
ⲴਸਆDŽ⭡Ҿ䘉а䲀ࡦˈٷ䇮オ䰤н㜭ཏ㺘⽪ᴰㆰঅⲴ᷀ਆᖒᔿⲴⴞḷᾲᘥˈྲĀSky=Sunny
ᡆ Sky=CloudyāDŽᇎ䱵кˈྲ᷌㔉ᇊԕлйњ䇝㓳ṧֻˈᆳԜᶕ㠚Ҿ䈕᷀ਆᔿٷ䇮ˈᡁԜⲴ
㇇⌅ሶᗇࡠањオⲴਈරオ䰤DŽ
Example Sky AirTemp Humidity Wind Water Forecast EnjoySport
1 Sunny Warm Normal Strong Cool Change Yes
2 Cloudy Warm Normal Strong Cool Change Yes
3 Rainy Warm Normal Strong Cool Change No
ѻᡰԕнᆈ൘о䘉 3 њṧֻа㠤Ⲵٷ䇮Ⲵഐᱟˈоཤєњṧֻа㠤ˈᒦф㜭൘㔉ᇊٷ
䇮オ䰤 H ѝ㺘⽪Ⲵᴰ⢩↺Ⲵٷ䇮ᱟ˖
䘉аٷ䇮㲭❦ᱟ H ѝоṧֻа㠤Ⲵᴰ⢩↺Ⲵٷ䇮ˈᆳӽ❦䗷Ҿа㡜ॆҶ˖ᆳሶㅜйњ
ṧֻ䭉䈟ൠࡂѪ↓ֻDŽ䰞仈൘ҾˈᡁԜ֯ᆖҐಘੁٿҾਚ㘳㲁ਸਆⲴٷ䇮ˈ䘉䟼䴰㾱㺘⽪㜭
࣋ᴤᕪⲴٷ䇮オ䰤DŽ
2.7.2 ᰖⲺڅᆜҖಞ
ᖸᱮ❦ˈѪҶ؍䇱ⴞḷᾲᘥ൘ٷ䇮オ䰤ѝˈ䴰㾱ᨀањٷ䇮オ䰤ˈᆳ㜭㺘䗮ᡰᴹⲴਟ ਟ
ᮉᦸᾲᘥ(every teachable concept)DŽᦒ䀰ѻˈᆳ㜭ཏ㺘䗮ᇎֻ䳶 X Ⲵᡰᴹਟ㜭Ⲵᆀ䳶DŽа㡜
ൠˈᡁԜᢺ䳶ਸ X ᡰᴹᆀ䳶Ⲵ䳶ਸ〠Ѫ X Ⲵᑲ ᑲ䳶˄power set˅DŽ
㔉ᇊ䘉ṧⲴٷ䇮オ䰤ˈᡁԜቡਟԕᆹޘൠ֯⭘ى䘹⎸䲔㇇⌅ˈ㘼нᗵᣵᗳᰐ⌅㺘䗮ⴞḷ
ᾲᘥDŽ❦㘼ˈ㲭❦䘉њٷ䇮オ䰤ᧂ䲔Ҷ㺘䗮㜭࣋Ⲵ䰞仈ˈᆳ৸ӗ⭏ҶањᯠⲴǃ਼ṧഠ䳮Ⲵ
䰞仈˖ᾲᘥᆖҐ㇇⌅ሶᆼޘᰐ⌅Ӿ䇝㓳ṧֻѝ⌋ॆʽަഐྲлˈٷᇊᡁԜᨀҶ 3 њ↓ֻ
˄x1ˈx2ˈx3˅ԕ৺єњ৽ֻ˄x4ˈx5˅㔉ᆖҐಘDŽ䘉ᰦˈਈරオ䰤ⲴS䗩⭼वਜ਼Ⲵٷ䇮↓ྭ
ᱟйњ↓ֻⲴ᷀ਆ˖
S: { (x1Ģx2Ģx3) }
G: { (x4Ģx5)}
䰞仈൘Ҿˈ䘉а䶎ᑨާᴹ㺘䗮࣋Ⲵٷ䇮㺘⽪ᯩ⌅ѝˈS 䗩⭼ᙫᱟㆰঅⲴᡰᴹ↓ֻ᷀ਆᔿˈ
G 䗩⭼ᙫᱟᡰᴹ৽ֻⲴ᷀ਆⲴᇊᔿDŽ䘉ṧ㜭ཏ⭡ S ઼ G ᰐ↗ѹൠ࠶㊫Ⲵˈਚᴹᐢ㿱ࡠⲴ
䇝㓳ṧֻᵜ䓛DŽ㾱ᜣ㧧ᗇঅњⲴⴞḷᾲᘥˈቡᗵ享ᨀ X ѝᡰᴹⲴᇎֻѪ䇝㓳ṧֻDŽ
2.7.3 ᰖڅᆜҖⲺᰖ⭞ᙝ
ԕкⲴ䇘䇪䈤᰾Ҷᖂ㓣᧘⨶Ⲵањสᵜᙗ˖ᆖҐಘྲ᷌нሩⴞḷᾲᘥⲴᖒᔿڊ亴Ⲵݸ
ٷᇊˈᆳӾṩᵜкᰐ⌅ሩᵚ㿱ᇎֻ䘋㹼࠶㊫DŽᇎ䱵к൘ᡁԜᶕⲴ EnjoySport ԫ࣑ѝˈى䘹
⎸䲔㇇⌅㜭ཏӾ䇝㓳ṧֻѝ⌋ॆˈަᜏаⲴഐቡᱟᆳᱟᴹˈⲴٿᆳ䳀ਜ਼ٷᇊҶⴞḷᾲᘥਟ
ԕ⭡ᙗ٬Ⲵਸਆᶕ㺘⽪DŽྲ᷌䘉аٷᇊ↓⺞˄ᒦф䇝㓳ᮠᦞᰐ䭉˅ˈሩҾᯠᇎֻⲴ࠶㊫ҏ
Պᱟ↓⺞ⲴDŽնྲ᷌䘉њٷᇊн↓⺞ˈى䘹⎸䲔㇇⌅㛟ᇊՊ䭉䈟ൠ࠶㊫ X ѝḀӋᇎֻDŽ
⭡Ҿᖂ㓣ᆖҐ䴰㾱ḀᖒᔿⲴ亴ٷݸᇊˈᡆ〠Ѫᖂ㓣ٿ㖞˄Inductive bias˅*ˈᡁԜਟԕ
⭘ᖂ㓣ٿ㖞ᶕ᧿䘠н਼ᆖҐᯩ⌅Ⲵ⢩ᖱDŽ⧠൘ᶕ㋮⺞ൠᇊѹᖂ㓣ٿ㖞DŽ䘉䟼㾱㧧ਆⲴޣ䭞ᙍ
ᜣ൘ҾˈᆖҐಘ൘Ӿ䇝㓳ṧֻѝ⌋ॆᒦ᧘ᯝᯠᇎֻⲴ࠶㊫䗷〻ѝᡰ䟷⭘Ⲵㆆ⮕DŽഐ↔ˈ㘳㲁
а㡜ᛵߥлԫⲴᆖҐ㇇⌅Lˈԕ৺ѪԫⴞḷᾲᘥcᨀⲴԫ䇝㓳ᮠᦞDc={<x, c(x)>}DŽ
䇝㓳䗷〻㔃ᶏਾˈL䴰㾱ሩᯠⲴᇎֻxi䘋㹼࠶㊫DŽԔL(xi, Dc)㺘⽪൘ሩ䇝㓳ᮠᦞDcᆖҐਾL䍻
ҸxiⲴ࠶㊫˄↓ֻᡆ৽ֻ˅
ˈᡁԜਟԕྲл᧿䘠Lᡰ䘋㹼Ⲵ䘉аᖂ㓣᧘⨶䗷〻˖
(Dcġxi) L(xi,Dc)
⭡ҾLᱟаᖂ㓣ᆖҐ㇇⌅ˈࡉа㡜ᛵߥлL(xi, Dc)䘉а᧘䇪ࠪⲴ㔃᷌↓⺞ᙗᰐ⌅䇱᰾˗ҏ
ቡᱟ䈤ˈ࠶㊫L(xi, Dc)ᒦ䶎Ӿ䇝㓳ᮠᦞDc઼ᯠᇎֻxiѝ╄㓾⍮⭏DŽ❦㘼䰞仈ᱟˈ䴰㾱൘Dcġxi
к䱴࣐ᘾṧⲴࡽᨀˈԕ֯L(xi,Dc)㜭╄㓾⍮⭏DŽᡁԜᇊѹLⲴᖂ ᖂ㓣ٿ㖞Ѫ䘉Ӌ䱴࣐ࡽᨀⲴ䳶ਸDŽ
ᴤ㋮⺞ൠ䈤ˈᡁԜᇊѹLⲴᖂ㓣ٿ㖞Ѫࡽᨀ䳶ਸBˈ֯ᡰᴹⲴᯠᇎֻxi┑䏣DŽ
定义: 㘳㲁ሩҾᇎֻ䳶ਸXⲴᾲᘥᆖҐ㇇⌅LDŽԔcѪXкᇊѹⲴԫаᾲᘥˈᒦԔDc={<x,
c(x)>}ѪcⲴԫ䇝㓳ṧֻ䳶ਸDŽԔL(xi, Dc)㺘⽪㓿䗷ᮠᦞDcⲴ䇝㓳ਾˈL䍻Ҹᇎֻxi
Ⲵ࠶㊫DŽLⲴᖂ ᖂ㓣ٿ㖞ᱟᴰሿᯝ䀰䳶ਸBˈᆳ֯ԫⴞḷᾲᘥc઼ᓄⲴ䇝㓳ṧֻDc
┑䏣˖
䛓Ѹˈى䘹⎸䲔㇇⌅Ⲵᖂ㓣ٿ㖞ᱟӰѸ˛俆⺞ݸᇊ䘉а㇇⌅ⲴL(xi, Dc)˖㔉ᇊᮠᦞ䳶
Dcˈى䘹⎸䲔㇇⌅俆ݸ䇑㇇ਈරオ䰤VSH,Dcˈ❦ਾ൘ਈරオ䰤ᡰवਜ਼Ⲵٷ䇮ѝᣅ⾘ˈ䘋㹼ᯠ
ᇎֻxiⲴ࠶㊫DŽ䘉䟼ٷᇊӗ⭏xiⲴ࠶㊫ⲴᶑԦᱟᣅ⾘а㠤Ѫ↓ᡆѪ䍏ˈࡉн䘋㹼࠶㊫DŽ⧠
൘ᶕഎㆄӰѸᱟى䘹⎸䲔㇇⌅L(xi, Dc)Ⲵᖂ㓣ٿ㖞Ⲵ䰞仈˖ᖸㆰঅˈቡᱟcęH䘉њࡽᨀDŽᴹ
Ҷ䘉аࡽᨀˈى䘹⎸䲔㇇⌅ᡰᢗ㹼Ⲵ⇿аᖂ㓣᧘⨶䜭ਟԕ㻛╄㓾䇪䇱DŽ
⧠൘ⴻаⴻѪӰѸL(xi, Dc)䘉а࠶㊫ਟ⭡B={cęH}ǃᮠᦞDc઼ᇎֻxi╄㓾⍮⭏DŽ俆ˈݸ
⌘ྲ᷌ٷᇊcęHˈ䛓Ѹਟ╄㓾⍮⭏ࠪcęVSH,DcDŽ䘉а⍮⭏ⲴᶑԦ䲔cęHˈ䘈वᤜਈරオ
䰤VSH,DcⲴᇊѹ˄ণHѝоDcа㠤Ⲵᡰᴹٷ䇮䳶ਸ˅ ˈԕ৺ሩDc={<x, c(x)>}Ⲵᇊѹ˄ণоⴞḷ
ᾲᘥа㠤Ⲵ䇝㓳ᮠᦞ˅DŽަ⅑ˈ⭡ҾL(xi, Dc)ᱟа࠶㊫ˈᆳᇊѹѪਈරオ䰤ѝᡰᴹٷ䇮Ⲵа㠤
ᣅ⾘DŽഐ↔ˈྲ᷌L䗃ࠪ࠶㊫L(xi, Dc)ˈ䛓ѸVSH,Dcѝ⇿аٷ䇮ᗵሶӗ⭏਼ṧⲴ࠶㊫ˈवᤜٷ
䇮cęVSH,DcDŽഐ↔c(xi)=L(xi, Dc)ى䘹⎸䲔㇇⌅Ⲵᖂ㓣ٿ㖞ᾲᤜ䈤᰾ྲл˖
*
䘉䟼Ⲵᵟ䈝ᖂ
ᖂ㓣ٿ㖞˄inductive bias˅н㾱઼㔏䇑ᆖѝᲞ䙽֯⭘Ⲵՠ
ՠ䇑ٿᐞ˄estimation bias˅⏶DŽ
ՠ䇑ٿᐞሶ൘ㅜ 5 ㄐ䇘䇪DŽ
ى䘹⎸䲔㇇⌅Ⲵᖂ㓣ٿ㖞˖ⴞḷᾲᘥ c वਜ਼൘㔉ᇊⲴٷ䇮オ䰤 H ѝDŽ
插图——原书页码:44
Theorem Prover:ᇊ⨶䇱᰾ಘ
മ 2-8 ⭘ㅹԧⲴ╄㓾㌫㔏ᶕ⁑ᤏᖂ㓣㌫㔏
֯⭘ٷ䇮オ䰤 H Ⲵى䘹⎸䲔㇇⌅Ⲵ䗃ޕ䗃ࠪ㹼ѪˈㅹԧҾ࡙⭘Ҷᯝ䀰ĀH वਜ਼ⴞḷᾲᘥāⲴ╄㓾
ᇊ⨶䇱᰾ಘDŽ䈕ᯝ䀰ഐ↔㻛〠Ѫى䘹⎸䲔㇇⌅Ⲵᖂᖂ㓣ٿ㖞DŽ⭘ᖂ㓣ٿ㖞ᶕ⭫ᖂ㓣㌫㔏ˈਟԕׯҾ
֯⭘ㅹԧⲴ╄㓾㌫㔏ᶕ⁑ᤏᆳԜDŽ䘉ᨀҶаሩᖂ㓣㌫㔏䘋㹼∄䖳Ⲵᯩ⌅ˈ䙊䗷ᆳԜӾ䇝㓳ᮠᦞ
ѝ⌋ॆⲴㆆ⮕DŽ
മ 2-8 Ѫа⽪മ䀓DŽк䶒Ⲵമᱮ⽪Ⲵى䘹⎸䲔㇇⌅ᴹєњ䗃˖ޕ䇝㓳ṧ઼ֻᖵ࠶㊫Ⲵ
ᯠᇎֻDŽл䶒ⲴമѪа╄㓾ᇊ⨶䇱᰾ಘˈᆳⲴ䗃ޕवᤜ਼ṧⲴє㓴ᮠᦞˈ࣐кᯝ䀰ĀH व
ਜ਼ⴞḷᾲᘥā DŽ䘉єњ㌫㔏ሩᡰᴹਟ㜭Ⲵ䇝㓳ṧֻ䗃઼ޕᯠᇎֻ䗃ޕӗ⭏਼ṧⲴ䗃ࠪDŽᖃ❦ˈ
൘ᇊ⨶䇱᰾ಘѝᱮᔿ䗃Ⲵޕᖂ㓣ٿ㖞ਚᱟ䳀ਜ਼൘Ҷى䘹⎸䲔㇇⌅Ⲵԓ⸱ѝDŽ൘Ḁѹкˈ
ᖂ㓣ٿ㖞ਚ൘ᡁԜⲴঠ䊑ѝᆈ൘ˈնᆳ⺞ᇎᱟ㜭㻛ᆼᮤᇊѹⲴᯝ䀰䳶ਸDŽ
ሶᖂ㓣᧘⨶㌫㔏ⴻᱟवਜ਼Ҷᖂ㓣ٿ㖞ˈྭ༴൘ҾᆳᨀҶа䶎〻ᒿॆⲴ᧿䘠⇥ˈ
ԕ᧿䘠ᆖҐಘӾ㿲ሏࡠⲴᮠᦞѝ䘋㹼⌋ॆⲴㆆ⮕DŽަ⅑ᆳ䘈ਟԕሩᖂ㓣ٿ㖞ᕪᓖн਼ⲴᆖҐ
ಘ䘋㹼∄䖳DŽֻྲˈ㘳㲁ԕл 3 њᆖҐ㇇⌅ˈ᤹ަᴹٿ〻ᓖӾᕡࡠᕪ䘋㹼ᧂᒿ˖
1. ᵪỠᆖҐಘ˄Rote-Learner˅DŽㆰঅൠሶ⇿њ㿲ሏࡠⲴ䇝㓳ṧֻᆈۘлᶕDŽਾ㔝Ⲵᇎ
ֻⲴ࠶㊫䙊䗷൘ᆈѝ३䝽䘋㹼DŽྲ᷌ᇎֻ൘ᆈѝࡠҶˈᆈۘⲴ࠶㊫㔃᷌㻛䗃ࠪDŽ
ࡉ㌫㔏ᤂ㔍䘋㹼࠶㊫DŽ
2. ى䘹⎸䲔㇇⌅DŽᯠⲴᇎֻਚ൘ਈරオ䰤ᡰᴹᡀઈ䜭䘋㹼਼ṧ࠶㊫ᰦ䗃ࠪ࠶㊫㔃
᷌ˈࡉ㌫㔏ᤂ㔍࠶㊫DŽ
3. Find-SDŽྲࡽᡰ䘠ˈ䘉а㇇⌅ራо䇝㓳ṧֻа㠤Ⲵᴰ⢩↺Ⲵٷ䇮ˈᆳ⭘䘉аٷ䇮
ᶕ࠶㊫ਾ㔝ᇎֻDŽ
䇠ᗶᆖҐಘ⋑ᴹᖂ㓣ٿ㖞DŽሩҾᯠᇎֻᡰ࠶Ⲵڊ㊫㜭Ӿᐢ㿲ሏࡠⲴ䇝㓳ṧֻѝ╄㓾⍮
⭏ˈн䴰㾱䱴࣐ⲴࡽᨀDŽى䘹⎸䲔㇇⌅ᴹ䖳ᕪⲴᖂ㓣ٿ㖞˖ণⴞḷᾲᘥ享൘ٷ䇮オ䰤ѝ㜭㺘
⽪DŽ⭡ҾᆳᱟᴹˈⲴٿᡰԕ㜭ཏሩ䇠ᗶᆖҐಘн㜭࠶㊫Ⲵᇎֻ䘋㹼࠶㊫DŽᖃ❦࠶㊫Ⲵ↓⺞ᙗ
ҏᆼޘ䎆Ҿᖂ㓣ٿ㖞Ⲵ↓⺞ᙗDŽFind-S㇇⌅ᴹᴤᕪⲴᖂ㓣ٿ㖞ˈ䲔Ҷٷᇊⴞḷᾲᘥ享൘ٷ
䇮オ䰤ѝˈᆳ䘈ᴹਖа仍ཆⲴᖂ㓣ٿ㖞ࡽᨀ˖ԫօᇎֻˈ䲔䶎ᆳⲴ䘶ᇎֻਟ⭡ަԆ⸕䇶䙫䗁
᧘ࠪˈࡉᆳѪ৽ֻDŽ*
൘⹄ウަԆⲴᖂ㓣᧘⨶ᯩ⌅ᰦˈᴹᗵ㾱⢒䇠䘉ᖂ㓣ٿ㖞Ⲵᆈ൘৺ަᕪᓖDŽа㇇⌅ྲ
᷌ᴹٿᙗ䎺ᕪˈ䛓ᆳⲴᖂ㓣㜭࣋䎺ᕪˈਟԕ࠶㊫ᴤཊⲴᵚ㿱ᇎֻDŽḀӋᖂ㓣ٿ㖞ᱟሩ㊫࡛Ⲵ
ٷᇊˈԕ⺞ᇊⴞḷᾲᘥⲴ㤳തDŽྲĀٷ䇮オ䰤 H वਜ਼ⴞḷᾲᘥāDŽަԆⲴᖂ㓣ٿ㖞ਚᱟሩٷ
䇮䘋㹼ᧂᒿˈԕ᧿䘠ྭٿ〻ᓖˈ∄ྲĀੁٿҾ⢩↺ٷ䇮ˈ㘼нᱟа㡜ٷ䇮DŽāḀӋٿ㖞䳀ਜ਼
൘ᆖҐಘѝнਟᴤ᭩ˈྲ䘉䟼ᡰ䇘䇪ⲴֻᆀDŽ൘ㅜ 11 ઼ 12 ㄐਟԕⴻࡠ᰾⺞㺘⽪ᖂ㓣ٿ㖞Ⲵ
㌫㔏ˈᆳԜሶٿ㖞㺘⽪Ѫᯝ䀰Ⲵ䳶ਸᒦਟ⭡ᆖҐಘ㓥DŽ
2.8 ቅ㔉ૂ㺛ݻ䈱⢟
ᵜㄐⲴ㾱⛩वᤜ˖
ᾲᘥᆖҐਟⴻᱟᩌ㍒亴ᇊѹ▌൘ٷ䇮オ䰤Ⲵ䗷〻DŽ
ٷ䇮Ⲵа㡜ࡠ⢩↺ٿᒿ㔃ᶴਟԕᇊѹ൘ԫօᾲᘥᆖҐ䰞仈ѝˈᆳᨀҶаᴹ⭘Ⲵ
㔃ᶴԕׯҾٷ䇮オ䰤Ⲵᩌ㍒DŽ
Find-S ㇇⌅֯⭘Ҷа㡜ࡠ⢩↺ᒿˈ൘ٿᒿ㔃ᶴⲴањ࠶᭟кᢗ㹼Ⲵа㡜ࡠ⢩↺ᩌ
㍒ˈԕራоṧֻа㠤Ⲵᴰ⢩↺ٷ䇮DŽ
ى䘹⎸䲔㇇⌅࡙⭘а㡜ࡠ⢩↺ᒿˈ䙊䗷⑀䘋ൠ䇑㇇ᶱབྷ⢩↺ٷ䇮䳶ਸ S ઼ᶱབྷа㡜
ٷ䇮䳶ਸ G 䇑㇇ਈරオ䰤˄ণᡰᴹо䇝㓳ᮠᦞа㠤Ⲵٷ䇮䳶˅DŽ
⭡Ҿ S ઼ G Ӿᮤњٷ䇮䳶ਸѝࡂ࠶ࠪҶо䇝㓳ᮠᦞа㠤Ⲵ䛓䜘࠶䳶ਸˈᆳԜᨀ
ҶሩⴞḷᾲᘥⲴн⺞ᇊᙗ᧿䘠DŽਜ਼ᴹཊњٷ䇮Ⲵਈරオ䰤ਟԕ⭘ᶕࡔᯝᆖҐಘᱟ
ᐢ᭦ᮋࡠҶⴞḷᾲᘥ˗ࡔᯝ䇝㓳ᮠᦞᱟна㠤˗ӗ⭏ḕ䈒ԕ䘋а↕㋮ॆਈරオ䰤˗
ԕ৺⺞ᇊᵚ㿱䗷Ⲵᇎֻᱟ㜭⭘нᆼޘᆖҐࡠⲴᾲᘥᶕᰐ↗ѹൠ࠶㊫DŽ
ਈරオ䰤઼ى䘹⎸䲔㇇⌅Ѫ⹄ウᾲᘥᆖҐᨀҶаᴹ⭘ⲴṶᷦˈ❦㘼䘉а㇇⌅㕪
ቁ励ἂᙗˈ⢩࡛ᱟ൘䙷ࡠᴹಚ༠Ⲵᮠᦞԕ৺ⴞḷᾲᘥᰐ⌅൘ٷ䇮オ䰤ѝ㺘⽪Ⲵᛵߥ
лDŽㅜ 10 ㄐ᧿䘠ҶࠐสҾа㡜ࡠ⢩↺ᒿޣ㌫ⲴᾲᘥᆖҐ㇇⌅ˈᆳԜ㜭ཏ༴⨶ᴹ
ಚ༠ᮠᦞDŽ
*
⌘ᴰਾ䶒䘉њᖂ㓣ٿ㖞ٷᇊˈᆳवਜ਼ҶḀ唈䇔᧘⨶ˈᡆ䶎অ䈳᧘⨶DŽ
ᖂ㓣ᆖҐ㇇⌅㜭ཏሩᵚ㿱ᮠᦞ䘋㹼࠶㊫ˈᱟഐѪᆳԜ൘䘹ᤙа㠤Ⲵٷ䇮ᰦ䳀ਜ਼Ⲵᖂ
㓣ٿ㖞DŽى䘹⎸䲔㇇⌅ѝⲴٿ㖞Ѫ˖ⴞḷᾲᘥਟԕ൘ٷ䇮オ䰤ѝࡠ˄cęH˅DŽ䗃
ࠪⲴٷ䇮઼ሩਾ㔝ᇎֻⲴ࠶㊫ਟ⭡䘉аࡽᨀ৺䇝㓳ṧֻ╄㓾᧘ࠪDŽ
ྲ᷌ٷ䇮オ䰤㻛ᢙኅˈ֯ሩᓄᇎֻ䳶Ⲵ⇿ањᆀ䳶˄ᇎֻⲴᑲ䳶˅䜭ᴹањٷ䇮ˈ
ሶ֯ى䘹⎸䲔㇇⌅ѝⲴᖂ㓣ٿ㖞⎸ཡDŽ❦㘼ˈ䘉ҏሶ⎸䲔ަሩᯠᇎֻ࠶㊫Ⲵ㜭࣋DŽ
ᰐⲴٿᆖҐಘᰐ⌅ሩᵚ㿱ṧֻ䘋㹼ᖂ㓣DŽ
ᾲᘥᆖҐԕ৺֯⭘а㡜ࡠ⢩↺ᒿⲴ⹄ޣウ⭡ᶕҏѵDŽBruner et al.˄1957˅䖳ᰙൠሩӪ
㊫ⲴᾲᘥᆖҐࠪ⹄ウˈ㘼 Hunt & Hovland˄1963˅䖳ᰙሶަ㠚ࣘॆDŽWinston˄1970˅Ⲵ
ᴹⲴঊ༛䇪᮷ѝሶᾲᘥᆖҐⴻᱟवਜ਼⌋ॆ઼⢩ॆⲴᩌ㍒䗷〻DŽPlotkin˄1970, 1971˅
䖳ᰙൠᨀҶᖒᔿॆⲴ more-general-than ޣ㌫ˈԕ৺ањⲴޣᾲᘥT-वᇩ˄൘ㅜ 10 ㄐѝ
䇘䇪˅DŽSimon ઼ Lea˄1973˅ሶᆖҐⲴ䗷〻ⴻᱟ൘ٷ䇮オ䰤ѝᩌ㍒Ⲵ䗷〻DŽަԆаӋ䖳
ᰙⲴᾲᘥᆖҐ㌫㔏वᤜ˄Popplestone 1969˗Michalski 1973˗Buchanan 1974˗Vere 1975˗
Hayes-Roth 1974˅DŽབྷ䟿ⲴสҾㅖਧ㺘⽪ⲴᾲᘥᆖҐ㇇⌅ᐢ㻛ᔰਁࠪᶕDŽㅜ 10 ㄐ᧿䘠Ҷࠐ
䘁ᵏⲴᾲᘥᆖҐ㇇⌅DŽवᤜ⭘а䱦䙫䗁㺘⽪ⲴᾲᘥᆖҐ㇇⌅ˈሩᴹಚ༠ᮠᦞᴹ励ἂᙗⲴ㇇⌅ˈ
ԕ৺ᖃⴞḷᾲᘥᰐ⌅൘ᆖҐಘⲴٷ䇮オ䰤ѝ㺘⽪ᰦ㜭䖳ྭൠ䱽㓗ᆖҐⲴ㇇⌅DŽ
ਈරオ䰤઼ى䘹⎸䲔㇇⌅⭡ Mitchell˄1977ˈ1982˅ᨀࠪˈ䘉а㇇⌅ᐢᓄ⭘Ҿ䍘䉡࠶᷀
˄mass spectroscopy˅ѝⲴ㿴ࡉ᧘⨶˄Mitchell 1979˅ԕ৺ᓄ⭘ҾᆖҐᩌ㍒᧗ࡦ㿴ࡉ˄Mitchell
DŽHaussler˄1988˅䇱᰾ণ֯ᖃٷ䇮オ䰤ਚवਜ਼ㆰঅⲴ⢩ᖱਸਆᰦˈа㡜䗩⭼Ⲵ
et al. 1983˅
བྷሿṩᦞ䇝㓳ṧֻⲴᮠⴞᤷᮠ໎䮯DŽSmith & Rosenbloom˄1990˅ᨀࠪሩ G 䳶ਸⲴ㺘⽪䘋㹼
ㆰঅⲴᴤ᭩ˈԕ᭩䘋ަ⢩ᇊᛵߥлⲴ༽ᵲᙗˈHirsh˄1992˅ᨀࠪ൘ḀӋᛵߥлнᆈۘ G 䳶
ਸᰦᆖҐ䗷〻ѪṧֻᮠⴞⲴཊ亩ᔿ࠭ᮠDŽSubramanian & Feigenbaum˄1986˅䇘䇪Ҷ⢩ᇊᛵ
ߥл䙊䗷࠶䀓ਈරオ䰤ԕ⭏ᡀᴹ᭸ḕ䈒аᯩ⌅DŽى䘹⎸䲔㇇⌅ⲴањᴰབྷⲴᇎ䱵䲀ࡦᱟᆳ
㾱≲䇝㓳ᮠᦞᱟᰐಚ༠ⲴDŽMitchell˄1979˅᧿䘠Ҷ䈕㇇⌅Ⲵаᢙኅˈԕ༴⨶ਟ亴㿱Ⲵᴹ
䲀ᮠ䟿Ⲵ䈟࠶㊫ṧֻˈHirsh˄1990, 1994˅ᨀࠪа㢟ྭⲴᢙኅԕ༴⨶ާᴹᇎᮠ٬ᙗⲴ䇝
㓳ṧֻѝⲴᴹ䲀ಚ༠DŽHirsh˄1990˅᧿䘠Ҷа䙂໎ਈරオ䰤ਸᒦ㇇⌅ˈᆳሶى䘹⎸䲔㇇
⌅ᢙኅࡠ㜭༴⨶⭡н਼㊫රⲴ٬㓖ᶏ㺘⽪Ⲵ䇝㓳ؑDŽᶕ㠚⇿њ㓖ᶏⲴؑ⭡ਈරオ䰤ᶕ㺘
⽪ˈ❦ਾ⭘Ӕਐਈරオ䰤Ⲵ࣎⌅ਸᒦ䘉Ӌ㓖ᶏDŽSebag˄1994, 1996˅ኅ⽪Ҷа㻛〠Ѫ᷀ਆ
ਈරオ䰤Ⲵᯩ⌅ᶕӾᴹಚ༠ᮠᦞѝᆖҐ᷀ਆᾲᘥDŽӾ⇿њ↓ֻѝᆖࡠањ࠶・Ⲵਈරオ䰤ˈ
❦ਾ⭘䘉н਼ਈරオ䰤䘋㹼ᣅ⾘ԕ࠶㊫ᯠᇎֻDŽྩ൘ࠐњ䰞仈亶ฏ䘋㹼Ҷᇎ傼ˈᗇࠪྩⲴᯩ
⌅਼ަԆᒯ⌋֯⭘Ⲵᖂ㓣ᯩ⌅ᴹ਼ṧ㢟ྭⲴᙗ㜭ˈྲߣㆆṁ઼ k-䘁䛫ᯩ⌅DŽ
Ґ仈
˄a˅㘳㲁ሩᓄҾлമᡰ⽪↓ֻ˄ˇ˅઼৽ֻ˄ˉ˅䳶ਸⲴਈරオ䰤ˈᆳⲴ S 䗩⭼ᱟӰ
Ѹ˛߉ࠪަѝⲴٷ䇮ᒦ൘മѝ⭫ࠪDŽ
插图——原书页码:48
˄b˅ਈරオ䰤Ⲵ G 䗩⭼ᱟӰѸˈ߉ࠪަѝⲴٷ䇮ᒦ൘മѝ⭫ࠪDŽ
˄c˅ٷᇊᆖҐಘਟᨀࠪањᯠᇎֻ(x, y)ˈᒦ㾱≲ᯭᮉ㘵䘋㹼࠶㊫ˈ䈅㔉ࠪањḕ䈒ˈ
ᰐ䇪ᯭᮉ㘵ᘾṧ࠶㊫䜭㜭؍䇱߿ሿਈරオ䰤DŽ㔉ࠪањн㜭؍䇱Ⲵḕ䈒DŽ
˄d˅Ѫᯭᮉ㘵ˈྲ᷌ᜣ䇙ᆖҐಘᆖҐа⢩ᇊⲴⴞḷᾲᘥ˄ྲ 3İxİ5ˈ2İyİ9˅
ˈ
Ѫ֯ى䘹⎸䲔㇇⌅ᆼޘᆖҐࡠⴞḷᾲᘥˈ䴰㾱ᨀⲴⲴ䇝㓳ṧֻᮠⴞᴰሿᱟཊቁDŽ
2.5 䈧ⴻԕлⲴ↓઼ֻ৽ֻᒿֻˈᆳԜ᧿䘠ⲴᾲᘥᱟĀєњտ൘਼аᡯ䰤ѝⲴӪāDŽ⇿њ
䇝㓳ṧֻ᧿䘠Ҷањᴹ ᴹᒿሩˈ⇿њӪ⭡ަᙗ࡛ǃཤਁ仌㢢˄black, brown ᡆ blonde˅ǃ䓛儈
˄tall, medium ᡆ short˅ԕ৺ഭ㉽˄US, French, German, Irish, Indian, Chinese ᡆ Portuguese˅DŽ
+ < <male brown tall US>, <female black short US> >
+ < <male brown short French>, <female black short US> >
- < <female brown tall German>, <female black short Indian> >
+ < <male brown tall Irish>, <female brown short Irish> >
㘳㲁൘䘉ӋᇎֻкᇊѹⲴٷ䇮オ䰤Ѫ˖ަѝᡰᴹٷ䇮ԕаሩ 4 ݳ㓴㺘⽪ˈަѝ⇿њ٬㓖
ᶏо EnjoySport ѝⲴٷ䇮㺘⽪լˈਟԕѪ˖⢩ᇊ٬ǃĀ?āᡆ㘵ĀāDŽֻྲˈл䶒Ⲵٷ䇮˖
ᆳ㺘⽪Ҷᡰᴹ䘉ṧⲴᴹᒿሩ˖ㅜањӪѪ儈њ⭧ᙗ˄ഭ㉽઼ਁ㢢ԫ˅ˈㅜҼњӪѪ⌅
ഭྣᙗ˄ਁ㢢઼䓛儈ԫ˅DŽ
˄a˅ṩᦞк䘠ᨀⲴ䇝㓳ṧ઼ֻٷ䇮㺘⽪ˈࣘᢗ㹼ى䘹⎸䲔㇇⌅DŽ⢩࡛ᱟ㾱߉ࠪ༴
⨶Ҷ⇿ањ䇝㓳ṧֻਾਈරオ䰤Ⲵ⢩↺઼а㡜䗩⭼DŽ
˄b˅䇑㇇㔉ᇊⲴٷ䇮オ䰤ѝᴹཊቁٷ䇮ол䶒Ⲵ↓ֻа㠤˖
+ < <male black short Portuguese> <female blonde tall Indian> >
˄c˅ྲ᷌ᆖҐಘਚᴹањ䇝㓳ṧֻྲ˄b˅ѝᡰ⽪ˈ⧠൘⭡ᆖҐಘᨀࠪḕ䈒ˈᒦ⭡ᯭᮉ
㘵㔉ࠪަ࠶㊫DŽ≲ࠪањ⢩ᇊⲴḕ䈒ᒿࡇˈԕ؍䇱ᆖҐಘ᭦ᮋࡠঅњ↓⺞Ⲵٷ䇮ˈ㘼н䇪䈕
ٷ䇮ᱟଚањ˄ٷᇊⴞḷᾲᘥਟԕ֯⭘㔉ᇊⲴٷ䇮㺘⽪䈝䀰ᶕ᧿䘠˅DŽ≲ࠪᴰ⸝Ⲵḕ䈒ᒿࡇDŽ
䘉аᒿࡇⲴ䮯ᓖо䰞仈˄b˅ⲴㆄṸᴹӰѸޣ㚄˛
˄d˅⌘ࡠ䘉䟼Ⲵٷ䇮㺘⽪䈝䀰н㜭ཏ㺘⽪䘉ӋᇎֻкⲴᡰᴹᾲᘥ˄ྲᡁԜਟᇊѹࠪ
а㌫ࡇⲴ↓઼ֻ৽ֻˈᆳԜᒦ⋑ᴹᓄⲴਟ᧿䘠ٷ䇮˅DŽྲ᷌㾱ᢙኅ䘉а䈝䀰ˈ֯ަ㜭ཏ㺘
䗮䈕ᇎֻ䈝䀰кⲴᡰᴹᾲᘥˈ䛓Ѹ˄c˅ⲴㆄṸᓄ䈕ྲօᴤ᭩DŽ
2.7 㘳㲁ањᾲᘥᆖҐ䰞仈ˈަѝ⇿њᇎֻѪаᇎᮠˈ㘼⇿њٷ䇮ѪᇎᮠѝⲴ४䰤DŽ㋮
⺞ൠᇊѹѪ˖ٷ䇮オ䰤 H ѝⲴ⇿њٷ䇮ᖒᔿѪ a<x<bˈަѝ aǃb Ѫԫᇎᑨᮠˈx ԓ㺘䈕
ᇎֻDŽֻྲ 4.5<x<6.1 䘉њٷ䇮ሶ 4.5 ઼ 6.1 ѻ䰤Ⲵᇎֻࡂ࠶Ѫ↓ֻˈަԆѪ৽ֻDŽㆰ㾱䀓
䟺ѪӰѸнᆈ൘ањሩԫ↓ֻ䳶ਸ䜭а㠤Ⲵᴰ⢩↺ٷ䇮DŽ䈅؞᭩ٷ䇮Ⲵ㺘⽪ᯩ⌅ԕ䚯ݽ䘉
а㕪⛩DŽ
2.8 ᵜㄐѝᤷࠪྲ᷌㔉ᇊањᰐٷⲴٿ䇮オ䰤˄ণᇎֻⲴᑲ䳶˅ˈᆖҐಘሶਁ⧠⇿аᵚ㿲
ሏⲴᇎֻሶࡊྭоਈරオ䰤ѝॺᮠⲴᡀઈ३䝽ˈ㘼н䇪ᐢ㓿䗷ҶᘾṧⲴ䇝㓳ṧֻDŽ䇱᰾䘉а
㔃䇪DŽ⺞࠷ൠ䇢ˈ䇱᰾ሩҾԫᇎֻオ䰤Xˈԫ䇝㓳ṧֻ䳶Dˈ઼ԫнवਜ਼൘DѝⲴᇎ
ֻxęXˈྲ᷌HᱟXⲴᑲ䳶ˈ䛓Ѹ൘VSH,DѝᴹᚠྭॺᮠⲴٷ䇮ሶxࡂ࠶Ѫ↓ֻˈਖཆॺᮠࡂ
࠶Ѫ৽ֻDŽ
(a1=T)ġ(a2=F)ġ…ġ(an=T)
⧠㘳㲁ањٷ䇮オ䰤 H ѝˈ⇿њٷ䇮ᱟ䘉Ӌᙗ㓖ᶏⲴ᷀ਆˈֻྲ˖
(a1=T)Ģ(a5=F)Ģ(a7=T)
䇮䇑а㇇⌅ˈᆳ㓿䗷а㌫ࡇⲴṧֻ䇝㓳ਾ䗃ࠪања㠤Ⲵٷ䇮˄ྲᆈ൘Ⲵ䈍˅DŽ㇇⌅Ⲵ
ᰦ䰤㾱≲Ѫ n ઼䇝㓳ṧֻᮠⴞⲴཊ亩ᔿ࠭ᮠDŽ
<SunnyˈWarmˈ˛ˈ˛ˈ˛ˈ˛>
决策树学习是应用最广的归纳推理算法之一。它是一种逼近离散函数的方法,
且对噪声数据有很好的鲁棒性,能够学习析取表达式。本章描述了一系列决策树学
习算法,包括象 ID3、ASSISTANT 和 C4.5 这样广为应用的算法。这些决策树学
习方法搜索完整表示的假设空间,从而避免了受限假设空间的不足。决策树学习的
归纳偏置是优先选择较小的树。
3.1 ㆶԁ
އㄪᷥᄺдᰃϔ⾡䘐䖥⾏ᬷؐⳂᷛߑ᭄ⱘᮍ⊩ˈ䖭⾡ᮍ⊩Ёᄺдࠄⱘߑ᭄㹿㸼⼎
ЎϔỉއㄪᷥDŽᄺдᕫࠄⱘއㄪᷥг㛑ݡ㹿㸼⼎ЎϾ if-then ⱘ㾘߭ˈҹᦤ催ৃ䇏ᗻDŽ
䖭⾡ᄺдㅫ⊩ᰃ᳔⌕㸠ⱘᔦ㒇⧚ㅫ⊩ПϔˈᏆ㒣㹿៤ࡳഄᑨ⫼ࠄҢᄺдए⭫䆞ᮁࠄᄺ
д䆘Ԅ䌋ℒ⬇䇋ⱘֵ⫼亢䰽ⱘᑓ䯨乚ඳDŽ
3.2 ߩㆌṇ㺞⽰⌋
އㄪᷥ䗮䖛ᡞᅲ՟Ңḍ㒧⚍ᥦ߫˄sort˅ࠄᶤϾᄤ㒧⚍ᴹߚ㉏ᅲ՟ˈᄤ㒧⚍े
Ўᅲ՟᠔ሲⱘߚ㉏DŽᷥϞⱘ↣ϔϾ㒧⚍ᣛᅮњᇍᅲ՟ⱘᶤϾሲᗻ˄attribute˅ⱘ⌟䆩ˈ
ᑊϨ䆹㒧⚍ⱘ↣ϔϾৢ㒻ߚᬃᇍᑨѢ䆹ሲᗻⱘϔϾৃ㛑ؐDŽߚ㉏ᅲ՟ⱘᮍ⊩ᰃҢ䖭ỉᷥ
ⱘḍ㒧⚍ᓔྟˈ⌟䆩䖭Ͼ㒧⚍ᣛᅮⱘሲᗻˈ✊ৢᣝ✻㒭ᅮᅲ՟ⱘ䆹ሲᗻؐᇍᑨⱘᷥᵱ
ϟ⿏ࡼDŽ䖭Ͼ䖛ݡҹᮄ㒧⚍ЎḍⱘᄤᷥϞ䞡DŽ
插图——原书页码:53
ߚ㉏ϔϾḋ՟ⱘᮍ⊩ᰃˈᇚ݊⊓ḍ㒧⚍ᥦ߫ࠄড়䗖ⱘᄤ㒧⚍ˈ✊ৢ䖨ಲϢ䖭Ͼᄤ㒧⚍݇㘨ⱘߚ㉏
˄ᴀ՟ЁЎ Yes No˅DŽ䖭ỉއㄪᷥḍ⇨ߚ㉏Ā᯳ᳳ݁Ϟजᰃ৺䗖ড়ᠧ㔥⧗āDŽ
3-1 ⬏ߎњϔỉൟⱘᄺдࠄⱘއㄪᷥDŽ䖭ỉއㄪᷥḍ⇨ᚙ㉏ߚމĀ᯳ᳳ݁
Ϟजᰃ৺䗖ড়ᠧ㔥⧗āDŽ՟བˈϟ䴶ⱘᅲ՟˖
ᇚ㹿⊓ⴔ䖭ỉއㄪᷥⱘ᳔Ꮊߚᬃϟᥦ߫ˈ㗠㹿䆘ᅮЎড՟˄гህᰃ䖭ỉᷥ乘⌟䖭Ͼ
ᅲ՟ PlayTennis=No˅DŽ䖭ỉᷥҹঞ㸼 3-2 Ё⫼ᴹⓨ⼎ ID3 ᄺдㅫ⊩ⱘ՟ᄤᨬ㞾˄Quinlan
1986˅DŽ
䗮ᐌއㄪᷥҷ㸼ᅲ՟ሲᗻؐ㑺ᴳⱘড়প˄conjunction˅ⱘᵤপᓣ˄disjunction˅DŽҢ
ᷥḍࠄᷥⱘ↣ϔᴵ䏃ᕘᇍᑨϔ㒘ሲᗻ⌟䆩ⱘড়পˈᷥᴀ䑿ᇍᑨ䖭ѯড়পⱘᵤপDŽ՟བˈ
3-1 㸼⼎ⱘއㄪᷥᇍᑨѢҹϟ㸼䖒ᓣ˖
˄Outlook=Sunny Humidity=Normal˅
˄Outlook=Overcast˅
˄Outlook=Rain Wind=Weak˅
3.3 ߩㆌṇᆜҖⲺ䘸⭞䰤从
ሑㅵᏆ㒣ᓔথⱘ⾡⾡އㄪᷥᄺдㅫ⊩᳝䖭ḋ䙷ḋϡϔ㟈ⱘ㛑㽕∖ˈ䗮ᐌއ
ㄪᷥᄺд᳔䗖ড়᳝ҹϟ⡍ᕕⱘ䯂乬˖
z ᅲ՟ᰃ⬅Āሲᗻ-ؐāᇍ˄pair˅㸼⼎ⱘDŽᅲ՟ᰃ⫼ϔ㋏߫ᅮⱘሲᗻ˄՟བˈ
Temperature˅ᅗӀⱘؐ˄՟བˈHot˅ᴹᦣ䗄ⱘDŽ᳔ㅔऩⱘއㄪᷥᄺдЁˈ↣
ϔϾሲᗻপᇥ᭄ⱘߚ⾏ⱘؐ˄՟བˈHotǃMildǃCold˅DŽ✊㗠ˈᠽሩⱘㅫ⊩˄
3.7.2 㡖Ё䅼䆎˅гܕ䆌໘⧚ؐඳЎᅲ᭄ⱘሲᗻ˄՟བˈ᭄ᄫ㸼⼎ⱘ⏽ᑺ˅DŽ
z Ⳃᷛߑ᭄᳝⾏ᬷⱘ䕧ߎؐDŽ 3-1 ⱘއㄪᷥ㒭↣Ͼᅲ՟䌟ќϔϾᏗᇨൟⱘߚ㉏
˄՟བˈyes no˅DŽއㄪᷥᮍ⊩ᕜᆍᯧᠽሩࠄᄺд᳝ϸϾҹϞ䕧ߎؐⱘߑ᭄DŽ
ϔ⾡ᔎ᳝ⱘᠽሩㅫ⊩ܕ䆌ᄺд᳝ᅲ᭄ؐ䕧ߎⱘߑ᭄ˈሑㅵއㄪᷥ䖭⾡
ᚙމϟⱘᑨ⫼ϡᐌ㾕DŽ
z ৃ㛑䳔㽕ᵤপⱘᦣ䗄˄disjunctive description˅DŽབϞ䴶ᣛߎⱘˈއㄪᷥᕜ㞾✊
ഄҷ㸼њᵤপ㸼䖒ᓣDŽ
z 䆁㒗᭄ৃҹࣙ䫭䇃DŽއㄪᷥᄺдᇍ䫭䇃᳝ᕜདⱘ剕Ầᗻˈ᮴䆎ᰃ䆁㒗ḋ՟
᠔ሲⱘߚ㉏䫭䇃䖬ᰃᦣ䗄䖭ѯḋ՟ⱘሲᗻؐ䫭䇃DŽ
z 䆁㒗᭄ৃҹࣙ㔎ᇥሲᗻؐⱘᅲ՟DŽއㄪᷥᄺд⫮㟇ৃҹ᳝ⶹሲᗻؐⱘ
䆁㒗ḋ՟ЁՓ⫼˄՟བˈҙ᳝ϔ䚼ߚ䆁㒗ḋ՟ⶹ䘧ᔧⱘᑺ˅DŽ䖭Ͼ䯂乬ᇚ
3.7.4 ᇣ㡖Ё䅼䆎DŽ
Ꮖ㒣থ⦄ᕜᅲ䰙ⱘ䯂乬ヺড়䖭ѯ⡍ᕕˈ᠔ҹއㄪᷥᄺдᏆ㒣㹿ᑨ⫼ࠄᕜ䯂乬
ЁDŽ՟བḍ⮒⮙ߚ㉏ᙷ㗙˗ḍ䍋ߚ㉏䆒ᬙ䱰˗ḍᢪᬃҬⱘৃ㛑ᗻߚ㉏䌋ℒ
⬇䇋DŽᇍѢ䖭ѯ䯂乬ˈḌᖗӏࡵ䛑ᰃ㽕ᡞḋ՟ߚ㉏ࠄৃ㛑ⱘ⾏ᬷؐᇍᑨⱘ㉏߿
˄category˅Ёˈℸ㒣ᐌ㹿⿄Ўߚ㉏䯂乬˄Classification Problem˅DŽ
3.4 ะᵢⲺߩㆌṇᆜҖ㇍⌋
᭄Ꮖᓔথⱘއㄪᷥᄺдㅫ⊩ᰃϔ⾡Ḍᖗㅫ⊩ⱘবԧDŽ䆹ㅫ⊩䞛⫼㞾乊ϟⱘ䋾
ှ᧰㋶䘡ग़ৃ㛑ⱘއㄪᷥぎ䯈DŽ䖭⾡ᮍ⊩ᰃ ID3 ㅫ⊩˄Quinlan 1986˅ৢ㒻ⱘ C4.5
ㅫ⊩˄Quinlan 1993˅ⱘ⸔ˈгᰃ䖭䞠䅼䆎ⱘ䞡⚍DŽ䖭ϔ㡖ᇚ㒭ߎއㄪᷥᄺдⱘᴀ
ㅫ⊩ˈ㟈ⳌᔧѢ ID3 ㅫ⊩DŽ 3.7 㡖៥Ӏ㗗㰥䆹ᴀㅫ⊩ⱘϔѯᠽሩˈࣙᣀ㹿ড়ᑊࠄ
C4.5 ⱘᠽሩ݊Ҫϔѯ䕗ᮄⱘއㄪᷥᄺдㅫ⊩DŽ
ID3 ᰃϔ⾡㞾乊ϟ䭓ᷥⱘ䋾ှㅫ⊩ˈ↣Ͼ㒧⚍䗝প㛑᳔དഄߚ㉏ḋ՟ⱘሲᗻDŽ㒻㓁䖭Ͼ䖛Ⳉ
ࠄ䖭ỉᷥ㛑ᅠ㕢ߚ㉏䆁㒗ḋ՟ˈ᠔᳝ⱘሲᗻ䛑Փ⫼䖛њDŽ
ID3(ExamplesˈTarget_attributeˈAttributes)
Examples े䆁㒗ḋ՟䲚DŽTarget_attribute ᰃ䖭ỉᷥ㽕乘⌟ⱘⳂᷛሲᗻDŽAttributes
ᰃ䰸Ⳃᷛሲᗻկᄺдࠄⱘއㄪᷥ⌟䆩ⱘሲᗻ߫㸼DŽ䖨ಲ㛑ℷ⹂ߚ㉏㒭ᅮ
Examples ⱘއㄪᷥDŽ
z ߯ᓎᷥⱘ Root 㒧⚍
z བᵰ Examples 䛑Ўℷˈ䙷М䖨ಲ label =+ ⱘऩ㒧⚍ᷥ Root
z བᵰ Examples 䛑Ўডˈ䙷М䖨ಲ label =- ⱘऩ㒧⚍ᷥ Root
z བᵰ Attributes Ўぎˈ䙷М䖨ಲऩ㒧⚍ᷥ Rootˈlabel=Examples Ё᳔᱂䘡ⱘ
Target_attribute ؐ
z ৺߭
z AĕAttributes Ёߚ㉏ Examples 㛑᳔ད*ⱘሲᗻ
z Root ⱘއㄪሲᗻĕA
z ᇍѢAⱘ↣Ͼৃ㛑ؐvi
z RootϟࡴϔϾᮄⱘߚᬃᇍᑨ⌟䆩A= vi
z Ҹ Examplesvi ЎExamplesЁ⒵䎇AሲᗻؐЎviⱘᄤ䲚
z བᵰ Examplesvi Ўぎ
z 䖭ϾᮄߚᬃϟࡴϔϾᄤ㒧⚍ˈ㒧⚍ⱘ label=Examples
Ё᳔᱂䘡ⱘ Target_attribute ؐ
z ৺߭䖭ϾᮄߚᬃϟࡴϔϾᄤᷥ ID3˄ Examplesvi ,
Target_attribute, Attributes-{A}˅
z 㒧ᴳ
z 䖨ಲ Root
3.4.1 ଠѠኔᙝᱥᴶ֩Ⲻ࠼㊱ኔᙝϋ
ID3 ㅫ⊩ⱘḌᖗ䯂乬ᰃ䗝পᷥⱘ↣Ͼ㒧⚍㽕⌟䆩ⱘሲᗻDŽ៥ӀᏠᳯ䗝ᢽⱘᰃ᳔᳝
ࡽѢߚ㉏ᅲ՟ⱘሲᗻDŽ䙷М㸵䞣ሲᗻӋؐⱘϔϾདⱘᅮ䞣ᷛޚᰃҔМਸ਼˛䖭䞠ᇚᅮНϔ
Ͼ㒳䅵ሲᗻˈ⿄ЎĀֵᙃⲞ˄information gain˅
āˈ⫼ᴹ㸵䞣㒭ᅮⱘሲᗻऎߚ䆁㒗ḋ՟
ⱘ㛑DŽID3 ㅫ⊩䭓ᷥⱘ↣ϔℹՓ⫼䖭ϾֵᙃⲞᷛޚҢ䗝ሲᗻЁ䗝ᢽሲᗻDŽ
3.4.1.1 ⭞⟫ᓜ䠅ṭׁⲺൽжᙝ
Ўњ㊒⹂ഄᅮНֵᙃⲞˈ៥ӀܜᅮНֵᙃ䆎Ёᑓ⊯Փ⫼ⱘϔϾᑺ䞣ᷛ⿄ˈޚЎ➉
˄entropy˅
ˈᅗࠏ⬏њӏᛣḋ՟䲚ⱘ㒃ᑺ˄purity˅DŽ㒭ᅮࣙ݇ѢᶤϾⳂᷛὖᗉⱘℷড
ḋ՟ⱘḋ՟䲚 Sˈ䙷М S Ⳍᇍ䖭ϾᏗᇨൟߚ㉏ⱘ➉Ў˖
݊ЁpᰃSЁℷ՟ⱘ↨՟ˈpᰃSЁ䋳՟ⱘ↨՟DŽ᳝݇➉ⱘ᠔᳝䅵ㅫЁ៥Ӏᅮ
Н 0log0 Ў 0DŽ
=0.940 ˄3.2˅
⊼ᛣˈབᵰSⱘ᠔᳝៤ਬሲѢৠϔ㉏ˈ䙷МSⱘ➉Ў 0DŽ՟བˈབᵰ᠔᳝ⱘ៤ਬᰃℷ
ⱘ ˄ p=1 ˅ ˈ 䙷 М p ህ ᰃ 0 ˈ Ѣ ᰃ Entropy(S) =
1 log 2 (1) (0) log 2 (0) 1 0 0 log 2 0 0 DŽˈᔧ䲚ড়Ёℷডḋ՟ⱘ᭄䞣
Ⳍㄝᯊ➉Ў 1DŽབᵰ䲚ড়Ёℷড՟ⱘ᭄䞣ϡㄝᯊˈ➉ҟѢ 0 1 П䯈DŽ 3-2 ᰒ⼎њ݇
ѢᶤᏗᇨߚ㉏ⱘ➉ߑ᭄䱣ⴔpҢ 0 ࠄ 1 ব࣪ⱘ᳆㒓DŽ
插图——原书页码:57
3-2 ݇ѢᶤᏗᇨߚ㉏ⱘⱘ➉ߑ᭄
Ё⬏ߎњ䱣ⴔℷ՟᠔ऴ↨՟pҢ 0 ࠄ 1ˈ➉ߑ᭄ব࣪ⱘ᳆㒓DŽ
ֵᙃ䆎Ё➉ⱘϔ⾡㾷䞞ᰃˈ➉⹂ᅮњ㽕㓪ⷕ䲚ড় S Ёӏᛣ៤ਬ˄ेҹഛࣔⱘὖ⥛䱣
ᴎᢑߎⱘϔϾ៤ਬ˅ⱘߚ㉏᠔䳔㽕ⱘ᳔ᇥѠ䖯ࠊԡ᭄DŽВ՟ᴹ䇈ˈབᵰ p ᰃ 1ˈᬊ
㗙ⶹ䘧ᢑߎⱘḋ՟ᖙЎℷˈ᠔ҹϡᖙথӏԩ⍜ᙃˈℸᯊⱘ➉Ў 0DŽϔᮍ䴶ˈབᵰ p ᰃ
0.5ˈᖙ乏⫼ϔϾѠ䖯ࠊԡᴹ䇈ᯢᢑߎⱘḋ՟ᰃℷ䖬ᰃ䋳DŽབᵰ p ᰃ 0.8ˈ䙷Мᇍ᠔䳔
ⱘ⍜ᙃ㓪ⷕᮍ⊩ᰃ䌟㒭ℷ՟䲚ড়䕗ⷁⱘ㓪ⷕˈৃ㛑ᗻ䕗ᇣⱘড՟䲚ড়䕗䭓ⱘ㓪ⷕˈᑇഛ
↣ᴵ⍜ᙃⱘ㓪ⷕᇥѢ 1 ϾѠ䖯ࠊԡDŽ
㟇ℸ៥Ӏ䅼䆎њⳂᷛߚ㉏ᰃᏗᇨൟⱘᚙމϟⱘ➉DŽϔ㠀ⱘˈབᵰⳂᷛሲᗻ᳝ c
Ͼϡৠⱘؐˈ䙷М S ⳌᇍѢ c Ͼ⢊ᗕ˄c-wise˅ⱘߚ㉏ⱘ➉ᅮНЎ˖
c
Entropy ( S ) { ¦ pi log 2 pi (3.3)
i 1
݊ЁpiᰃSЁሲѢ㉏߿iⱘ↨՟DŽ䇋⊼ᛣᇍ᭄ⱘᑩ᭄ҡ✊Ў 2ˈॳᰃ➉ᰃҹӂ䘑ԡ
ⱘϾ᭄ᴹᑺ䞣㓪ⷕ䭓ᑺⱘDŽৠᯊ⊼ᛣབᵰⳂᷛሲᗻ᳝cϾৃ㛑ؐˈ䙷М➉᳔ৃ㛑ࠄ
log2cDŽ
3.4.1.2 ⭞ؗᚥ໔ⴀᓜ䠅ᵕᵑⲺ⟫䲃ք
Ꮖ㒣᳝њ➉Ў㸵䞣䆁㒗ḋ՟䲚ড়㒃ᑺⱘᷛ⦄ˈޚৃҹᅮНሲᗻߚ㉏䆁㒗᭄ⱘ
ᬜⱘᑺ䞣ᷛޚDŽ䖭Ͼᷛޚ㹿⿄ЎĀֵᙃⲞ˄information gain˅
āDŽㅔऩⱘ䇈ˈϔϾሲ
ᗻⱘֵᙃⲞህᰃ⬅ѢՓ⫼䖭Ͼሲᗻߚࡆḋ՟㗠ᇐ㟈ⱘᳳᳯ➉䰡ԢDŽ㊒⹂ഄ䆆ˈϔϾ
ሲᗻ A Ⳍᇍḋ՟䲚ড় S ⱘֵᙃⲞ Gain(S,A)㹿ᅮНЎ
| Sv |
Gain( S , A) { Entropy ( S ) ¦
vValues ( A ) | S |
Entropy ( S v ) ˄3.4˅
݊Ё Values(A)ᰃሲᗻA᠔᳝ৃ㛑ؐⱘ䲚ড়ˈS v ᰃSЁሲᗻAⱘؐЎvⱘᄤ䲚˄гህᰃˈ
S v ={sS|A(s)=v}˅DŽ䇋⊼ᛣˈㄝᓣ˄3.4˅ⱘϔ乍ህᰃॳᴹ䲚ড়Sⱘ➉ˈѠ乍ᰃ⫼A
ߚ㉏Sৢ➉ⱘᳳᳯؐDŽ䖭ϾѠ乍ᦣ䗄ⱘᳳᳯ➉ህᰃ↣Ͼᄤ䲚ⱘ➉ⱘࡴᴗˈᴗؐЎሲ
| Sv |
ѢSvⱘḋ՟ऴॳྟḋ՟Sⱘ↨՟ DŽ᠔ҹGain(S,A)ᰃ⬅Ѣⶹ䘧ሲᗻAⱘؐ㗠ᇐ㟈ⱘᳳ
|S|
ᳯ➉ޣᇥDŽᤶহ䆱ᴹ䆆ˈGain(S,A)ᰃ⬅Ѣ㒭ᅮሲᗻAⱘؐ㗠ᕫࠄⱘ݇ѢⳂᷛߑ᭄ؐⱘֵ
ᙃDŽᔧᇍSⱘϔϾӏᛣ៤ਬⱘⳂᷛؐ㓪ⷕᯊˈGain(S,A)ⱘؐᰃⶹ䘧ሲᗻAⱘؐৢৃҹ
㡖ⳕⱘѠ䖯ࠊԡ᭄DŽ
Values(Wind) Weak,Strong
S [9,5-]
SWeak m [6,2]
S Strong m [3,3]
| Sv |
Gain( S ,Wind ) Entropy ( S ) ¦
v{Weak , Strong } | S |
Entropy ( S v )
插图——原书页码:59
Which attribute is the best classifier? ાϔϾሲᗻᰃ᳔Շⱘߚ㉏ሲᗻ˛
3-3 䅵ㅫሲᗻⱘֵᙃⲞ
3.4.2 ⽰ׁ
Gain(S,Outlook)=0.246
Gain(S,Humidity)=0.151
Gain(S,Wind)=0.048
Gain(S,Temperature)=0.029
ᇍѢ䴲㒜ッⱘৢ㒻㒧⚍ˈݡ䞡ࠡ䴶ⱘ䖛䗝ᢽϔϾᮄⱘሲᗻᴹߚࡆ䆁㒗ḋ՟ˈ䖭
ϔҙՓ⫼Ϣ䖭Ͼ㒧⚍݇㘨ⱘ䆁㒗ḋ՟DŽᏆ㒣㹿ᬊ㓪ܹᷥⱘ䕗催㒧⚍ⱘሲᗻ㹿ᥦ䰸
ˈҹ֓ӏԩ㒭ᅮⱘሲᗻᷥⱘӏᛣ䏃ᕘϞ᳔ҙߎ⦄ϔDŽᇍѢ↣ϔϾᮄⱘᄤ㒧⚍
㒻㓁䖭Ͼ䖛ˈⳈࠄ⒵䎇ҹϟϸϾᴵӊЁⱘӏϔϾ˖˄1˅᠔᳝ⱘሲᗻᏆ㒣㹿䖭ᴵ䏃ᕘࣙ
ᣀˈ˄2˅Ϣ䖭Ͼ㒧⚍݇㘨ⱘ᠔᳝䆁㒗ḋ՟䛑᳝ৠḋⱘⳂᷛሲᗻؐ˄гህᰃᅗӀⱘ
➉Ў 0˅DŽ 3-4 ߫ߎњϟϔℹ䭓ᷥ㽕䅵ㅫⱘֵᙃⲞDŽҢ㸼 3-2 ⱘ 14 Ͼ䆁㒗ḋ՟䗮
䖛 ID3 ㅫ⊩ᕫࠄⱘ᳔㒜އㄪᷥ㹿⬏ 3-1 ЁDŽ
插图——原书页码:61
3.5 ߩㆌṇᆜҖѣⲺٽ䇴グ䰪ᩒ㍘
Ϣ݊Ҫⱘᔦ㒇ᄺдㅫ⊩ϔḋˈID3 ㅫ⊩ৃҹ㹿ᦣ䗄ЎҢϔϾ؛䆒ぎ䯈Ё᧰㋶ϔϾᢳ
ড়䆁㒗ḋ՟ⱘ؛䆒DŽ㹿 ID3 ㅫ⊩᧰㋶ⱘ؛䆒ぎ䯈ህᰃৃ㛑ⱘއㄪᷥⱘ䲚ড়DŽID3 ㅫ⊩ҹ
ϔ⾡Ңㅔऩࠄᴖⱘ⠀ቅㅫ⊩䘡ग़䖭Ͼ؛䆒ぎ䯈ˈҢぎⱘᷥᓔྟˈ✊ৢ䗤ℹ㗗㰥ࡴ
ᴖⱘ؛䆒ˈⳂⱘᰃ᧰㋶ࠄϔϾℷ⹂ߚ㉏䆁㒗᭄ⱘއㄪᷥDŽᓩᇐ䖭⾡⠀ቅ᧰㋶ⱘ䆘Ԅߑ
᭄ᰃֵᙃⲞᑺ䞣DŽ 3-5 ᦣ䗄њ䖭⾡᧰㋶DŽ
插图——原书页码:62
ID3 䘡ग़ৃ㛑އㄪᷥⱘぎ䯈ˈҢ᳔ㅔऩⱘᷥࠄ䗤⏤ᴖⱘᷥDŽ݊᧰㋶⬅ֵᙃⲞਃথᓣ㾘߭ᓩᇐDŽ
3.6 ߩㆌṇᆜҖⲺᖈ㓩څ㖤
ID3 ㅫ⊩Ң㾖⌟ࠄⱘ䆁㒗᭄⊯࣪ҹߚ㉏㾕ᅲ՟ⱘㄪ⬹ᰃҔМਸ਼˛ᤶহ䆱䇈ˈᅗ
ⱘᔦ㒇أ㕂ᰃҔМ˛ಲᖚ 2 ゴЁˈᔦ㒇أ㕂ᰃϔ㋏߫ࠡᦤˈ䖭ѯࠡᦤϢ䆁㒗᭄ϔ䍋
ⓨ㒢䆎䆕ᴹᅲ՟ⱘߚ㉏DŽ
བᵰ㒭ᅮϔϾ䆁㒗ḋ՟ⱘ䲚ড়ˈ䙷М䗮ᐌ᳝ᕜއㄪᷥϢ䖭ѯḋ՟ϔ㟈DŽ᠔ҹˈ㽕
ᦣ䗄 ID3 ㅫ⊩ⱘᔦ㒇أ㕂ˈᑨᡒࠄᅗҢ᠔᳝ϔ㟈ⱘ؛䆒Ё䗝ᢽϔϾⱘḍDŽID3 Ң䖭ѯ
އㄪᷥЁ䗝ᢽાϔϾਸ਼˛ᅗ䗝ᢽՓ⫼ㅔऩࠄᴖⱘ⠀ቅㅫ⊩䘡ग़ৃ㛑ⱘᷥぎ䯈ᯊ䘛
ࠄⱘϔϾৃফⱘᷥDŽὖ⬹ഄ䆆ˈID3 ⱘ᧰㋶ㄪ⬹Ў˄a˅Ӭܜ䗝ᢽ䕗ⷁⱘᷥ㗠ϡᰃ
䕗䭓ⱘˈ˄b˅䗝ᢽ䙷ѯֵᙃⲞ催ⱘሲᗻ⾏ḍ㒧⚍䕗䖥ⱘᷥDŽ ID3 ЁՓ⫼ⱘ䗝ᢽ
ሲᗻⱘਃথᓣ㾘߭ᅗ䘛ࠄⱘ⡍ᅮ䆁㒗ḋ՟П䯈ᄬⴔᖂⱘⳌѦ⫼ˈ⬅Ѣ䖭ϔ⚍ˈ
ᕜ䲒⹂ޚഄࠏߦߎ ID3 ⱘᔦ㒇أ㕂DŽ✊㗠៥Ӏৃҹ䖥Ԑഄᡞᅗⱘᔦ㒇أ㕂ᦣ䗄Ўϔ⾡
ᇍⷁⱘއㄪᷥⱘأདDŽ
ID3 ᔦ㒇أ㕂ⱘ䌈ߛ䖥Ԑ˖䕗ⷁⱘᷥ↨䕗䭓ⱘᕫࠄӬܜDŽ䙷ѯֵᙃⲞ催ⱘሲᗻ
䴴䖥ḍ㒧⚍ⱘᷥᕫࠄӬܜDŽ
3.6.1 䲆ᇐڅ㖤ૂՎ䘿څ㖤
ㅔऩഄ䆆ˈID3 ⱘᔦ㒇أ㕂ᴹ㞾ᅗⱘᩒ㍘ㆌ⮛ˈ㗠䗝⍜䰸ㅫ⊩ⱘᔦ㒇أ㕂ᴹ㞾ᅗ
ᇍᩒ㍘グ䰪ⱘᅮНDŽ
ID3 ⱘᔦ㒇أ㕂ᰃᇍᶤ⾡؛䆒˄՟བˈᇍѢ䕗ⷁⱘ؛䆒˅㚰䖛݊Ҫ؛䆒ⱘϔ⾡Վ䘿
δpreferenceε
ˈᅗᇍ᳔㒜ৃ߫Вⱘ؛䆒≵᳝⹀ᗻ䰤ࠊȾ䖭⾡㉏ൟⱘأ㕂䗮ᐌ㹿⿄ЎՎ䘿
څ㖤δpreference biasε
˄িᩒ㍘څ㖤δsearch biasε˅DŽⳌডˈ䗝⍜䰸ㅫ⊩ⱘأ㕂ᰃᇍ
ᕙ㗗㰥؛䆒ⱘϔ⾡䲆ᇐ˄restriction˅ DŽ䖭⾡ᔶᓣⱘأ㕂䗮ᐌ㹿⿄Ў䲆ᇐڅ㖤˄㗙ি䈣
䀶څ㖤˄language bias˅ ˅DŽ
བᵰ䳔㽕ᶤ⾡ᔶᓣⱘᔦ㒇أ㕂ᴹҢ䆁㒗᭄Ё⊯࣪˄㾕 2 ゴ˅ˈ䙷М៥Ӏ䆹Ӭܜ
㗗㰥ા⾡ᔶᓣⱘᔦ㒇أ㕂ਸ਼˖ᰃӬ䗝أ㕂䖬ᰃ䰤ᅮأ㕂˛
䗮ᐌˈӬ䗝أ㕂↨䰤ᅮأ㕂ড়Т䳔㽕ˈЎᅗܕ䆌ᄺд఼Ꮉᅠᭈⱘ؛䆒ぎ䯈
Ϟˈ䖭ֱ䆕њⶹⱘⳂᷛߑ᭄㹿ࣙݙDŽⳌডⱘˈ䰤ᅮأ㕂ϹḐഄ䰤ࠊњ؛䆒䲚ড়ⱘ
┰ぎ䯈ˈ䗮ᐌϡᰃ៥ӀᏠᳯⱘˈЎᅗৠᯊᓩܹњᡞⶹⱘⳂᷛߑ᭄ᥦ䰸ⱘৃ㛑
ᗻDŽ
䡈Ѣ ID3 䞛⫼㒃㊍ⱘӬ䗝أ㕂㗠䗝⍜䰸ㅫ⊩䞛⫼㒃㊍ⱘ䰤ᅮأ㕂ˈϔѯᄺд㋏
㒳㓐ড়њ䖭ϸ㗙DŽ՟བˈ㗗㰥 1 ゴᦣ䗄ⱘϟẟᑣⱘ՟ᄤDŽ݊Ёˈᄺдࠄⱘ䆘Ԅߑ᭄
㹿㸼⼎ЎϔѯᅮⱘẟⲬ⡍ᕕⱘ㒓ᗻ㒘ড়ˈᄺдㅫ⊩䇗ᭈ䖭Ͼ㒓ᗻ㒘ড়ⱘখ᭄ᴹ᳔དഄ
ᢳড়⦄᳝ⱘ䆁㒗᭄DŽ䖭䞠ˈՓ⫼㒓ᗻߑ᭄ᴹ㸼⼎䆘Ԅߑ᭄ⱘއᅮህᓩܹњ䰤ᅮأ㕂˄䴲
㒓ᗻⱘ䆘Ԅߑ᭄ϡৃ㛑㹿㸼⼎៤䖭⾡ᔶᓣ˅DŽৠᯊˈ䗝ᢽ⡍ᅮখ᭄ⱘ䇗ᭈᮍ⊩˄LMS ㅫ
⊩˅ᓩܹњϔϾӬ䗝أ㕂ˈᅗ⑤㞾᠔᳝ৃ㛑খ᭄ؐぎ䯈Ϟⱘ乎ᑣ᧰㋶DŽ
3.6.2 ѰӶѾՎٽⲺ⸣ݾ䇴ϋ
ID3 ㅫ⊩ЁӬ䗝䕗ⷁއㄪᷥⱘᔦ㒇أ㕂ˈᰃϡᰃҢ䆁㒗᭄Ё⊯࣪ⱘৃ䴴⸔˛
ᄺᆊӀҹঞ݊Ҫᄺ㗙Ꮖ㒣ᇍ䖭ḋⱘ䯂乬ѝ䆎ϾϪ㑾њˈ㗠Ϩ䖭Ͼѝ䆎㟇Ҟ䖬㾷އDŽ
࿕ᒝg༹ഢྚ㑺 1320 ᑈᦤߎ㉏Ԑⱘ䆎⚍ķˈᰃ᳔ᮽ䅼䆎䖭Ͼ䯂乬ⱘҎПϔˈ᠔ҹ䖭
Ͼأ㕂㒣ᐌ㹿⿄ЎĀ༹ഢྚࠗߔā˄Occam’s razor˅DŽ
༹ഢྚࠗߔ˖Ӭܜ䗝ᢽᢳড়᭄ⱘ᳔ㅔऩ؛䆒DŽ
ᔧ✊㒭ߎϔϾᔦ㒇أ㕂ⱘৡᄫϡㄝѢ䆕ᯢњᅗDŽЎҔМᑨ䆹Ӭܜ䗝ᢽ䕗ㅔऩⱘ؛䆒
ਸ਼˛䇋⊼ᛣ⾥ᄺᆊӀ᳝ᯊԐТг䙉ᕾ䖭Ͼᔦ㒇أ㕂DŽ՟བ⠽⧚ᄺᆊӬܜ䗝ᢽ㸠᯳䖤ࡼㅔ
ऩⱘ㾷䞞ˈ㗠ϡ⫼ᴖⱘ㾷䞞DŽЎҔМ˛ϔ⾡㾷䞞ᰃⷁ؛䆒ⱘ᭄䞣ᇥѢ䭓؛䆒˄Ѣㅔ
ऩⱘখ᭄㒘ড়˅ˈ᠔ҹᡒࠄϔϾⷁⱘ؛䆒ԚৠᯊᅗϢ䆁㒗᭄ᢳড়ⱘৃ㛑ᗻ䕗ᇣDŽⳌডˈ
ᐌᐌ᳝ᕜ䴲ᐌᴖⱘ؛䆒ᢳড়ᔧࠡⱘ䆁㒗᭄ˈԚै᮴⊩ℷ⹂ഄ⊯࣪ࠄৢᴹⱘ᭄DŽ
՟བ㗗㰥އㄪᷥ؛䆒DŽ500 Ͼ㒧⚍ⱘއㄪᷥ↨ 5 Ͼ㒧⚍ⱘއㄪᷥᕫDŽབᵰ㒭ᅮϔϾ
20 Ͼ䆁㒗ḋ՟ⱘ䲚ড়ˈৃҹ乘ᳳ㛑ᡒࠄᕜ 500 Ͼ㒧⚍ⱘއㄪᷥϢ䆁㒗᭄ϔ㟈ˈ
㗠བᵰϔϾ 5 㒧⚍ⱘއㄪᷥৃҹᅠ㕢ഄᢳড়䖭ѯ᭄߭ᰃߎТᛣⱘDŽ᠔ҹ៥ӀӮⳌֵ
5 Ͼ㒧⚍ⱘᷥϡৃ㛑ᰃ㒳䅵Ꮋড়ˈ㗠Ӭܜ䗝ᢽ䖭Ͼ؛䆒ˈ㗠ϡ䗝ᢽ 500 Ͼ㒧⚍ⱘDŽ
ḍ⏅ܹⱘߚᵤˈৃҹথ⦄Ϟ䴶ⱘ㾷䞞᳝ϔϾЏ㽕ⱘೄ䲒DŽЎҔМ៥Ӏϡড䯂˖
Փ⫼ৠḋⱘ⧚ˈᑨ䆹Ӭܜ䗝ᢽࣙᙄད᳝ 17 Ͼᄤ㒧⚍ 11 Ͼ䴲ᄤ㒧⚍ⱘއㄪ
ᷥ˛䖭ỉᷥḍ㒧⚍Փ⫼އㄪሲᗻA1ˈ✊ৢҹ᭄ᄫ乎ᑣ⌟䆩ሲᗻA2ⳈࠄA11DŽ䖭ḋⱘއ
ㄪᷥⳌᔧᇥˈℸ˄⫼Ϟ䴶ৠḋⱘ⧚˅ˈᡒࠄ݊ЁПϔϢӏᛣ᭄䲚ϔ㟈ⱘܜ偠ৃ
㛑ᗻгᕜᇣDŽ䖭䞠ⱘೄ䲒ѢৃҹᅮНᕜᇣⱘ؛䆒䲚ড়üü݊Ёⱘ᭄Ⳍᔧ⍽䲒
㾷DŽ䙷Мˈ៥ӀḍҔМⳌֵ᳝ⷁᦣ䗄˄short description˅ⱘއㄪᷥ㒘៤ⱘᇣ؛䆒䲚ড়
ህ↨݊ҪӫৃᅮНⱘᇣ؛䆒䲚ড়䗖ᔧਸ਼˛
Ϟ䴶ⱘ༹ഢྚࠗߔॳ߭ⱘ㾷䞞ⱘѠϾ䲒乬ᰃˈ؛䆒ⱘᇣᰃ⬅ᄺд㗙ݙ ݙ䚼Փ⫼ⱘ
⡍ᅮ㸼⼎އᅮⱘDŽ᠔ҹϸϾᄺд఼Փ⫼ϡৠⱘݙ䚼㸼⼎Ӯᕫࠄϡৠⱘ؛䆒ˈϸ㗙জ䛑⫼
༹ഢྚࠗߔॳ߭ᕫࠄⳌѦⳒⱘ㒧䆎ʽ՟བˈབᵰ៥ӀᅮНሲᗻ XYZˈᅗᇍѢ㹿 3-1
ⱘއㄪᷥߚ㉏Ўℷ՟ⱘᅲ՟ㄝѢⳳˈⳌডЎˈ؛䙷МϔϾᄺд఼ህৃҹᡞ 3-1 Ёއㄪ
ᷥ㸼⼎ⱘߑ᭄㸼⼎Ўা᳝ϔϾއㄪ㒧⚍ⱘᷥDŽѢᰃˈϸϾᄺд఼བᵰϔϾՓ⫼њ XYZ
ሲᗻᦣ䗄ᅗⱘᅲ՟ˈ㗠ϔϾাՓ⫼ OutlookǃTemperatureǃHumidity Wind ሲᗻˈԚ
䛑ᑨ⫼༹ഢྚࠗߔॳ߭ˈ䙷М㒧ᵰᅗӀӮҹϡৠⱘᮍᓣ⊯࣪DŽ
ҹϞ䇈ᯢˈᇍѢৠϔ༫䆁㒗ḋ՟ˈᔧϸϾᄺд఼ҹϡৠݙ䚼㸼⼎ᮍᓣ⧚㾷Փ⫼䖭
ѯḋ՟ᯊˈӮѻ⫳ϸϾϡৠⱘ؛䆒DŽѢ䖭ϔ⚍ˈԐТ៥Ӏᑨᅠܼᢉࠊ༹ഢྚࠗߔॳ߭DŽ
ϡ䖛ˈ䅽៥Ӏⳟϔⳟϟ䴶䖭Ͼഎ᱃ˈᑊߚᵤાϔϾݙ䚼㸼⼎ӮҢ㞾✊䗝ᢽ䖯࣪Ё㜅乪
㗠ߎDŽᛇ䈵ϔϾ⬅Ҏ䗴ⱘᄺд agent 㒘៤ⱘ㕸ԧˈ䖭Ͼ㕸ԧᰃ⬅ᢳⱘ䖯࣪䖛ѻ⫳ⱘˈ
䖯࣪䖛ࣙᣀ agent ⱘ㐕Ⅺǃবᓖ㞾✊䗝ᢽDŽ؛ᅮ䖭Ͼ䖯࣪䖛㛑ϔҷϔҷഄᬍ
ব䖭ѯ agent ⱘᛳⶹ㋏㒳ˈ⬅ℸᬍবᅗӀ⫼ᴹᛳⶹϪ⬠ⱘ఼ᅬⱘݙ䚼ሲᗻDŽߎѢ䆎䆕ⱘ
㗗㰥ˈ៥Ӏг؛ᅮ䖭ѯᄺд agent 䞛⫼ϔϾϡӮ㹿䖯࣪᠔ᬍবⱘᅮⱘㅫ⊩˄↨བ ID3˅
DŽ
᳝⧚⬅ᮁˈ䱣ⴔᯊ䯈ⱘ⌕䗱ˈ䖯࣪Ӯѻ⫳དⱘݙ䚼㸼⼎ˈՓ agent 㛑ᛜࡴ៤ࡳഄ⫳
ᄬᅗӀⱘ⦃๗ЁDŽ؛ᅮ agent ⱘ៤ࡳձ䌪Ѣᅗ㊒⹂⊯࣪ⱘ㛑ˈ᠔ҹ៥Ӏৃҹᳳᳯˈ
䖯࣪ѻ⫳ⱘݙ䚼㸼⼎ᇍӏԩᄺдㅫ⊩ᔦ㒇أ㕂䛑᳝ᕜདⱘᗻ㛑DŽབᵰᶤϾ agent ⾡㕸
䞛⫼њᏺ༹᳝ഢྚࠗߔᔦ㒇أ㕂ⱘᄺдㅫ⊩ˈ䙷М៥Ӏᳳᳯ䖯࣪Ӯѻ⫳䗖ড়༹ഢྚࠗߔ
ķ
ᰒ✊ᰃࠂ㚵乏ᯊᛇࠄⱘDŽ
ㄪ⬹ⱘݙ䚼㸼⼎DŽ䖭Ͼ䆎⚍ⱘ㊒傧Ѣˈ䖯࣪ѻ⫳ⱘݙ䚼㸼⼎Փᕫᄺдㅫ⊩ⱘᔦ㒇أ㕂
៤Ў㞾៥ᅲ⦄ⱘ乘㿔˄self-fulfilling prophecy˅ˈাЎᅗᬍবݙ䚼㸼⼎↨ᬍবᄺдㅫ⊩
ᆍᯧDŽ
᱖ᯊˈ៥Ӏᬒϟ݇Ѣ༹ഢྚࠗߔⱘѝ䆎DŽ 6 ゴ៥ӀӮᦤݡ䍋䖭Ͼ䆱乬ˈ䙷䞠ᇚ
䅼䆎᳔ᇣᦣ䗄䭓ᑺ˄Minimum Description Length˅ॳ߭ˈᅗᰃϔ⠜ᴀⱘ༹ഢྚࠗߔˈ
ᅗৃ⫼䋱ᮃḚᶊᴹ㾷䞞DŽ
3.7 ߩㆌṇᆜҖⲺᑮ㿷䰤从
އㄪᷥᄺдⱘᅲ䰙䯂乬ࣙᣀ⹂ᅮއㄪᷥ䭓ⱘ⏅ᑺ˗໘⧚䖲㓁ؐⱘሲᗻ˗䗝ᢽϔϾ
䗖ᔧⱘሲᗻㄯ䗝ᑺ䞣ᷛ˗ޚ໘⧚ሲᗻؐϡᅠᭈⱘ䆁㒗᭄˗໘⧚ϡৠҷӋⱘሲᗻ˗ҹঞ
ᦤ催䅵ㅫᬜ⥛DŽϟ䴶៥Ӏ䅼䆎↣ϔϾ䯂乬ˈᑊ䩜ᇍ䖭ѯ䯂乬ᠽሩᴀⱘ ID3 ㅫ⊩DŽџ
ᅲϞˈЎњ㾷݊އЁ᭄ⱘ䯂乬ˈ ID3 ㅫ⊩Ꮖ㒣㹿ᠽሩњˈᠽሩৢⱘ㋏㒳㹿ᬍৡЎ C4.5
˄Quinlan 1993˅DŽ
3.7.1 䚵ރ䗽ᓜᤕਾδOverfittingεᮦᦤ
㸼 3-1 ᦣ䗄ⱘㅫ⊩䭓ᷥⱘ↣ϔϾߚᬃⱘ⏅ᑺˈⳈࠄᙄད㛑ᇍ䆁㒗ḋ՟ᅠ㕢ഄߚ
㉏DŽ✊㗠䖭Ͼㄪ⬹ᑊ䴲ᘏᰃ㸠ᕫ䗮ⱘˈџᅲϞˈᔧ᭄Ё᳝ాໄˈ䆁㒗ḋ՟ⱘ᭄䞣
ᇥҹ㟇Ѣϡ㛑ѻ⫳Ⳃᷛߑ᭄ⱘ᳝ҷ㸼ᗻⱘ䞛ḋᯊˈ䖭Ͼㄪ⬹֓Ӯ䘛ࠄೄ䲒DŽҹϞӏϔ
⾡ᚙމথ⫳ᯊˈ䖭Ͼㅔऩⱘㅫ⊩ѻ⫳ⱘᷥӮ䖛ᑺᢳড়䆁㒗ḋ՟DŽ
ᇍѢϔϾ؛䆒ˈᔧᄬ݊Ҫⱘ؛䆒ᇍ䆁㒗ḋ՟ⱘᢳড়↨ᅗᏂˈԚџᅲϞᅲ՟ⱘᭈ
ϾߚᏗ˄гህᰃࣙ䆁㒗䲚ড়ҹⱘᅲ՟˅Ϟ㸼⦄ⱘैདᯊˈ៥Ӏ䇈䖭Ͼ؛䆒䖛ᑺᢳ
ড়˄overfit˅䆁㒗ḋ՟DŽ
3-6 ⬏ߎњއㄪᷥᄺдⱘϔϾൟᑨ⫼Ё䖛ᑺᢳড়ⱘᕅડDŽ䖭Ͼ՟ᄤЁˈID3
ㅫ⊩⫼ᴹᄺдાϔϾ⮙Ҏᙷ᳝ᶤ⾡㊪ሓ⮙DŽ䖭ᐙⱘ῾䕈㸼⼎އㄪᷥ߯ᓎ䖛Ёᷥⱘ
㒧⚍ᘏ᭄ˈ㒉䕈㸼⼎އㄪᷥߎⱘ乘⌟ⱘ㊒ᑺDŽᅲ㒓ᰒ⼎އㄪᷥ䆁㒗ḋ՟Ϟⱘ㊒ᑺˈ
㰮㒓ᰒ⼎ϔ༫⣀ゟⱘ⌟䆩ḋ՟˄≵᳝㹿ࣙᣀ䆁㒗ḋ՟Ё˅Ϟ⌟䞣ߎⱘ㊒ᑺDŽৃҹⳟ
ߎˈ䱣ⴔᷥⱘ䭓ˈ䆁㒗ḋ՟Ϟⱘ㊒ᑺᰃऩ䇗ϞछⱘDŽ✊㗠ˈ⣀ゟⱘ⌟䆩ḋ՟Ϟ⌟
ߎⱘ㊒ᑺܜϞछৢϟ䰡DŽབ᠔⼎ˈᔧᷥ䍙䖛㑺 25 Ͼ㒧⚍ᯊˈᇍᷥ䖯ϔℹ㊒㒚࣪ሑ
ㅵৃҹᦤ催ᅗ䆁㒗᭄Ϟⱘ㊒ᑺˈै䰡Ԣњᅗ⌟䆩ḋ՟Ϟⱘ㊒ᑺDŽ
插图——原书页码:67
Accuracy – ㊒ᑺ
3-6 އㄪᷥᄺдЁⱘ䖛ᑺᢳড়DŽ
䱣ⴔ ID3 ㅫ⊩ࡴᮄⱘ㒧⚍䭓އㄪᷥˈ䆁㒗ḋ՟Ϟⱘ㊒ᑺᰃऩ䇗ϞछⱘDŽ✊㗠ˈ⣀ゟѢ䆁㒗ḋ
՟ⱘ⌟䆩ḋ՟Ϟˈ㊒ᑺܜϞछˈ✊ৢϟ䰡DŽᅲ偠䖭Ͼ᠔䳔ⱘ䕃ӊ᭄ৃҹ䗮䖛㔥ഔ
http://www.cs.cmu.edu/~tom/mlbook.html ᕫࠄDŽ
ᰃҔМॳᇐ㟈 h ↨ hcདഄᢳড়䆁㒗ḋ՟ˈԚᇍѢৢᴹⱘᅲ՟ै㸼⦄Ꮒਸ਼˛䖭
⾡ᚙމথ⫳ⱘϔ⾡ৃ㛑ॳᰃ䆁㒗ḋ՟᳝䱣ᴎ䫭䇃ాໄDŽВ՟䇈ᯢˈ㗗㰥㸼 3-2
ⱘᴀᴹℷ⹂ⱘḋ՟Ёࡴܹϔᴵ䆁㒗ℷ՟ˈԚै㹿䇃ᷛ⼎Ўড՟ˈབϟ˖
<Outlook=SunnyˈTemperature=HotˈHumidity=NormalˈWind=StrongˈPlayTennis=No>
Ϟ䴶ⱘ՟ᄤⓨ⼎њ䆁㒗ḋ՟Ёⱘ䱣ᴎాໄབԩᇐ㟈䖛ᑺᢳড়DŽџᅲϞˈᔧ䆁㒗᭄
≵᳝ాໄᯊˈ䖛ᑺᢳড়г᳝ৃ㛑থ⫳ˈ⡍߿ᰃᔧᇥ䞣ⱘḋ՟㹿݇㘨ࠄᄤ㒧⚍ᯊDŽ䖭⾡
ᚙމϟˈᕜৃ㛑ߎ⦄Ꮋড়ⱘ㾘ᕟᗻˈՓᕫϔѯሲᗻᙄᎻৃҹᕜདഄߚࡆḋ՟ˈԚैϢᅲ
䰙ⱘⳂᷛߑ᭄ᑊ᮴݇㋏DŽϔᮺ䖭ḋⱘᎻড়ⱘ㾘ᕟᗻᄬˈህ᳝䖛ᑺᢳড়ⱘ亢䰽DŽ
䖛ᑺᢳড়ᇍѢއㄪᷥᄺд݊Ҫᕜᄺдㅫ⊩ᰃϔϾ䞡㽕ⱘᅲ䏉ೄ䲒DŽ՟བˈϔ
݇Ѣ ID3 ㅫ⊩ⱘᅲ偠ⷨおЁ˄Mingers 1989b˅
ˈᇍѢ 5 ⾡ᏺ᳝ాໄϡ⹂ᅮ᭄ⱘϡ
ৠᄺдӏࡵˈҎӀথ⦄᭄䯂乬Ё䖛ᑺᢳড়Փއㄪᷥⱘ㊒ᑺ䰡Ԣњ 10-25%DŽ
᳝⾡䗨ᕘ⫼ᴹ䙓އܡㄪᷥᄺдЁⱘ䖛ᑺᢳড়DŽᅗӀৃ㹿ߚЎϸ㉏˖
z ঞᮽذℶ䭓ᷥ⊩ˈ ID3 ㅫ⊩ᅠ㕢ߚ㉏䆁㒗᭄Пࠡذℶ䭓ᷥ˗
z ৢׂ࠾⊩˄post-prune˅ˈेܕ䆌ᷥ䖛ᑺᢳড়᭄ˈ✊ৢᇍ䖭Ͼᷥৢׂ࠾DŽ
ሑㅵϔ⾡ᮍ⊩ৃ㛑ⳟ䍋ᴹⳈˈԚᰃᇍ䖛ᑺᢳড়ⱘᷥ䖯㸠ৢׂ࠾ⱘѠ⾡ᮍ⊩
㹿䆕ᯢᅲ䏉Ё៤ࡳDŽ䖭ᰃЎϔ⾡ᮍ⊩Ё㊒⹂ഄԄ䅵ԩᯊذℶ䭓ᷥᕜೄ䲒DŽ
᮴䆎ᰃ䗮䖛ঞᮽذℶ䖬ᰃৢׂ࠾ᴹᕫࠄℷ⹂ᇣⱘᷥˈϔϾ݇䬂ⱘ䯂乬ᰃՓ⫼ҔМ
ḋⱘ߭ޚᴹ⹂ᅮ᳔㒜ℷ⹂ᷥⱘᇣDŽ㾷އ䖭Ͼ䯂乬ⱘᮍ⊩ࣙᣀ˖
z Փ⫼Ϣ䆁㒗ḋ՟✊ϡৠⱘϔ༫ߚ⾏ⱘḋ՟ˈᴹ䆘Ԅ䗮䖛ৢׂ࠾ᮍ⊩ҢᷥϞׂ
࠾㒧⚍ⱘᬜ⫼DŽ
z Փ⫼᠔᳝ৃ⫼᭄䖯㸠䆁㒗ˈԚ䖯㸠㒳䅵⌟䆩ᴹԄ䅵ᠽሩ˄ׂ࠾˅ϔϾ⡍ᅮ
ⱘ㒧⚍ᰃ৺᳝ৃ㛑ᬍ䆁㒗䲚ড়ⱘᅲ՟Ϟⱘᗻ㛑DŽ՟བˈQuinlan ˄1986˅
Փ⫼ϔ⾡वᮍ˄chi-square˅⌟䆩ᴹԄ䅵䖯ϔℹᠽሩ㒧⚍ᰃ৺㛑ᬍᭈϾᅲ՟
ߚᏗϞⱘᗻ㛑ˈ䖬ᰃҙҙᬍњᔧࠡⱘ䆁㒗᭄Ϟⱘᗻ㛑DŽ
z Փ⫼ϔϾᯢ⹂ⱘᷛޚᴹ㸵䞣䆁㒗ḋ՟އㄪᷥ㓪ⷕⱘᴖᑺˈᔧ䖭Ͼ㓪ⷕⱘ䭓
ᑺ᳔ᇣᯊذℶ䭓ᷥDŽ䖭Ͼᮍ⊩Ѣϔ⾡ਃথᓣ㾘߭ˈ㹿⿄Ў᳔ᇣᦣ䗄䭓ᑺ
˄Minimum Description Length˅ⱘˈ߭ޚ៥Ӏᇚ 6 ゴЁ䅼䆎䖭⾡ᮍ⊩DŽ
Quinlan & Rivest˄1989˅ Mehta et al.˄1995˅г䅼䆎њ䖭⾡ᮍ⊩DŽ
3.7.1.1 䭏䈥⦽䲃քࢠؤ
Փ⫼偠䆕䲚ড়ᴹ䰆ℶ䖛ᑺᢳড়ⱘ⹂ߛᮍ⊩ᰃҔМ˛ϔ⾡⿄ЎĀ䫭䇃⥛䰡Ԣׂ࠾
˄error-reduced pruning˅āⱘᮍ⊩˄Quinlan 1987˅ᰃ㗗㰥ᇚᷥϞⱘ↣ϔϾ㒧⚍Ўׂ࠾
ⱘ䗝ᇍ䈵DŽׂ࠾ϔϾ㒧⚍⬅ҹϟℹ偸㒘៤˖ߴ䰸ҹℸ㒧⚍Ўḍⱘᄤᷥ˗Փᅗ៤Ўᄤ
㒧⚍˗ᡞ䆹㒧⚍݇㘨ⱘ䆁㒗ḋ՟ⱘ᳔ᐌ㾕ߚ㉏䌟㒭ᅗDŽҙᔧׂ࠾ৢⱘᷥᇍѢ偠䆕䲚ড়
ⱘᗻ㛑ϡᏂѢॳᴹⱘᷥᯊᠡߴ䰸䆹㒧⚍DŽ䖭ḋ֓ՓЎ䆁㒗䲚ড়ⱘᎻড়㾘ᕟᗻ㗠ࡴܹⱘ
㒧⚍ᕜৃ㛑㹿ߴ䰸ˈЎৠḋⱘᎻড়ϡӮথ⫳偠䆕䲚ড়ЁDŽডഄׂ࠾㒧⚍ˈ↣
ᘏᰃ䗝পᅗⱘߴ䰸ৃҹ᳔ᦤ催އㄪᷥ偠䆕䲚ড়Ϟⱘ㊒ᑺⱘ㒧⚍DŽ㒻㓁ׂ࠾㒧⚍Ⳉࠄ
䖯ϔℹⱘׂ࠾ᰃ᳝ᆇⱘ˄гህᰃ䰡Ԣњ偠䆕䲚ড়Ϟⱘ㊒ᑺ˅DŽ
བᵰ᳝䞣ⱘ᭄ৃկՓ⫼ˈ䙷МՓ⫼ߚ⾏ⱘ᭄䲚ড়ᴹᓩᇐׂ࠾ᰃϔϾ᳝ᬜⱘᮍ
⊩DŽ䖭Ͼᮍ⊩ⱘЏ㽕㔎⚍ᰃᔧ᭄᳝䰤ᯊˈҢЁֱ⬭ϔ䚼ߚ⫼偠䆕䲚ড়䖯ϔℹޣᇥњ
䆁㒗ৃҹՓ⫼ⱘḋ՟DŽϟϔ㡖㒭ߎњϔ⾡ׂ࠾ᮍ⊩ˈ᭄᳝䰤ⱘ䆌ᅲ䰙ᚙᔶϟˈ
䖭⾡ᮍ⊩ᕜ᳝ᬜDŽҎӀ䖬ᦤߎњ䆌݊ҪⱘᡔᴃDŽ՟བˈҹϡৠⱘᮍᓣߚࡆৃկՓ
⫼ⱘ᭄ˈ✊ৢᑇഛᕫࠄⱘ㒧ᵰDŽMingers˄1989b˅ Malerba et al.˄1995˅Ёਞњ
ᇍϡৠׂᷥ࠾ᮍ⊩ⱘ㒣偠䆘ԄDŽ
插图——原书页码:Page 70
Accuracy – ㊒ᑺ
On training data-䆁㒗᭄Ϟ
On test data-⌟䆩᭄Ϟ
3-7 އㄪᷥᄺдЁ䫭䇃⥛䰡Ԣׂ࠾ⱘᬜᵰ
3.7.1.2 㿺ࡏࢠؤ
ᅲ䏉Ёˈϔ⾡⫼ᴹথ⦄催㊒ᑺ؛䆒ⱘ䴲ᐌ៤ࡳⱘᮍ⊩ЎĀ㾘߭ৢׂ࠾˄rule
āDŽ䖭⾡ׂ࠾ᮍ⊩ⱘϔϾবԧ㹿⫼ C4.5 Ё˄Quinlan 1993˅ˈC4.5 ᰃҢॳ
post-pruning˅
ྟⱘ ID3 ㅫ⊩ⱘ⌒⫳ߎᴹⱘDŽ㾘߭ৢׂ࠾ࣙᣀϟ䴶ⱘℹ偸˖
1. Ң䆁㒗䲚ড়ᇐߎއㄪᷥˈ䭓އㄪᷥⳈࠄሑৃ㛑དഄᢳড়䆁㒗᭄ˈܕ䆌䖛ᑺᢳ
ড়থ⫳DŽ
2. ᇚއㄪᷥ䕀࣪ЎㄝӋⱘ㾘߭䲚ড়ˈᮍ⊩ᰃЎҢḍ㒧⚍ࠄᄤ㒧⚍ⱘ↣ϔᴵ䏃ᕘ߯ᓎ
ϔᴵ㾘߭DŽ
3. 䗮䖛ߴ䰸ӏԩ㛑ᇐ㟈Ԅ䅵㊒ᑺᦤ催ⱘࠡӊ˄preconditions˅ᴹׂ࠾˄⊯࣪˅↣ϔᴵ㾘
߭DŽ
4. ᣝ✻ׂ࠾䖛ⱘ㾘߭ⱘԄ䅵㊒ᑺᇍᅗӀ䖯㸠ᥦᑣ˗ᑊᣝ䖭ḋⱘ乎ᑣᑨ⫼䖭ѯ㾘߭ᴹߚ
㉏ৢᴹⱘᅲ՟DŽ
IF ˄Outlook=Sunny˅˄Humidity=High˅
THEN PlayTennis=No
ϟᴹˈ䗮䖛ߴ䰸ϡӮ䰡ԢԄ䅵㊒ᑺⱘܜ㸠䆡ᴹׂ࠾↣ϔϾ㾘߭DŽ՟བᇍѢϞ䴶ⱘ
㾘߭ˈ㾘߭ৢׂ࠾ㅫ⊩Ӯ㗗㰥ߴ䰸ܜ㸠䆡˄Outlook=Sunny˅˄Humidity=High˅DŽᅗӮ
䗝ᢽ䖭ѯׂ࠾ℹ偸ЁՓԄ䅵㊒ᑺ᳔᳝ᦤछⱘℹ偸ˈ✊ৢ㗗㰥ׂ࠾ѠϾࠡӊЎ䖯ϔ
ℹⱘׂ࠾ℹ偸DŽབᵰᶤϾׂ࠾ℹ偸䰡ԢњԄ䅵㊒ᑺˈ䙷М䖭Ͼℹ偸ϡӮ㹿ᠻ㸠DŽ
བৠࠡ䴶ᦤߎⱘˈԄ䅵㾘߭㊒ᑺⱘϔ⾡ᮍ⊩ᰃՓ⫼Ϣ䆁㒗䲚ϡⳌѸⱘ偠䆕䲚ড়DŽ
ϔ⾡㹿 C4.5 Փ⫼ⱘᮍ⊩ᰃѢ䆁㒗䲚ড়ᴀ䑿䆘Ԅᗻ㛑ˈԚՓ⫼ϔ⾡ֱᅜԄ䅵
˄pessimistic estimate˅ᴹᓹ㸹䆁㒗᭄᳝߽Ѣᔧࠡ㾘߭ⱘԄ䅵أ㕂DŽ⹂ޚഄ䆆ˈC4.5
䗮䖛ҹϟᮍ⊩䅵ㅫֱᅜԄ䅵ˈܜ䅵ㅫ㾘߭ᅗᑨ⫼ⱘ䆁㒗ḋ՟Ϟⱘ㊒ᑺˈ✊ৢ؛ᅮℸԄ
䅵㊒ᑺЎѠ乍ߚᏗˈᑊ䅵ㅫᅗⱘᷛޚᏂ˄standard deviation˅DŽᇍѢϔϾ㒭ᅮⱘ㕂ֵऎ䯈ˈ
䞛⫼ϟ⬠Ԅ䅵Ў㾘߭ᗻ㛑ⱘᑺ䞣˄՟བˈᇍѢϔϾ 95%ⱘ㕂ֵऎ䯈ˈ㾘߭㊒ᑺ㹿ֱ
ᅜԄ䅵Ў˖䆁㒗䲚ড়Ϟⱘ㾖ᆳ㊒ᑺޣএ 1.96 ЬԄ䅵ⱘᷛޚᏂ˅DŽ䖭ḋⱘخᬜᵰᰃˈᇍ
Ѣⱘ᭄䲚ˈֱᅜ乘⌟䴲ᐌ䖥㾖ᆳ㊒ᑺ˄гህᰃᷛޚᏂ䴲ᐌᇣ˅ˈ✊㗠䱣ⴔ᭄䲚
ড়ⱘޣᇣˈᅗᓔྟ⾏㾖ᆳ㊒ᑺ䍞ᴹ䍞䖰DŽ㱑✊䖭⾡ਃথᓣᮍ⊩ϡᰃ㒳䅵᳝ᬜ˄statistically
valid˅ⱘˈԚᰃᏆ㒣থ⦄ᅗᅲ䏉Ёᰃ᳝⫼ⱘDŽ 5 ゴ䅼䆎њ㒳䅵᳝ᬜⱘ乘⌟ഛؐ㕂
ֵऎ䯈ⱘᮍ⊩DŽ
ЎҔМׂ࠾Пࠡ㽕ᡞއㄪᷥ䕀࣪៤㾘߭䲚ਸ਼˛䖭ḋخЏ㽕᳝ϝϾད໘˖
z 䕀࣪Ў㾘߭䲚ৃҹऎߚއㄪ㒧⚍Փ⫼ⱘϡৠϞϟ᭛DŽЎ䌃こއㄪ㒧⚍ⱘ↣ᴵ
ϡৠ䏃ᕘѻ⫳ϔᴵϡৠⱘ㾘߭ˈ᠔ҹᇍѢϡৠ䏃ᕘˈ݇ѢϔϾሲᗻ⌟䆩ⱘׂ࠾
އㄪৃҹϡৠDŽⳌডˈབᵰⳈׂ࠾ᷥᴀ䑿ˈা᳝ϸϾ䗝ᢽˈ㽕Мᅠܼߴ䰸އ
ㄪ㒧⚍ˈ㽕Мֱ⬭ᅗⱘᴀᴹ⢊ᗕDŽ
z 䕀࣪Ў㾘߭䲚⍜䰸њḍ㒧⚍䰘䖥ⱘሲᗻ⌟䆩㒧⚍䰘䖥ⱘሲᗻ⌟䆩ⱘऎ߿DŽ
Ѣᰃ䙓ܡњ䳊хⱘ䆄ᔩ䯂乬ˈ↨བ㢹ᰃḍ㒧⚍㹿ׂ࠾њԚֱ⬭ᅗϟ䴶ⱘ䚼ߚᄤ
ᷥᯊབԩ䞡ᮄ㒘㒛䖭ỉᷥDŽ
z 䕀࣪Ў㾘߭ᦤ催њৃ䇏ᗻDŽᇍѢҎᴹ䇈㾘߭ᘏᰃᆍᯧ⧚㾷ⱘDŽ
3.7.2 ਾᒬ䘔㔣ٲኔᙝ
៥Ӏ᳔߱ⱘID3 ᅮН䰤ࠊЎপ⾏ᬷؐⱘሲᗻDŽ佪ˈܜᄺдࠄⱘއㄪᷥ㽕乘⌟ⱘⳂᷛ
ሲᗻᖙ乏ᰃ⾏ᬷⱘDŽ݊ˈᷥⱘއㄪ㒧⚍ⱘሲᗻгᖙ乏ᰃ⾏ᬷⱘDŽৃҹㅔऩഄߴ䰸Ѡ
Ͼ䰤ࠊˈҹ֓ᡞ䖲㓁ؐⱘއㄪሲᗻࡴܹࠄއㄪᷥЁDŽ䖭ৃҹ䗮䖛ࡼᗕഄᅮНᮄⱘ⾏ᬷؐ
ሲᗻᴹᅲ⦄ˈेܜᡞ䖲㓁ؐሲᗻⱘؐඳߚࡆЎ⾏ᬷⱘऎ䯈䲚ড়DŽ՟བˈᇍѢ䖲㓁ؐⱘሲ
ᗻAˈㅫ⊩ৃࡼᗕഄ߯ᓎϔϾᮄⱘᏗᇨሲᗻAcˈབᵰA<cˈ䙷МЎAcⳳˈ৺߭Ў؛DŽଃ
ϔⱘ䯂乬ᰃབԩ䗝প᳔Շⱘ䯜ؐcDŽ
Temperature: 40 48 60 72 80 90
PlayTennis: No No Yes Yes Yes No
ᇍሲᗻTempratureˈᑨ䆹ᅮНҔМḋⱘѢ䯜ؐⱘᏗᇨሲᗻਸ਼˛᮴⭥ˈ៥ӀӮ䗝ᢽ
ѻ⫳᳔ֵᙃⲞⱘ䯜ؐcDŽ佪ܜᣝ✻䖲㓁ሲᗻAᥦᑣḋ՟ˈ✊ৢ⹂ᅮⳂᷛߚ㉏ϡৠⱘ
Ⳍ䚏ᅲ՟ˈѢᰃ៥Ӏৃҹѻ⫳ϔ㒘䗝䯜ؐˈᅗӀⱘؐᰃⳌᑨⱘAؐП䯈ⱘЁ䯈ؐDŽৃ
ҹ䆕ᯢѻ⫳᳔ֵᙃⲞⱘcؐᖙᅮԡѢ䖭ḋⱘ䖍⬠Ё˄Fayyad 1991˅DŽ✊ৢৃҹ䗮䖛
䅵ㅫϢ↣Ͼ䗝䯜ؐ݇㘨ⱘֵᙃⲞ䆘Ԅ䖭ѯ䗝ؐDŽᔧࠡⱘ՟ᄤЁˈ᳝ϸϾ䗝䯜
ؐˈᅗӀᇍᑨѢⳂᷛሲᗻPlayTennisব࣪ᯊሲᗻTemperatureⱘؐ˖ ˄48+60˅/2 ˄80+90˅
/2DŽ✊ৢ䅵ㅫ↣ϔϾ䗝ሲᗻüüTemperature>54 Temperature>85ⱘֵᙃⲞˈᑊ䗝ᢽ
᳔དⱘ˄Temperature>54˅DŽ⦄䖭Ͼࡼᗕ߯ᓎⱘᏗᇨሲᗻ֓ৃҹ݊Ҫ䗝ⱘ⾏ᬷؐሲ
ᗻϔৠĀゲѝāˈҹ⫼Ѣ䭓އㄪᷥDŽFayyad & Irani˄1993˅䅼䆎њ䖭⾡ᮍ⊩ⱘϔϾᠽ
ሩˈेᡞ䖲㓁ⱘሲᗻߚࡆ៤Ͼऎ䯈ˈ㗠ϡᰃѢऩϔ䯜ؐⱘϸϾऎ䯈DŽUtgoff &
Brodley˄1991˅Murthy et al.˄1994˅䅼䆎њ䗮䖛ᇍϾ䖲㓁ؐሲᗻⱘ㒓ᗻ㒘ড়ᅮН
䯜ؐখ᭄ⱘᮍ⊩DŽ
3.7.3 ኔᙝ䘿ⲺެԌᓜ䠅ḽ
ֵᙃⲞᑺ䞣ᄬϔϾݙأ㕂ˈᅗأ㹦᳝䕗ؐⱘሲᗻDŽВϔϾᵕッⱘ՟ᄤˈ
㗗㰥ሲᗻ Dateˈᅗ᳝䞣ⱘৃ㛑ؐ˄՟བ March 4,1979˅DŽ㽕ᰃ៥Ӏᡞ䖭Ͼሲᗻࡴࠄ㸼
3-2 ⱘ᭄ЁˈᅗӮ᠔᳝ሲᗻЁ᳔᳝ⱘֵᙃⲞDŽ䖭ᰃЎऩ⣀ Date ህৃҹᅠܼ乘
⌟䆁㒗᭄ⱘⳂᷛሲᗻDŽѢᰃ䖭ϾሲᗻӮ㹿䗝ᷥⱘḍ㒧⚍ⱘއㄪሲᗻᑊᔶ៤ϔỉ⏅ᑺ
Ўϔ㑻Ԛै䴲ᐌᆑⱘᷥˈ䖭ỉᷥৃҹ⧚ᛇഄߚ㉏䆁㒗᭄DŽᔧ✊ˈ䖭ϾއㄪᷥᇍѢৢᴹ
᭄ⱘᗻ㛑ӮⳌᔧᏂˈЎሑㅵᅗᅠ㕢ഄߚࡆњ䆁㒗᭄ˈԚᅗϡᰃϔϾདⱘ乘⌟఼
˄predicator˅
DŽ
ሲᗻ Date ߎњҔМ䯂乬њਸ਼˛ㅔऩഄ䆆ˈᰃЎᅗⱘৃ㛑ؐᖙ✊ᡞ䆁㒗ḋ՟
ߚࡆ៤䴲ᐌᇣⱘぎ䯈DŽℸˈⳌᇍ䆁㒗ḋ՟ˈᅗӮ᳝䴲ᐌ催ⱘֵᙃⲞˈሑㅵᇍѢ㾕
ᅲ՟ᅗᰃϔϾ䴲ᐌᏂⱘⳂᷛߑ᭄乘⌟఼DŽ
䙓ܡ䖭Ͼϡ䎇ⱘϔ⾡ᮍ⊩ᰃ⫼݊Ҫᑺ䞣ˈ㗠ϡᰃֵᙃⲞˈᴹ䗝ᢽއㄪሲᗻDŽϔϾ
ৃҹ䗝ᢽⱘᑺ䞣ᷛޚᰃⲞ↨⥛˄gain ratio˅˄Quinlan 1986˅DŽⲞ↨⥛䗮䖛ࡴܹϔϾ
⿄ߚ㺖ֵᙃ˄split information˅ⱘ乍ᴹᚽ㔮㉏Ԑ Date ⱘሲᗻˈߚ㺖ֵᙃ⫼ᴹ㸵䞣ሲ
ᗻߚ㺖᭄ⱘᑓᑺഛࣔᗻ˖
c
| Si | |S |
SplitInformation( S , A) { ¦ log 2 i ˄3.5˅
i 1 | S | |S|
݊ЁS1ࠄScᰃcϾؐⱘሲᗻAߚࡆS㗠ᔶ៤ⱘcϾḋ՟ᄤ䲚DŽ⊼ᛣߚ㺖ֵᙃᅲ䰙Ϟህᰃ
S݇ѢሲᗻAⱘؐⱘ➉DŽ䖭Ϣ៥Ӏࠡ䴶ᇍ➉ⱘՓ⫼ϡৠˈ䙷䞠៥Ӏা㗗㰥S݇Ѣᄺд
ࠄⱘᷥ㽕乘⌟ⱘⳂᷛሲᗻⱘؐⱘ➉DŽ
Ⲟ↨⥛ᑺ䞣ᰃ⫼ࠡ䴶ⱘⲞᑺ䞣䖭䞠ⱘߚ㺖ֵᙃᑺ䞣ᴹ݅ৠᅮНⱘˈे˖
Gain( S , A)
GainRatio( S , A) { ˄3.6˅
SplitInformation( S , A)
䇋⊼ᛣˈߚ㺖ֵᙃ乍䰏䗝ᢽؐЎഛࣔߚᏗⱘሲᗻDŽ՟བˈ㗗㰥ϔϾ᳝nϾḋ՟
ⱘ䲚ড়㹿ሲᗻAᕏᑩߚࡆ˄䆥⊼˖ߚ៤n㒘ˈेϔϾḋ՟ϔ㒘˅DŽ䖭ᯊߚ㺖ֵᙃⱘؐЎlog2nDŽ
ⳌডˈϔϾᏗᇨሲᗻBߚࡆৠḋⱘnϾᅲ՟ˈབᵰᙄདᑇߚϸञˈ䙷Мߚ㺖ֵᙃᰃ 1DŽབ
ᵰሲᗻABѻ⫳ৠḋⱘֵᙃⲞˈ䙷МḍⲞ↨⥛ᑺ䞣ˈᯢᰒBӮᕫߚ催DŽ
Փ⫼Ⲟ↨⥛ҷ᳓Ⲟᴹ䗝ᢽሲᗻѻ⫳ⱘϔϾᅲ䰙䯂乬ᰃˈᔧᶤϾSi䖥S˄|Si|||S|˅
ᯊߚ↡ৃ㛑Ў 0 䴲ᐌᇣDŽབᵰᶤϾሲᗻᇍѢSⱘ᠔᳝ḋ՟᳝Тৠḋⱘؐˈ䖭ᯊ㽕М
ᇐ㟈Ⲟ↨⥛ᅮНˈ㽕МᰃⲞ↨⥛䴲ᐌDŽЎњ䙓ܡ䗝ᢽ䖭⾡ሲᗻˈ៥Ӏৃҹ䞛⫼
䖭ḋϔѯਃথᓣ㾘߭ˈ↨བܜ䅵ㅫ↣ϾሲᗻⱘⲞˈ✊ৢҙᇍ䙷ѯⲞ催䖛ᑇഛؐⱘሲ
ᗻᑨ⫼Ⲟ↨⥛⌟䆩˄Quinlan 1986˅
DŽ
䰸њֵᙃⲞˈLopez de Mantaras˄1991˅ҟ㒡њϔ⾡Ⳉ䩜ᇍϞ䗄䯂乬㗠䆒䅵
ⱘᑺ䞣ˈᅗᰃѢ䎱⾏ⱘ˄distance-based˅DŽ䖭Ͼᑺ䞣ᷛޚѢ᠔ᅮНⱘϔϾ᭄ߦߚ
䯈ⱘ䎱⾏ሎᑺDŽ↣Ͼሲᗻⱘ䆘Ԅḍᅗѻ⫳ⱘߦߚϢ⧚ᛇߦߚ˄гህᰃᅠ㕢ߚ㉏䆁㒗᭄
ⱘߦߚ˅䯈ⱘ䎱⾏DŽ✊ৢ䗝ᢽߦߚ᳔䖥ᅠ㕢ߦߚⱘሲᗻDŽLopez de Mantaras ˄1991˅
ᅮНњ䖭Ͼ䎱⾏ᑺ䞣ˈ䆕ᯢњᅗϡأ᳝䞣ؐⱘሲᗻˈᑊਞњ݊ᅲ偠ⷨおˈ䇈ᯢ䖭
⾡ᮍ⊩ѻ⫳ⱘއㄪᷥⱘ乘⌟㊒ᑺϢⲞ⊩Ⲟ↨⥛⊩ᕫࠄⱘ≵᳝ᯢᰒⱘᏂ߿DŽ㗠Ϩ䖭
⾡䎱⾏ᑺ䞣䙓ܡњⲞ↨⥛ᑺ䞣ⱘᅲ䰙ೄ䲒ˈҪⱘᅲ偠ЁˈᇍѢሲᗻؐϾ᭄Ꮒᓖ䴲ᐌ
ⱘ᭄䲚ˈ䖭⾡ᮍ⊩ѻ⫳њᬜᵰᕜདⱘ䕗ᇣⱘᷥDŽ
3.7.4 ༺⨼㕰ቇኔᙝⲺٲ䇣㓹ṭׁ
ᶤѯᚙމϟˈৃկՓ⫼ⱘ᭄ৃ㛑㔎ᇥᶤѯሲᗻⱘؐDŽ՟བˈएᄺ乚ඳ៥ӀᏠ
ᳯḍ乍࣪偠ᣛᷛ乘⌟ᙷ㗙ⱘ㒧ᵰˈ✊㗠ৃ㛑ҙ᳝䚼ߚᙷ㗙᳝偠㸔㒧ᵰDŽ䖭⾡ᚙ
މϟˈ㒣ᐌ䳔㽕ḍℸሲᗻؐᏆⶹⱘ݊Ҫᅲ՟ˈᴹԄ䅵䖭Ͼ㔎ᇥⱘሲᗻؐDŽ
໘⧚㔎ᇥሲᗻؐⱘϔ⾡ㄪ⬹ᰃ䌟㒭ᅗ㒧⚍ n ⱘ䆁㒗ḋ՟Ё䆹ሲᗻⱘ᳔ᐌ㾕ؐDŽϔ
⾡ㄪ⬹ᰃৃҹ䌟㒭ᅗ㒧⚍ n ⱘ㹿ߚ㉏Ў c(x)ⱘ䆁㒗ḋ՟Ё䆹ሲᗻⱘ᳔ᐌ㾕ؐDŽ✊ৢՓ⫼
䖭ϾԄ䅵ؐⱘ䆁㒗ḋ՟ህৃҹ㹿⦄᳝ⱘއㄪᷥᄺдㅫ⊩Փ⫼њDŽMingers˄1989a˅Ёߚ
ᵤњ䖭Ͼㄪ⬹DŽ
Ѡ⾡ᖂᴖⱘㄪ⬹ᰃЎ A ⱘ↣Ͼৃ㛑ؐ䌟ϢϔϾὖ⥛ˈ㗠ϡᰃㅔऩഄᇚ᳔ᐌ
㾕ⱘؐ䌟㒭 A(x)DŽḍ㒧⚍ n ⱘḋ՟Ϟ A ⱘϡৠؐⱘߎ⦄乥⥛ˈ䖭ѯὖ⥛ৃҹ㹿ݡ
Ԅ䅵DŽ՟བˈ㒭ᅮϔϾᏗᇨሲᗻ Aˈབᵰ㒧⚍ n ࣙ 6 ϾᏆⶹ A=1 6 Ͼ A=0 ⱘḋ՟ˈ
䙷М A(x)=1 ⱘὖ⥛ᰃ 0.6ˈA(x)=0 ⱘὖ⥛ᰃ 0.4DŽѢᰃˈᅲ՟ x ⱘ 60%㹿ߚ䜡ࠄ A=1 ⱘ
ߚᬃˈ40%㹿ߚ䜡ࠄϔϾߚᬃDŽ䖭ѯ⠛↉ḋ՟˄fractional examples˅ⱘⳂⱘᰃ䅵ㅫֵ
ᙃⲞˈˈབᵰ᳝ѠϾ㔎ᇥؐⱘሲᗻᖙ乏㹿⌟䆩ˈ䖭ѯḋ՟ৃҹৢ㒻ⱘᷥߚᬃ
㹿䖯ϔℹ㒚ߚDŽϞ䗄ⱘḋ՟ⱘ⠛↉гৃҹᄺдПৢՓ⫼ˈ⫼ᴹߚ㉏㔎ᇥሲᗻⱘᮄᅲ՟DŽ
䖭⾡ᚙމϟˈᮄᅲ՟ⱘߚ㉏ህᰃ᳔ৃ㛑ⱘߚ㉏ˈ䅵ㅫⱘᮍ⊩ᰃ䗮䖛ᷥⱘ㒧⚍ᇍᣝ
ϡৠᮍᓣߚ㉏ⱘᅲ՟⠛↉ⱘࡴᴗ∖DŽC4.5˄Quinlan 1993˅Փ⫼䖭⾡ᮍ⊩໘⧚㔎ᇥⱘ
ሲᗻؐDŽ
3.7.5 ༺⨼ԙԭуੂⲺኔᙝ
ᶤѯᄺдӏࡵЁˈᅲ՟ⱘሲᗻৃ㛑ϢҷӋⳌ݇DŽ՟བˈᄺдߚ㉏⮒⮙ᯊ៥Ӏৃ
㛑ҹ䖭ѯሲᗻᴹᦣ䗄ᙷ㗙˖ԧ⏽ǃ⌏㒘㒛ߛ⠛Ẕᶹǃ㛝᧣ǃ㸔⎆࣪偠㒧ᵰㄝDŽ䖭ѯሲᗻ
ҷӋᮍ䴶Ꮒ߿䴲ᐌˈϡ䆎ᰃ᠔䳔ⱘ䌍⫼䖬ᰃᙷ㗙㽕ᡓফⱘϡ䗖DŽᇍѢ䖭ḋⱘӏࡵˈ
៥ӀᇚӬܜ䗝ᢽሑৃ㛑Փ⫼ԢҷӋሲᗻⱘއㄪᷥˈҙᔧ䳔㽕ѻ⫳ৃ䴴ⱘߚ㉏ᯊᠡձ䌪催
ҷӋሲᗻDŽ
Gain 2 ( S , A)
Cost ( A)
Nunez˄1988˅Ёᦣ䗄њϔ⾡᳝݇ⱘᮍ⊩ˈᑊᡞᅗᑨ⫼ࠄᄺдए⭫䆞ᮁ㾘߭ϞDŽ䖭
䞠ሲᗻᰃ᳝ϡৠҷӋⱘϡৠ⮛⢊࣪偠⌟䆩DŽᅗⱘ㋏㒳Փ⫼њᖂ᳝⚍ϡৠⱘሲᗻ䗝
ᢽᑺ䞣˖
2 Gain ( S , A) 1
(Cost ( A) 1) w
݊Ё w[0ˈ1]ᰃϔϾᐌ᭄ˈއᅮҷӋᇍֵᙃⲞⱘⳌᇍ䞡㽕ᗻDŽNunez˄1991˅䩜
ᇍϔ㋏߫ӏࡵ㒭ߎњ䖭ϸ⾡ᮍ⊩ⱘ䆩偠ᇍ↨DŽ
3.8 ቅ㔉ૂ㺛ݻ䈱⢟
䖭ϔゴⱘ㽕⚍ࣙᣀ˖
z އㄪᷥᄺдЎὖᗉᄺдᄺд݊Ҫ⾏ᬷؐⱘߑ᭄ᦤկњϔϾᅲ⫼ⱘᮍ⊩DŽID3
㋏߫ㅫ⊩Փ⫼Ңḍϟ䭓⊩ᮁއㄪᷥˈЎ↣Ͼ㽕ࡴܹᷥⱘᮄއㄪߚᬃ䋾ှ
ഄ䗝ᢽ᳔དⱘሲᗻDŽ
z ID3 ㅫ⊩᧰㋶ᅠᭈⱘ؛䆒ぎ䯈˄гህᰃ䇈ˈއㄪᷥぎ䯈㛑㸼⼎ӏԩᅮН⾏ᬷ
ؐᅲ՟Ϟⱘӏԩ⾏ᬷؐߑ᭄˅DŽ᠔ҹᅗ䙓ܡњҙ㗗㰥᳝䰤ⱘ؛䆒䲚ড়ⱘᮍ⊩ⱘ
Џ㽕䯂乬˖Ⳃᷛߑ᭄ৃ㛑ϡ؛䆒ぎ䯈ЁDŽ
z 䱤 ID3 ㅫ⊩Ёⱘᔦ㒇أ㕂ࣙᣀӬܜ䗝ᢽ䕗ᇣⱘᷥˈгህᰃ䇈ˈᅗ䗮䖛ᇍ؛
䆒ぎ䯈ⱘ᧰㋶䭓ᷥˈՓᷥⱘᇣЎℷད㛑ߚ㉏Ꮖ᳝ⱘ䆁㒗ḋ՟DŽ
z 䖛ᑺᢳড়䆁㒗᭄ᰃއㄪᷥᄺдЁⱘ䞡㽕䯂乬DŽЎ䆁㒗ḋ՟ҙҙᰃ᠔᳝ৃ㛑
ᅲ՟ⱘϔϾḋᴀˈᷥࡴߚᬃৃ㛑ᦤ催䆁㒗ḋ՟Ϟⱘᗻ㛑ˈԚै䰡Ԣ䆁
㒗ᅲ՟ⱘ݊Ҫᅲ՟Ϟⱘᗻ㛑DŽℸˈৢׂ࠾އㄪᷥⱘᮍ⊩ᇍѢ䙓އܡㄪᷥᄺ
дЁ˄݊ҪՓ⫼Ӭ䗝أ㕂ⱘᔦ㒇⧚ᮍ⊩˅ⱘ䖛ᑺᢳড়ᰃᕜ䞡㽕ⱘDŽ
z ᇍѢᴀ ID3 ㅫ⊩ˈⷨお㗙Ꮖ㒣ᓔথњ䞣ⱘᠽሩDŽ݊Ёࣙᣀৢׂ࠾ⱘᮍ⊩˗
໘⧚ᅲ᭄ؐⱘሲᗻ˗ᆍ㒇㔎ᇥሲᗻؐⱘ䆁㒗ḋ՟˗ᔧ᳝њᮄⱘ䆁㒗ᅲ՟ᯊ䗦
㊒࣪އㄪᷥ˗Փ⫼ֵᙃⲞПⱘ݊Ҫሲᗻ䗝ᢽᑺ䞣˗㗗㰥Ϣᅲ՟ሲᗻ݇㘨ⱘ
ҷӋDŽ
݇Ѣއㄪᷥᔦ㒇ⱘ䖯ϔℹ㒚㡖ˈQuinlan˄1993˅ᰃϔᴀ㊒ᔽⱘ㨫ˈ݊Ё䅼䆎њ
ᕜᅲ䏉䯂乬ˈᑊᦤկњ C4.5 ㅫ⊩ⱘৃᠻ㸠ҷⷕDŽMingers˄1989a˅ Buntine & Niblett
˄1992˅ᦤկњ↨䕗ϡৠሲᗻ䗝ᢽᑺ䞣ⱘᅲ偠ⷨおDŽMingers˄1989b˅ᦤկњᇍϡৠׂ
࠾ㄪ⬹ⱘⷨおDŽ↨䕗އㄪᷥᄺд݊Ҫᄺдᮍ⊩ⱘ䆩偠ৃӫⱘ䆎᭛Ёᡒࠄˈࣙᣀ
˄Dietterich et al. 1995; Fisher & McKusick 1989; Quinlan 1988a; Shavlik et al. 1991;
Thrun et al. 1991; Weiss and Kapouleas 1989˅DŽ
д乬
3.1 ⬏ߎ㸼⼎ϟ䴶Ꮧᇨߑ᭄ⱘއㄪᷥ˖
˄a˅A¬B
˄b˅A[BC]
˄c˅A XOR B
˄d˅[AB] [CD]
3.2 㗗㰥ϟ䴶ⱘ䆁㒗ḋ՟䲚ড়˖
ᅲ՟ ߚ㉏ a1 a2
1 + T T
2 + T T
3 - T F
4 + F F
5 - F T
6 - F T
˄a˅䇋䅵ㅫ䖭Ͼ䆁㒗ḋ՟䲚ড়ᇍѢⳂᷛߑ᭄ߚ㉏ⱘ➉DŽ
˄b˅䇋䅵ㅫሲᗻa2Ⳍᇍ䖭ѯ䆁㒗ḋ՟ⱘֵᙃⲞDŽ
˄b˅ᄺдࠄⱘއㄪᷥҢৠḋⱘḋ՟Փ⫼বൟぎ䯈ㅫ⊩ᕫࠄⱘবൟぎ䯈˄㾕 2
ゴ 2-3˅䯈᳝ҔМ݇㋏˛ᷥㄝӋѢবൟぎ䯈ⱘϔϾ៤ਬ৫˛
˄c˅ࡴϟ䴶ⱘ䆁㒗ḋ՟ˈ䅵ㅫᮄⱘއㄪᷥDŽ䖭ϔˈᰒ⼎ߎ䭓ᷥⱘ↣ϔℹЁ
↣Ͼ䗝ሲᗻⱘֵᙃⲞDŽ
˄d˅؛ᅮ៥ӀᏠᳯ䆒䅵ϔϾᄺд఼ˈᅗ᧰㋶އㄪᷥ؛䆒ぎ䯈˄㉏Ԑ ID3˅ᑊᇏᡒ
Ϣ᭄ϔ㟈ⱘ᠔᳝؛䆒˄㉏Ԑ䗝⍜䰸˅DŽㅔऩഄ䇈ˈ៥ӀᏠᳯᑨ⫼䗝⍜䰸ㅫ⊩᧰㋶
އㄪᷥ؛䆒ぎ䯈DŽߎݭ㒣䖛㸼 2-1 ⱘϔϾ䆁㒗ḋ՟ৢⱘ S G 䲚ড়DŽ⊼ᛣ S ᖙ乏ࣙ
Ϣ᭄ϔ㟈ⱘ᳔⡍⅞ⱘއㄪᷥˈ㗠 G ᖙ乏᳔ࣙϔ㠀ⱘDŽ䇈ᯢ䘛ࠄѠϾ䆁㒗ḋ՟
ᯊ S G 䲚ড়ᰃབԩ㹿ᬍ䖯ⱘ˄ৃҹএᥝᦣ䗄ৠϔϾὖᗉⱘ䇁⊩ϡৠⱘᷥ˅DŽᡞ䗝
⍜䰸ㅫ⊩ᑨ⫼ࠄއㄪᷥ؛䆒ぎ䯈ᯊˈ乘䅵Ӯ⺄ࠄҔМḋⱘೄ䲒˛
ㅢ4ㄖ Ӱᐛ⾔㔅㖇㔒
4.1 ㆶԁ
⾎㓿㖁㔌ᆖҐᯩ⌅ሩҾ䙬䘁ᇎᮠ٬ǃᮓ٬ᡆੁ䟿٬Ⲵⴞḷ࠭ᮠᨀҶа励ἂᙗᖸᕪ
Ⲵᯩ⌅DŽሩҾḀӋ㊫රⲴ䰞仈ˈྲᆖҐ䀓䟺༽ᵲⲴ⧠ᇎц⭼ѝⲴՐᝏಘᮠᦞˈӪᐕ⾎㓿㖁㔌
ᱟⴞࡽ⸕䚃Ⲵᴰᴹ᭸ᆖҐᯩ⌅DŽֻྲˈᵜㄐ㾱᧿䘠Ⲵ৽ੁՐ㇇⌅ᐢ൘ᖸཊᇎ䱵Ⲵ䰞仈ѝਆ
ᗇҶӪⲴᡀ࣏ˈ∄ྲᆖҐ䇶࡛߉ᆇㅖ˄LeCun et al. 1989˅ˈᆖҐ䇶࡛ਓ䈝˄Lang et al.
1990˅઼ᆖҐ䇶࡛Ӫ㝨˄Cottrell 1990˅DŽRumelhart et al.˄1994˅ѝᾲ㿸Ҷަᇎ䱵Ⲵᓄ⭘DŽ
4.1.1 ⭕⢟ᆜࣞᵰ
Ӫᐕ⾎㓿㖁㔌Ⲵ⹄ウ൘аᇊ〻ᓖкਇࡠҶ⭏⢙ᆖⲴਁˈഐѪ⭏⢙ⲴᆖҐ㌫㔏ᱟ⭡ӂ
䘎᧕Ⲵ⾎㓿˄ݳneuron˅㓴ᡀⲴᔲᑨ༽ᵲⲴ㖁㔌DŽ㘼Ӫᐕ⾎㓿㖁㔌о↔བྷփլˈᆳᱟ⭡а
㌫ࡇㆰঅঅݳӂᇶ䳶䘎᧕ᶴᡀˈަѝ⇿ањঅݳᴹаᇊᮠ䟿Ⲵᇎ٬䗃˄ޕਟ㜭ᱟަԆঅݳ
Ⲵ䗃ࠪ˅ˈᒦӗ⭏অаⲴᇎᮠ٬䗃ࠪ˄ਟ㜭ᡀѪަԆᖸཊঅⲴݳ䗃˅ޕDŽ
ѪҶ࣐␡ሩ䘉㊫∄Ⲵ䇔䇶ˈ䇙ᡁԜ㘳㲁аӋᶕ㠚⭏⢙ᆖⲴһᇎDŽֻྲˈᦞՠ䇑Ӫ㊫Ⲵ
བྷ㝁ᱟ⭡བྷ㓖 1011њ⾎㓿ݳӂ䘎᧕㓴ᡀⲴᇶ䳶㖁㔌ˈᒣ൷⇿ањ⾎㓿ݳоަԆ 104њ⾎㓿
ݳ䘎DŽ⾎㓿Ⲵݳ⍫ᙗ䙊ᑨ㻛䙊ੁަԆ⾎㓿Ⲵݳ䘎᧕◰⍫ᡆᣁࡦDŽⴞࡽ⸕䚃ⲴᴰᘛⲴ⾎㓿ݳ
䖜ᦒᰦ䰤ᱟ൘ 10-3。㓗࡛——о䇑㇇ᵪⲴ䖜ᦒᰦ䰤 10-10。∄ធᖸཊDŽ❦㘼Ӫ㊫㜭ཏԕӪ
Ⲵ䙏ᓖ༽ࠪڊᵲᓖӪⲴߣㆆDŽֻྲˈ㾱䙊䗷㿶㿹䇔ࠪ㠚ᐡⲴ⇽Ӣབྷ㓖䴰㾱 10-1。DŽ⌘
൘䘉 10-1。Ⲵ䰤䳄ˈ㻛◰ਁⲴ⾎㓿ݳᒿࡇн䮯ҾᮠⲮ↕ˈഐѪঅњ⾎㓿Ⲵݳ䖜ᦒ䙏ᓖᐢ⸕DŽ
䘉њһᇎ֯ᖸཊӪ᧘⍻ˈ⭏⢙⾎㓿㌫㔏Ⲵؑ༴⨶㜭࣋аᇊᗇ⳺Ҿሩ࠶ᐳ൘བྷ䟿⾎㓿ݳкⲴ
ؑ㺘⽪Ⲵ儈ᓖᒦ㹼༴⨶DŽANN㌫㔏Ⲵањࣘᵪቡᱟ㧧ᗇ䘉สҾ࠶ᐳ㺘⽪Ⲵ儈ᓖᒦ㹼㇇
⌅DŽབྷཊᮠⲴANN䖟Ԧ൘Ѣ㹼ᵪಘкԯⵏ࠶ᐳ༴⨶ˈ❦㘼ᴤᘛ⡸ᵜⲴ㇇⌅ҏᐢ㓿൘儈ᓖᒦ
㹼ᵪ઼⢩࡛ѪANNᓄ⭘䇮䇑Ⲵу⭘⺜Ԧкᇎ⧠DŽ
䮯ᵏԕᶕˈӪᐕ⾎㓿㖁㔌亶ฏⲴ⹄ウ㘵࠶ѪєњഒփDŽањഒփⲴⴞḷᱟ֯⭘ ANN ⹄
ウ઼⁑ᤏ⭏⢙ᆖҐ䗷〻DŽਖањഒփⲴⴞḷᱟ㧧ᗇ儈᭸ⲴᵪಘᆖҐ㇇⌅ˈн㇑䘉㇇⌅ᱟ
৽᱐Ҷ⭏⢙䗷〻DŽ൘ᵜҖѝᡁԜⲴޤ䏓ㅖਸਾаഒփˈᡰԕᡁԜнՊᢺ⌘࣋⭘൘⭏⢙⁑
රкDŽ㤕㾱㧧ᗇޣҾ֯⭘ ANN ⁑ᤏ⭏⢙㌫㔏Ⲵᴤཊؑ䈧৲㘳 Churchland & Sejnowski
˄1992˅ˈZornetzer et al.˄1994˅ˈGabriel & Moore˄1990˅DŽ
4.2 ⾔㔅㖇㔒㺞⽰
插图——原书页码:84
sharp left-ᙕᐖ䖜
sharp right-ᙕਣ䖜
straight ahead-↓ࡽᯩ
മ 4-1 ᆖҐ傮傦⊭䖖Ⲵ⾎㓿㖁㔌
4.3 䘸ਾ⾔㔅㖇㔒ᆜҖⲺ䰤从
ANN ᆖҐ䶎ᑨ䘲ਸҾ䘉ṧⲴ䰞仈˖䇝㓳䳶ਸѪਜ਼ᴹಚ༠Ⲵ༽ᵲՐᝏಘᮠᦞˈֻྲᶕ㠚
ᩴۿᵪ઼哖ݻ仾ⲴᮠᦞDŽᆳҏ䘲⭘Ҿ䴰㾱ᴤཊㅖਧ㺘⽪Ⲵ䰞仈ˈֻྲㅜ 3 ㄐ䇘䇪Ⲵߣㆆṁᆖ
Ґԫ࣑DŽ䘉ᛵߥл ANN ઼ߣㆆṁᆖҐ㓿ᑨӗ⭏㋮ᓖབྷփᖃⲴ㔃᷌DŽਟ৲㿱 Shavlik et al.
˄1991˅઼ Weiss and Kapouleas˄1989˅ѝޣҾߣㆆṁ઼ ANN ᆖҐⲴᇎ傼∄䖳DŽ৽ੁՐ
㇇⌅ᱟᴰᑨ⭘Ⲵ ANN ᆖҐᢰᵟDŽᆳ䘲ਸާᴹԕл⢩ᖱⲴ䰞仈˖
x ᇎֻᱟ⭘ᖸཊĀᙗ-٬āሩ㺘⽪ⲴDŽ㾱ᆖҐⲴⴞḷ࠭ᮠᱟᇊѹ൘ਟԕ⭘ੁ
䟿᧿䘠ⲴᇎֻѻкⲴˈੁ䟿⭡亴ݸᇊѹⲴ⢩ᖱ㓴ᡀˈֻྲ ALVINN ֻᆀѝ
Ⲵۿ㍐٬DŽ䘉Ӌ䗃ޕᙗѻ䰤ਟԕ儈ᓖˈޣҏਟԕӂ⤜・DŽ䗃ޕ٬ਟԕ
ᱟԫօᇎᮠDŽ
x ⴞḷ࠭ᮠⲴ䗃ࠪਟ㜭ᱟᮓ٬ǃᇎᮠ٬ᡆ㘵⭡㤕ᒢᇎᮠᙗᡆᮓᙗ㓴ᡀ
Ⲵੁ䟿DŽֻྲˈ൘ ALVINN ㌫㔏ѝ䗃ࠪⲴᱟ 30 њᙗⲴੁ䟿ˈ⇿ањ࠶䟿
ሩᓄањᔪ䇞Ⲵ傮傦ᯩੁDŽ⇿њ䗃ࠪ٬ᱟ 0 ઼ 1 ѻ䰤ⲴḀњᇎᮠˈሩᓄҾ൘
亴⍻ᓄ傮傦ᯩੁᰦⲴ㖞ؑᓖ˄confidence˅DŽᡁԜҏਟԕ䇝㓳ањঅа㖁
㔌ˈ਼ᰦ䗃ࠪ㹼傦ᯩੁ઼ᔪ䇞Ⲵ࣐䙏ᓖˈ䘉ਚ㾱ㆰঅൠᢺ㕆⸱䘉є䗃ࠪ亴
⍻Ⲵੁ䟿䘎᧕൘а䎧ቡਟԕҶDŽ
x 䇝㓳ᮠᦞਟ㜭वਜ਼䭉䈟DŽANN ᆖҐ㇇⌅ሩҾ䇝㓳ᮠᦞѝⲴ䭉䈟ᴹ䶎ᑨྭⲴ
励ἂᙗDŽ
x ਟᇩᗽ䮯ᰦ䰤Ⲵ䇝㓳DŽ㖁㔌䇝㓳㇇⌅䙊ᑨ∄ߣۿㆆṁᆖҐ䘉ṧⲴ㇇⌅䴰㾱ᴤ
䮯Ⲵ䇝㓳ᰦ䰤DŽ䇝㓳ᰦ䰤ਟ㜭Ӿࠐ。䫏ࡠࠐሿᰦˈ䘉㾱ⴻ㖁㔌ѝᵳ٬Ⲵᮠ䟿ǃ
㾱㘳㲁Ⲵ䇝㓳ᇎֻⲴᮠ䟿ǃԕ৺н਼ᆖҐ㇇⌅৲ᮠⲴ䇮㖞ㅹഐ㍐DŽ
x ਟ㜭䴰㾱ᘛ䙏≲ࠪⴞḷ࠭ᮠ٬DŽቭ㇑ ANN ⲴᆖҐᰦ䰤ሩ䖳䮯ˈնሩᆖҐ
Ⲵ㖁㔌≲٬ˈԕׯᢺ㖁㔌ᓄ⭘ࡠਾ㔝Ⲵᇎֻˈ䙊ᑨᱟ䶎ᑨᘛ䙏ⲴDŽֻྲˈ
ALVINN ൘䖖䖶ੁࡽ㹼傦ᰦˈ⇿。ᓄ⭘ᆳⲴ⾎㓿㖁㔌㤕ᒢ⅑ˈԕнᯝൠᴤᯠ
傮傦ᯩੁDŽ
x Ӫ㊫㜭⨶䀓ᆖࡠⲴⴞḷ࠭ᮠᱟн䟽㾱ⲴDŽ⾎㓿㖁㔌ᯩ⌅ᆖҐࡠⲴᵳ٬㓿ᑨ
ᱟӪ㊫䳮ԕ䀓䟺ⲴDŽᆖࡠⲴ⾎㓿㖁㔌∄ᆖࡠⲴ㿴ࡉ䳮ҾՐ䗮㔉Ӫ㊫DŽ
䘉аㄐⲴަ։䜘࠶ᱟ䘉ṧ㓴㓷Ⲵ˖ᡁԜݸ䇘䇪䇝㓳অњঅⲴݳᆖҐ㇇⌅ˈ਼ᰦӻ㓽㓴ᡀ
⾎㓿㖁㔌Ⲵࠐѫ㾱অˈݳवᤜᝏ⸕ಘ˄perceptron˅ǃ㓯ᙗঅ˄ݳlinear unit˅઼ sigmoid অ
˄ݳsigmoid unit˅DŽ❦ਾ㔉ࠪ䇝㓳䘉Ӌঅݳ㓴ᡀⲴཊቲ㖁㔌Ⲵ৽ੁՐ㇇⌅ˈᒦ㘳㲁ࠐња
㡜ᙗⲴ䰞仈ˈ∄ྲ ANN Ⲵ㺘ᖱ㜭࣋ǃٷ䇮オ䰤ᩌ㍒Ⲵᵜ䍘⢩ᖱǃ䗷ᓖᤏਸ䰞仈ǃԕ৺৽ੁ
Ր㇇⌅ⲴਈփDŽᵜㄐҏ㔉ࠪҶањᓄ⭘৽ੁՐ㇇⌅䇶࡛Ӫ㝨Ⲵ䈖㓶ֻᆀˈᒦᤷሬ䈫㘵ྲ
օਆᗇ䘉њֻᆀⲴᮠᦞ઼ԓ⸱ˈᒦ䘋а↕ᇎ傼䘉њᓄ⭘DŽ
4.4 ⸛ಞ
1 if w0 w1 x1 w2 x 2 wn x n ! 0
o( x1 ,, x n ) ®
¯ 1 otherwise
ަѝ⇿ањwiᱟањᇎᮠᑨ䟿ˈᡆਛڊᵳ٬˄weight˅ˈ⭘ᶕߣᇊ䗃ޕxiሩᝏ⸕ಘ䗃ࠪⲴ
䍑 ⥞ ⦷ DŽ 䈧 ⌘ ˈ ᑨ 䟿 (-w0) ᱟ а њ 䰸 ٬ ˈ ᆳ ᱟ Ѫ Ҷ ֯ ᝏ ⸕ ಘ 䗃 ࠪ 1 ˈ 䗃 ࣐ Ⲵ ޕᵳ ઼
w1 x1 w2 x 2 wn x n ᗵ享䎵䗷Ⲵ䰸٬DŽ
插图——原书页码:87 к
മ 4-2 ᝏ⸕ಘ
ѪҶㆰॆ㺘⽪ˈᡁԜٷᜣᴹањ䱴࣐Ⲵᑨ䟿䗃ޕx0=1ˈ䛓ѸᡁԜቡਟԕᢺк䗩Ⲵнㅹᔿ
& &
¦
n
߉Ѫ i 0
wi xi ! 0 ˈᡆԕੁ䟿ᖒᔿ߉Ѫ w x ! 0 DŽѪҶㆰ⸝䎧㿱ˈᡁԜᴹᰦՊᢺᝏ⸕ಘ࠭
ᮠ߉Ѫ˖
& & &
o( x ) sgn( w x )
ަѝˈ
1 if y ! 0
sgn( y ) ®
¯ 1 otherwise
ᆖҐањᝏ⸕ಘણ⵰䘹ᤙᵳw0, …, wnⲴ٬DŽᡰԕᝏ⸕ಘᆖҐ㾱㘳㲁Ⲵى䘹ٷ䇮オ䰤H
ቡᱟᡰᴹਟ㜭Ⲵᇎᮠ٬ᵳੁ䟿Ⲵ䳶ਸDŽ
& &
H {w | w ( n 1) }
4.4.1 ⸛ಞⲺ㺞ᖷ㜳࣑
ᡁԜਟԕᢺᝏ⸕ಘⴻᱟ n 㔤ᇎֻオ䰤˄ণ⛩オ䰤˅ѝⲴ䎵ᒣ䶒ߣㆆ䶒DŽሩҾ䎵ᒣ䶒а
Ⲵחᇎֻˈᝏ⸕ಘ䗃ࠪ 1ˈሩҾਖаⲴחᇎֻ䗃ࠪ-1ˈྲമ 4-3 ᡰ⽪DŽ䘉њߣㆆ䎵ᒣ䶒ᯩ〻
& &
ᱟ w x 0 DŽᖃ❦ˈḀӋ↓৽ṧֻ䳶ਸнਟ㜭㻛ԫа䎵ᒣ䶒࠶ࢢDŽ䛓Ӌਟԕ㻛࠶ࢢⲴ〠Ѫ
㓯ᙗਟ࠶˄linearly separable˅ṧֻ䳶ਸDŽ
插图——原书页码:87 л
മ 4-3 є䗃ޕᝏ⸕ಘ㺘⽪Ⲵߣㆆ䶒
˄a˅а㓴䇝㓳ṧ઼ֻањ㜭↓⺞࠶㊫䘉ӋṧֻⲴᝏ⸕ಘߣㆆ䶒DŽ˄b˅а㓴䶎㓯ᙗਟ࠶Ⲵ䇝㓳ṧֻ
˄ҏቡᱟн㜭⭘ԫаⴤ㓯↓⺞࠶㊫Ⲵṧֻ˅DŽx1઼x2ᱟᝏ⸕ಘⲴ䗃ޕDŽĀ+ā㺘⽪↓ֻˈĀ-ā㺘⽪
৽ֻDŽ
অ⤜Ⲵᝏ⸕ಘਟԕ⭘ᶕ㺘⽪ᖸཊᐳቄ࠭ᮠDŽֻྲˈٷᇊ⭘ 1˄ⵏ˅઼-1˄˅ٷ㺘⽪ᐳቄ
٬ˈ䛓Ѹ֯⭘ањє䗃Ⲵޕᝏ⸕ಘᶕᇎ⧠о࠭ᮠ˄AND˅Ⲵаᯩ⌅ᱟ䇮㖞ᵳw0= -0.8 ᒦф
w1=w2=0.5DŽྲ᷌⭘䘉њᝏ⸕ಘᶕ㺘⽪ᡆ࠭ᮠ˄OR˅ˈ䛓Ѹਚ㾱᭩ਈᆳⲴ䰸٬w0=-0.3DŽһᇎ
кˈAND઼ORਟ㻛ⴻm-of-n࠭ᮠⲴ⢩ֻ˖ҏቡᱟ㾱֯࠭ᮠ䗃ࠪѪⵏˈ䛓Ѹᝏ⸕ಘⲴnњ䗃
ޕѝ㠣ቁmњᗵ享ѪⵏDŽOR࠭ᮠሩᓄҾm=1ˈAND࠭ᮠሩᓄҾm=n.DŽԫm-of-n࠭ᮠਟԕᖸ
ᇩ᱃ൠ⭘ᝏ⸕ಘ㺘⽪ˈਚ㾱䇮㖞ᡰᴹ䗃ⲴޕᵳѪ਼ṧⲴ٬˄ྲ 0.5˅ˈ❦ਾᦞ↔ᚠᖃൠ䇮㖞䰸
٬DŽ
ᝏ⸕ಘ㺘⽪оǃᡆǃо䶎ǃᡆ䶎Ⲵ㜭࣋ᱟᖸ䟽㾱ⲴˈഐѪᡰᴹⲴᐳቄ࠭ᮠ䜭ਟ㺘⽪Ѫส
Ҿ䘉Ӌ࠭ᮠⲴӂ䘎অⲴݳḀњ㖁㔌DŽһᇎкˈӵ⭘єቲ␡ᓖⲴᝏ⸕ಘ㖁㔌ቡਟԕ㺘⽪ᡰ
ᴹⲴᐳቄ࠭ᮠˈ൘䘉Ӌ㖁㔌ѝ䗃ޕ㻛䘱ࡠཊњঅˈݳ䘉ӋঅⲴݳ䗃ࠪ㻛䗃ࡠޕㅜҼ㓗ˈҏᱟ
ᴰਾа㓗DŽаᯩ⌅ᱟ⭘᷀ਆ㤳ᔿ˄disjunctive normal form˅˄ҏቡᱟሩ䗃઼ޕᆳԜⲴᇊ
Ⲵݸ䘋㹼ਸਆˈሩ䘉㓴ਸਆᔿ䘋㹼᷀ਆ˅ᶕ㺘⽪ᐳቄ࠭ᮠDŽ⌘ˈ㾱ᢺањ AND ᝏ⸕ಘ
Ⲵ䗃≲ޕᇊˈਚ㾱ㆰঅൠ᭩ਈᓄ䗃ޕᵳⲴㅖਧDŽ
ഐѪ䰸٬অⲴݳ㖁㔌ਟԕ㺘⽪བྷ䟿Ⲵ࠭ᮠˈ㘼অ⤜Ⲵঅݳн㜭ࡠڊ䘉а⛩ˈᡰԕ䙊ᑨᡁ
Ԝᝏޤ䏓ⲴᱟᆖҐ䰸٬অݳ㓴ᡀⲴཊቲ㖁㔌DŽ
4.4.2 ⸛ಞ䇣㓹⌋ࡏ
㲭❦ᡁԜⲴⴞⲴᱟᆖҐ⭡ཊњঅݳӂ䘎Ⲵ㖁㔌ˈնᡁԜ䘈ᱟӾྲօᆖҐঅњᝏ⸕ಘⲴᵳ
٬ᔰDŽ߶⺞ൠ䈤ˈ䘉䟼ⲴᆖҐԫ࣑ᱟߣᇊањᵳੁ䟿ˈᆳਟԕ֯ᝏ⸕ಘሩҾ㔉ᇊⲴ䇝㓳ṧ
ֻ䗃ࠪ↓⺞Ⲵ 1 ᡆ-1DŽ
ᐢ㓿⸕䚃ᴹࠐ䀓ߣ䘉њᆖҐԫ࣑Ⲵ㇇⌅DŽ䘉䟼ᡁԜ㘳㲁є˖ᝏ⸕ಘ⌅ࡉ઼ delta ⌅
ࡉ˄delta rule˅˄ᱟㅜ 1 ㄐѝ⭘ᶕᆖҐ䇴ՠ࠭ᮠⲴᴰሿ൷ᯩ⌅ LMS Ⲵањਈփ˅DŽ䘉є㇇
⌅؍䇱᭦ᮋࡠਟ᧕ਇⲴٷ䇮ˈ൘н਼ⲴᶑԦл᭦ᮋࡠⲴٷ䇮⮕ᴹн਼DŽ䘉єᯩ⌅ሩҾ ANN
ᱟᖸ䟽㾱ⲴˈഐѪᆳԜᨀҶᆖҐཊњঅݳᶴᡀⲴ㖁㔌ⲴสDŽ
Ѫᗇࡠਟ᧕ਇⲴᵳੁ䟿ˈа࣎⌅ᱟӾ䲿ᵪⲴᵳ٬ᔰˈ❦ਾ৽༽ൠᓄ⭘䘉њᝏ⸕ಘࡠ
⇿њ䇝㓳ṧֻˈਚ㾱ᆳ䈟࠶㊫ṧֻቡ؞᭩ᝏ⸕ಘⲴᵳ٬DŽ䟽༽䘉њ䗷〻ˈⴤࡠᝏ⸕ಘ↓⺞࠶
㊫ᡰᴹⲴ䇝㓳ṧֻDŽ⇿а↕ṩᦞᝏ⸕ಘ䇝㓳⌅ࡉ˄perceptron training rule˅ᶕ؞᭩ᵳ٬ˈҏ
ቡᱟṩᦞл䶒Ⲵ⌅ࡉ؞᭩о䗃ޕxiሩᓄⲴᵳwi:
wimwi+'wi
ަѝ
'wi =K(t-o)xi
䘉䟼 t ᱟᖃࡽ䇝㓳ṧֻⲴⴞḷ䗃ࠪˈo ᱟᝏ⸕ಘⲴ䗃ࠪˈKᱟањ↓Ⲵᑨᮠ〠ѪᆖҐ䙏
⦷˄learning rate˅DŽᆖҐ䙏⦷Ⲵ⭘ᱟ㕃઼⇿а↕䈳ᮤᵳⲴ〻ᓖDŽᆳ䙊ᑨ㻛䇮ѪањሿⲴᮠ
٬˄ֻྲ 0.1˅ˈ㘼фᴹᰦՊ֯ަ䲿⵰ᵳ䈳ᮤ⅑ᮠⲴ໎࣐㘼㺠߿DŽ
ѪӰѸ䘉њᴤᯠ⌅ࡉՊᡀ࣏᭦ᮋࡠ↓⺞Ⲵᵳ٬˛ѪҶᗇࡠⴤ㿲Ⲵᝏ㿹ˈ㘳㲁аӋ⢩
ֻDŽٷᇊ䇝㓳ṧᵜᐢ㻛ᝏ⸕ಘ↓⺞࠶㊫DŽ䘉ᰦˈ(t-o)ᱟ 0ˈ䘉֯'wiѪ 0ˈᡰԕ⋑ᴹᵳ٬㻛؞
᭩DŽ㘼ྲ᷌ᖃⴞḷ䗃ࠪᱟ+1 ᰦᝏ⸕ಘ䗃ࠪањ-1ˈ䘉ᛵߥѪ֯ᝏ⸕ಘ䗃ࠪањ+1 㘼нᱟ
& &
-1ˈᵳ٬ᗵ享㻛؞᭩ԕ໎བྷ w x Ⲵ٬DŽֻྲˈྲ᷌xi>0ˈ䛓Ѹ໎བྷwiՊ֯ᝏ⸕ಘᴤ᧕䘁↓⺞
࠶㊫䘉њᇎֻDŽ⌘䘉ᛵߥл䇝㓳⌅ࡉՊ໎䮯wiˈഐѪ(t-o)ˈK઼xi䜭ᱟ↓ⲴDŽֻྲˈྲ᷌
xi=0.8ˈK=0.1ˈt=1ˈᒦфo= -1ˈ䛓Ѹᵳᴤᯠቡᱟ'wi =K(t-o)xi=0.1(1-(-1))0.8=0.16DŽਖаᯩ
䶒ˈྲ᷌t=-1 㘼o=1ˈ䛓Ѹ઼↓Ⲵxiޣ㚄Ⲵᵳ٬Պ㻛߿ሿ㘼нᱟ໎བྷDŽ
һᇎкਟԕ䇱᰾ˈ൘ᴹ䲀⅑֯⭘ᝏ⸕ಘ䇝㓳⌅ࡉਾˈк䶒Ⲵ䇝㓳䗷〻Պ᭦ᮋࡠањ㜭↓
⺞࠶㊫ᡰᴹ䇝㓳ṧֻⲴᵳੁ䟿ˈࡽᨀᱟ䇝㓳ṧֻ㓯ᙗਟ࠶ˈᒦф֯⭘Ҷ࠶ݵሿⲴK ˄৲㿱
Minskey & Papert 1969˅DŽྲ᷌ᮠᦞнᱟ㓯ᙗਟ࠶Ⲵˈ䛓Ѹн㜭؍䇱᭦ᮋDŽ
ቭ㇑ᖃ䇝㓳ṧֻ㓯ᙗਟ࠶ᰦˈᝏ⸕ಘ⌅ࡉਟԕᡀ࣏ൠࡠањᵳੁ䟿ˈնྲ᷌ṧֻнᱟ
㓯ᙗਟ࠶ᰦᆳሶн㜭᭦ᮋDŽഐ↔ˈӪԜ䇮䇑Ҷਖањ䇝㓳⌅ࡉᶕݻᴽ䘉њн䏣ˈ〠Ѫ delta
⌅ࡉ˄delta rule˅DŽྲ᷌䇝㓳ṧᵜнᱟ㓯ᙗਟ࠶Ⲵˈ䛓Ѹ delta ⌅ࡉՊ᭦ᮋࡠⴞḷᾲᘥⲴᴰ֣
䘁լDŽ(how to converge?)
ѪҶ᧘ሬ㓯ᙗঅⲴݳᵳ٬ᆖҐ⌅ࡉˈݸᤷᇊањᓖ䟿ḷ߶ᶕ㺑䟿ٷ䇮˄ᵳੁ䟿˅ሩҾ
䇝㓳ṧֻⲴ䇝㓳䈟ᐞ˄training error˅
DŽቭ㇑ᴹᖸཊ࣎⌅ᇊѹ䘉њ䈟ᐞˈањᑨ⭘Ⲵ⢩࡛ᯩׯ
Ⲵᓖ䟿ḷ߶Ѫ˖
& 1
E ( w) ¦
2 dD
(t d od ) 2 ˄4.2˅
ަѝDᱟ䇝㓳ṧֻ䳶ਸˈtdᱟ䇝㓳ṧֻdⲴⴞḷ䗃ࠪˈodᱟ㓯ᙗঅݳሩ䇝㓳ṧֻdⲴ䗃ࠪDŽ
&
൘䘉њᇊѹѝˈ E (w) ᱟⴞḷ䗃ࠪtd઼㓯ᙗঅݳ䗃ࠪodⲴᐞᔲⲴᒣᯩ൘ᡰᴹⲴ䇝㓳ṧֻк≲
&
઼ਾ䲔ԕ 2DŽ䘉䟼ᡁԜᢺEᇊѪ w Ⲵ࠭ᮠˈᱟഐѪ㓯ᙗঅⲴݳ䗃ࠪo䎆Ҿ䘉њᵳੁ䟿DŽᖃ
❦Eҏ䎆Ҿ⢩ᇊⲴ䇝㓳ṧֻ䳶ਸˈնᡁԜ䇔ѪᆳԜ൘䇝㓳ᵏ䰤ᱟപᇊⲴˈᡰԕнᗵ哫✖ൠ
ᢺE߉Ѫ䇝㓳ṧֻⲴ࠭ᮠDŽㅜ 6 ㄐ㔉ࠪҶ䘹ᤙ䘉EᇊѹⲴа䍍ਦᯟ䇪䇱DŽ⺞࠷ൠ䇢ˈ൘
䛓䟼ᡁԜᤷࠪҶ൘аᇊᶑԦлˈሩҾ㔉ᇊⲴ䇝㓳ᮠᦞ֯EᴰሿॆⲴٷ䇮ҏቡᱟHѝᴰਟ㜭Ⲵ
ٷ䇮DŽ
4.4.3.1 ᖘ䊗ौٽ䇴グ䰪
插图——原书页码:90
മ 4-4 н਼ٷ䇮Ⲵ䈟ᐞ
ሩҾᴹєњᵳ٬Ⲵ㓯ᙗঅٷˈݳ䇮オ䰤Hቡᱟw0,w1ᒣ䶒DŽ㓥䖤㺘⽪оപᇊⲴ䇝㓳ṧֻ䳶ਸᓄⲴᵳ
ੁ䟿ٷ䇮Ⲵ䈟ᐞDŽ㇝ཤᱮ⽪Ҷ䈕⛩ởᓖⲴ৽ᯩੁˈᤷࠪҶ൘w0ˈw1ᒣ䶒ѝ⋯䈟ᐞᴢ䶒ᴰ䲑ጝл䱽
ⲴᯩੁDŽ
ởᓖл䱽ᩌ㍒⺞ᇊањ֯ E ᴰሿॆⲴᵳੁ䟿Ⲵᯩ⌅ᱟӾањԫⲴࡍᵳੁ䟿ᔰˈ
❦ਾԕᖸሿⲴ↕Հ৽༽؞᭩䘉њੁ䟿DŽ൘⇿а↕ˈ᤹➗⋯䈟ᐞᴢ䶒ӗ⭏ᴰ䲑ጝл䱽Ⲵᯩੁ؞
᭩ᵳੁ䟿˄৲㿱മ 4-4˅
DŽ㔗㔝䘉њ䗷〻ⴤࡠࡠ䗮ޘተⲴᴰሿ䈟ᐞDŽ
4.4.3.2 ụᓜс䲃⌋ࡏⲺ᧞ሲ
&
ᡁԜᘾṧ㜭䇑㇇ࠪ⋯䈟ᐞᴢ䶒ᴰ䲑ጝл䱽Ⲵᯩੁ˛ਟԕ䙊䗷䇑㇇ E ሩੁ䟿 w Ⲵ⇿
&
њ࠶䟿Ⲵሬᮠᶕᗇࡠ䘉њᯩੁDŽ䘉њੁ䟿ሬᮠ㻛〠Ѫ E ሩҾ w Ⲵởᓖ˄gradient˅ˈ䇠
&
E (w) DŽ
& ª wE wE wE º
E ( w) « , , , » ˄4.3˅
¬ ww0 ww1 wwn ¼
&
⌘ E (w) ᵜ䓛ᱟањੁ䟿ˈᆳⲴᡀઈᱟEሩ⇿њwiⲴٿሬᮠDŽ当梯度被解释为权空间
的一个向量时,它确定了使E最陡峭上升的方向。ᡰԕ䘉њੁ䟿Ⲵ৽ᯩੁ㔉ࠪҶᴰ䲑ጝл䱽
&
ⲴᯩੁDŽֻྲˈമ 4-4 ѝⲴ㇝ཤᱮ⽪Ҷw0ˈw1ᒣ䶒Ⲵањ⢩ᇊ⛩Ⲵ䍏ởᓖ E (w) DŽ
ᰒ❦ởᓖ⺞ᇊҶ E ᴰ䲑ጝкॷⲴᯩੁˈ䛓Ѹởᓖл䱽Ⲵ䇝㓳⌅ࡉᱟ˖
& & &
w m w 'w
ަѝ
& &
'w K E (w) ˄4.4˅
䘉䟼Kᱟањ↓ⲴᑨᮠਛڊᆖҐ䙏⦷ˈᆳߣᇊởᓖл䱽ᩌ㍒ѝⲴ↕䮯DŽަѝⲴ䍏ਧᱟഐ
ѪᡁԜᜣ㾱䇙ᵳੁ䟿ੁ E л䱽Ⲵᯩੁ〫ࣘDŽ䘉њ䇝㓳⌅ࡉҏਟԕ߉ᡀᆳⲴ࠶䟿ᖒᔿ˖
wimwi+'wi
ަѝ
wE
'wi K ˄4.5˅
wwi
wE &
䘉ṧᖸᾊˈᴰ䲑ጝⲴл䱽ਟԕ䙊䗷᤹∄ֻ ᭩ਈ w Ⲵ⇿а࠶䟿wiᶕᇎ⧠DŽ
wwi
㾱ᖒᡀањṩᦞㅹᔿ˄4.5˅䘝ԓᴤᯠᵳⲴᇎ⭘㇇⌅ˈᡁԜ䴰㾱ањ儈᭸Ⲵᯩ⌅൘⇿а
↕䇑㇇䘉њởᓖDŽᒨ䘀Ⲵᱟˈ䇑㇇䗷〻ᒦнഠ䳮DŽᡁԜਟԕӾޜᔿ˄4.2˅ѝ䇑㇇ E Ⲵᗞ࠶ˈ
wE
Ӿ㘼ᗇࡠ㓴ᡀ䘉њởᓖੁ䟿Ⲵ࠶䟿 DŽ䗷〻ྲл˖
wwi
wE w 1
wwi
¦
wwi 2 dD
(t d od ) 2
1 w
¦
2 dD wwi
(t d od ) 2
1 w
¦
2 dD
2(t d od )
wwi
(t d od )
w & &
¦ (t
d D
d od )
wwi
(t d w x d )
wE
wwi
¦ (t
d D
d o d )( xid ) ˄4.6˅
ަѝxid㺘⽪䇝㓳ṧֻdⲴањ䗃࠶ޕ䟿xiDŽ⧠൘ᡁԜᴹҶањㅹᔿˈ㜭ཏ⭘㓯ᙗঅⲴݳ
wE
䗃ޕxidǃ䗃ࠪodǃԕ৺䇝㓳ṧֻⲴⴞḷ٬td㺘⽪ DŽᢺㅹᔿ˄4.6˅ԓޕㅹᔿ˄4.5˅ׯᗇࡠ
wwi
Ҷởᓖл䱽ᵳ٬ᴤᯠ⌅ࡉDŽ
ᾲ㘼䀰ѻˈ䇝㓳㓯ᙗঅⲴݳởᓖл䱽㇇⌅ྲл˖䘹ਆањࡍⲴ䲿ᵪᵳੁ䟿˗ᓄ⭘㓯ᙗ
অࡠݳᡰᴹⲴ䇝㓳ṧֻˈ❦ਾṩᦞޜᔿ˄4.7˅䇑㇇⇿њᵳ٬Ⲵ'wi˗䙊䗷࣐к'wiᶕᴤᯠ⇿
њᵳ٬ˈ❦ਾ䟽༽䘉њ䗷〻DŽ䘉њ㇇⌅㻛ᖂ㓣൘㺘˄4.1˅ѝDŽഐѪ䈟ᐞᴢ䶒ӵवਜ਼ањޘ
ተⲴᴰሿ٬ˈᡰԕᰐ䇪䇝㓳ṧᵜᱟ㓯ᙗਟ࠶ˈ䘉њ㇇⌅Պ᭦ᮋࡠާᴹᴰሿ䈟ᐞⲴᵳੁ䟿ˈ
ᶑԦᱟᗵ享֯⭘ањ䏣ཏሿⲴᆖҐ䙏⦷KDŽྲ᷌Kཚབྷˈởᓖл䱽ᩌ㍒ቡᴹ䎺䗷䈟ᐞᴢ䶒ᴰ
ሿ٬Ⲵড䲙ˈ㘼нᱟ⮉ڌ൘䛓а⛩DŽഐ↔ˈሩ↔㇇⌅Ⲵаᑨ⭘Ⲵ᭩䘋ᱟ䲿⵰ởᓖл䱽↕ᮠ
Ⲵ໎࣐䙀⑀߿ሿKⲴ٬DŽ
㺘 4-1 䇝㓳㓯ᙗঅⲴݳởᓖл䱽㇇⌅
Gradient-Descent(training_examples, K)
& &
training_examples ѝ⇿ањ䇝㓳ṧֻᖒᔿѪᒿ <ڦx , t>ˈަѝ x ᱟ䗃ޕ٬ੁ䟿ˈt ᱟⴞ
ḷ䗃ࠪ٬DŽKᱟᆖҐ䙏⦷˄ֻྲ 0.05˅ DŽ
z ࡍॆ⇿њwiѪḀњሿⲴ䲿ᵪ٬
z 䙷ࡠ㓸→ᶑԦѻࡽˈڊԕл˖
z ࡍॆ⇿њ'wiѪ 0
&
z ሩҾ䇝㓳ṧֻ training_examples ѝⲴ⇿њ< x , t>ˈ˖ڊ
&
z ᢺᇎֻ x 䗃↔ࡠޕঅˈݳ䇑㇇䗃ࠪ o
z ሩҾ㓯ᙗঅ⇿Ⲵݳњᵳwiˈڊ
'wi m'wi +K(t-o)xi ˄T4.1˅
z ሩҾ㓯ᙗঅ⇿Ⲵݳњᵳwiˈڊ
wim wi +'wi ˄T4.2˅
4.4.3.3 ụᓜс䲃Ⲻ䳅ᵰ䘇ղ
ởᓖл䱽ᱟа䟽㾱Ⲵ䙊⭘ᆖҐ㤳රDŽᆳᱟᩌ㍒ᓎབྷٷ䇮オ䰤ᡆᰐ䲀ٷ䇮オ䰤Ⲵаㆆ
⮕ˈᆳਟᓄ⭘Ҿ┑䏣ԕлᶑԦⲴԫօᛵߥ˖˄1˅ٷ䇮オ䰤वਜ਼䘎㔝৲ᮠॆⲴٷ䇮˄ֻྲˈа
њ㓯ᙗঅⲴݳᵳ٬˅˗˄2˅䈟ᐞሩҾ䘉Ӌٷ䇮৲ᮠਟᗞDŽᓄ⭘ởᓖл䱽Ⲵѫ㾱ᇎ䐥䰞仈ᱟ˖
˄1˅ᴹᰦ᭦ᮋ䗷〻ਟ㜭䶎ᑨធ˄ᆳਟ㜭䴰㾱ᮠॳ↕Ⲵởᓖл䱽˅˗˄2˅ྲ᷌൘䈟ᐞᴢ䶒кᴹ
ཊњተ䜘ᶱሿ٬ˈ䛓Ѹн㜭؍䇱䘉њ䗷〻Պࡠޘተᴰሿ٬DŽ
㕃䀓䘉Ӌഠ䳮Ⲵањᑨ㿱Ⲵởᓖл䱽ਈփ㻛〠Ѫ໎䟿ởᓖл䱽˄incremental gradient
descent˅ˈᡆ䲿ᵪởᓖл䱽˄stochastic gradient descent˅DŽ䢤Ҿ
ޜᔿ˄4.7˅㔉ࠪⲴởᓖл䱽䇝㓳⌅ࡉ൘ሩ D ѝⲴᡰᴹ䇝㓳ṧֻ≲઼ਾ䇑㇇ᵳ٬ᴤᯠˈ
䲿ᵪởᓖл䱽Ⲵᙍᜣᱟṩᦞ⇿њঅ⤜ṧֻⲴ䈟ᐞ໎䟿ൠ䇑㇇ᵳ٬ᴤᯠˈᗇࡠ䘁լⲴởᓖл䱽
ᩌ㍒DŽ؞᭩ਾⲴ䇝㓳⌅ࡉоޜᔿ˄4.7˅㔉ࠪⲴլˈਚᱟ൘䘝ԓ䇑㇇⇿њ䇝㓳ṧֻᰦṩᦞ
л䶒Ⲵޜᔿᶕᴤᯠᵳ٬
'wi =K(t-o)xi ˄4.10˅
൘ᇎ䐥ѝˈᰐ䇪ᱟ䲿ᵪⲴ䘈ᱟḷ߶Ⲵởᓖл䱽ᯩ⌅䜭㻛ᒯ⌋ᓄ⭘DŽ
ቭ㇑ᡁԜ㔉ࠪⲴ໎䟿⌅ࡉਟᆖҐ䶎䰸٬㓯ᙗঅⲴݳᵳˈնᆳҏਟԕᯩׯൠ⭘ᶕ䇝㓳ᴹ䰸
& & & &
٬Ⲵᝏ⸕ಘঅݳDŽٷᇊ o= w x ᱟк䶒Ⲵ䶎䰸٬㓯ᙗঅⲴݳ䗃ࠪˈᒦф oc=sgn˄ w x ˅ᱟ o
㻛䰸٬ॆⲴ㔃᷌ˈо൘ᝏ⸕ಘѝаṧDŽ⧠൘ྲ᷌ᡁԜᐼᵋѪ oc䇝㓳ањᝏ⸕ಘ֯ަᤏਸⴞḷ
٬Ѫr1 Ⲵ䇝㓳ṧֻˈਟԕ֯⭘о䇝㓳 o аṧⲴⴞḷ٬઼䇝㓳ṧֻˈн䗷֯⭘໎䟿⌅ࡉDŽᖸ
᰾ᱮˈྲ᷌䶎䰸٬䗃ࠪ o 㜭ཏ㻛䇝㓳ࡠᆼ㖾ᤏਸ䘉Ӌ٬ˈ䛓Ѹ䰸٬䗃ࠪ oc ҏՊᤏਸᆳԜ˄ഐ
Ѫ sgn(1)=1ˈ઼ sgn(-1)=-1˅DŽণ֯н㜭ᆼ㖾ൠᤏਸⴞḷ٬ˈਚ㾱㓯ᙗঅⲴݳ䗃ࠪާᴹ↓⺞Ⲵ
ㅖਧˈᴹ䰸٬Ⲵ oc٬Պ↓⺞ൠᤏਸⴞḷ٬r1DŽ❦㘼⌘ˈ⭡Ҿ䘉њ䗷〻Պᗇࡠ֯㓯ᙗঅݳ䗃
ࠪⲴ䈟ᐞᴰሿॆⲴᵳ٬ˈ䘉Ӌᵳ٬н㜭؍䇱ҏ֯ᴹ䰸٬䗃ࠪ ocⲴ䈟࠶㊫ṧֻᮠᴰሿॆDŽ
4.4.4 ቅ㔉
ᡁԜᐢ㓿⹄ウҶ䘝ԓᆖҐᝏ⸕ಘᵳ٬ⲴєњլⲴ㇇⌅DŽ䘉єњ㇇⌅䰤Ⲵޣ䭞ᐞᔲᱟᝏ
⸕ಘ䇝㓳⌅ࡉṩᦞ䰸٬ॆ˄thresholded˅Ⲵᝏ⸕ಘ䗃ࠪⲴ䈟ᐞᴤᯠᵳ٬˄4.4.2˅ˈ❦㘼໎䟿
⌅ࡉṩᦞ䗃Ⲵޕ䶎䰸٬ॆ˄unthresholded˅㓯ᙗ㓴ਸⲴ䈟ᐞᶕᴤᯠᵳ(4.4.3)DŽ
䘉єњ䇝㓳⌅ࡉ䰤Ⲵᐞᔲ৽᱐൘н਼Ⲵ᭦ᮋ⢩ᙗкDŽᝏ⸕ಘ䇝㓳⌅ࡉ㓿䗷ᴹ䲀⅑Ⲵ䘝ԓ
᭦ᮋࡠањ㜭⨶ᜣ࠶㊫䇝㓳ᮠᦞⲴٷ䇮ˈնᶑԦᱟ䇝㓳ṧֻ㓯ᙗਟ࠶DŽ໎䟿⌅ࡉ⑀䘁᭦ᮋࡠ
ᴰሿ䈟ᐞٷ䇮ˈਟ㜭䴰㾱ᰐ䲀Ⲵᰦ䰤ˈնᰐ䇪䇝㓳ṧֻᱟ㓯ᙗਟ࠶䜭Պ᭦ᮋDŽޣҾԕк᭦
ᮋᙗⲴ䈖㓶䇱᰾ਟԕ৲㘳 Hertz et al.˄1991˅DŽ
ᆖҐᵳੁ䟿Ⲵㅜйਟ㜭ᯩ⌅ᱟ㓯ᙗ㿴ࡂ˄linear programming˅DŽ㓯ᙗ㿴ࡂᱟ䀓㓯ᙗн
& & & &
ㅹᔿᯩ〻㓴Ⲵа䙊⭘Ⲵᴹ᭸ᯩ⌅DŽ⌘⇿њ䇝㓳ṧֻሩᓄањᖒᔿѪ w x >0 ᡆ w x d0
ⲴнㅹᔿˈᒦфᆳԜⲴ䀓ቡᱟᡁԜᵏᵋⲴᵳੁ䟿DŽнᒨⲴᱟˈ䘉ᯩ⌅ӵᖃ䇝㓳ṧֻ㓯ᙗਟ
࠶ᰦᴹ䀓ˈն Duda & Hart ˄1973ˈp.168˅ᔪ䇞Ҷаᴤᐗ࿉Ⲵᯩ⌅䘲ਸ䶎㓯ᙗਟ࠶Ⲵᛵ
ߥDŽᰐ䇪ྲօˈ䘉㓯ᙗ㿴ࡂⲴᯩ⌅н㜭ᢙኅࡠ䇝㓳ཊቲ㖁㔌ˈ䘉ᱟᡁԜᴰޣᗳⲴDŽ৽ˈ
↓ྲла㢲ᡰ䇘䇪ⲴˈสҾ໎䟿⌅ࡉⲴởᓖл䱽ᯩ⌅ਟԕㆰঅൠᢙኅࡠཊቲ㖁㔌DŽ
4.5 ཐቸ㖇㔒ૂਃੇՖ㇍⌋
↓ྲ 4.4.1 㢲ᡰᤷࠪⲴˈঅњᝏ⸕ಘӵ㜭㺘⽪㓯ᙗߣㆆ䶒DŽ৽ˈ৽ੁՐ㇇⌅ᡰᆖҐ
Ⲵཊቲ㖁㔌㜭ཏ㺘⽪㊫㑱ཊⲴ䶎㓯ᙗᴢ䶒DŽֻྲˈമ 4-5 ᧿䘠ҶањިරⲴཊቲ㖁㔌઼ᆳ
Ⲵߣㆆᴢ䶒DŽ䘉њ䈝丣䇶࡛ԫ࣑㾱४࠶ࠪ⧠൘Āh_dāкл᮷ѝⲴ 10 ݳ丣˄ֻྲˈĀhidāˈ
ĀhadāˈĀheadāˈĀhoodāㅹ˅DŽ䗃Ⲵޕ䈝丣ؑਧ⭘єњ৲ᮠ㺘⽪ˈᆳԜᱟ䙊䗷ሩ༠丣Ⲵ仁䉡
࠶᷀ᗇࡠⲴˈ䘉ṧᡁԜਟԕᯩׯൠ൘Ҽ㔤ᇎֻオ䰤ѝᱮ⽪ࠪߣㆆ䶒DŽྲമਟ㿱ˈཊቲ㖁㔌㜭
ཏ㺘⽪儈ᓖ䶎㓯ᙗⲴߣㆆ䶒ˈᆳ∄ࡽ䶒മ 4-3 ѝ⭫ࠪⲴঅњঅⲴݳ㓯ᙗߣㆆ䶒㺘ᖱ㜭࣋ᴤ
ᕪDŽ
插图——原书页码:96 к
മ 4-5 ཊቲࡽ侸㖁㔌Ⲵߣㆆ४ฏ
䘉䟼ᱮ⽪Ⲵ㖁㔌ᱟ⭘ᶕ䇝㓳䇶࡛ 10 ࠪ⧠൘Āh_dā˄ֻྲĀhadāˈĀhidā˅䰤Ⲵݳ丣DŽ䘉њ㖁
㔌Ⲵ䗃⭡ޕєњ৲ᮠ F1 ઼ F2 㓴ᡀˈᆳԜᱟ䙊䗷ሩ༠丣Ⲵ仁䉡࠶᷀ᗇࡠⲴDŽ㖁㔌Ⲵ 10 њ䗃ࠪሩᓄ
Ҿ 10 њਟ㜭Ⲵݳ丣DŽ䘉њ㖁㔌Ⲵ亴⍻ᱟަѝᴹᴰབྷ٬Ⲵ䗃ࠪDŽਣമ⭫ࠪҶᆖࡠⲴ㖁㔌ᡰԓ㺘Ⲵ儈
ᓖ䶎㓯ᙗߣㆆ䶒DŽമѝⲴ⛩㺘⽪⍻䈅ṧֻˈᆳԜо⭘ᶕ䇝㓳䘉њ㖁㔌Ⲵṧֻᱟᆼޘн਼ⲴDŽ˄㓿䇨
ਟ᪈㠚 Haung & Lippmann˄1988˅˅
ᵜ㢲䇘䇪ྲօᆖҐ䘉ṧⲴཊቲ㖁㔌ˈ֯⭘Ⲵ㇇⌅઼ࡽ䶒䇘䇪Ⲵởᓖл䱽ᯩ⌅լDŽ
4.5.1 ਥᗤ䰾ٲঋݹ
ᓄ䈕֯⭘ӰѸ㊫රⲴঅݳᶕѪᶴᔪཊቲ㖁㔌Ⲵส˛䎧ࡍᡁԜਟԕቍ䈅䘹ᤙࡽ䶒䇘
䇪Ⲵ㓯ᙗঅˈݳഐѪᡁԜᐢ㓿Ѫ䘉অݳሬࠪҶањởᓖл䱽ᆖҐ⌅ࡉDŽ❦㘼ˈཊњ㓯ᙗঅ
Ⲵݳ䘎᧕ӽᰗӗ⭏㓯ᙗ࠭ᮠˈ㘼ᡁԜᴤᐼᵋ䘹ᤙ㜭ཏ㺘ᖱ䶎㓯ᙗ࠭ᮠⲴ㖁㔌DŽᝏ⸕ಘঅݳᱟ
ਖа䘹ᤙˈնᆳⲴн䘎㔝䰸٬֯ᆳнਟᗞˈᡰԕн䘲ਸởᓖл䱽㇇⌅DŽᡁԜᡰ䴰㾱Ⲵᱟ䘉
ṧⲴঅˈݳᆳⲴ䗃ࠪᱟ䗃Ⲵޕ䶎㓯ᙗ࠭ᮠˈᒦф䗃ࠪᱟ䗃Ⲵޕਟᗞ࠭ᮠDŽаㆄṸᱟ sigmoid
অ˄ݳsigmoid unit˅ˈ䘉ᱟа䶎ᑨ㊫լҾᝏ⸕ಘⲴঅˈݳնᆳสҾањᒣ━Ⲵਟᗞ䰸٬࠭
ᮠDŽ
插图——原书页码:96 л
ަѝ
1
V ( y) ˄4.12˅
1 e y
V 㓿ᑨ㻛〠Ѫsigmoid࠭ᮠᡆ㘵ҏਟԕ〠Ѫlogistic࠭ᮠ˄logistic function˅DŽ⌘ᆳⲴ䗃
ࠪ㤳തѪ 0 ࡠ 1ˈ䲿䗃ޕঅ䈳䙂໎˄৲㿱മ 4-6 ѝⲴ䰸٬࠭ᮠᴢ㓯˅DŽഐѪ䘉њ࠭ᮠᢺ䶎ᑨ
བྷⲴ䗃ޕ٬ฏ᱐ሴࡠањሿ㤳തⲴ䗃ࠪˈᆳ㓿ᑨ㻛〠ѪsigmoidঅⲴݳᥔ࠭ᮠ˄squashing
function˅DŽsigmoid࠭ᮠᴹањᴹ⭘Ⲵ⢩ᖱˈᆳⲴሬᮠᖸᇩ᱃ԕᆳⲴ䗃ࠪ㺘⽪[⺞࠷ൠ䇢ˈ
dV ( y )
=V(y)(1-V(y))]DŽᡁԜሶⴻࡠˈਾ䶒Ⲵởᓖл䱽ᆖҐ⌅ࡉ֯⭘Ҷ䘉њሬᮠDŽᴹᰦҏਟ
dy
ԕ֯⭘ަԆ᱃䇑㇇ሬᮠⲴਟᗞ࠭ᮠԓᴯVDŽֻྲˈsigmoid࠭ᮠᇊѹⲴe-y亩ᴹᰦ㻛ᴯᦒѪe-kyˈ
ަѝkѪḀњ↓ᑨᮠˈ⭘ᶕߣᇊ䘉њ䰸٬࠭ᮠⲴ䲑ጝᙗDŽৼᴢ↓࠷࠭ᮠtanhᴹᰦҏ⭘ᶕԓᴯ
sigmoid࠭ᮠ˄৲㿱㓳Ґ 4.8˅DŽ
4.5.2 ਃੇՖ㇍⌋
ሩҾ⭡а㌫ࡇ⺞ᇊⲴঅݳӂ䘎ᖒᡀⲴཊቲ㖁㔌ˈ৽ੁՐ㇇⌅ਟ⭘ᶕᆖҐ䘉њ㖁㔌Ⲵᵳ
٬DŽᆳ䟷⭘ởᓖл䱽ᯩ⌅䈅മᴰሿॆ㖁㔌䗃ࠪ٬઼ⴞḷ٬ѻ䰤Ⲵ䈟ᐞᒣᯩDŽ䘉а㢲㔉ࠪ৽ੁ
Ր㇇⌅ˈла㢲᧘ሬࠪ৽ੁՐ㇇⌅֯⭘Ⲵởᓖл䱽ᵳ٬ᴤᯠ⌅ࡉDŽ
ഐѪᡁԜ㾱㘳㲁ཊњ䗃ࠪঅⲴݳ㖁㔌ˈ㘼нᱟ䊑ԕࡽਚ㘳㲁অњঅˈݳᡰԕᡁԜݸ䟽ᯠ
ᇊѹ䈟ᐞ Eˈԕׯሩᡰᴹ㖁㔌䗃ࠪⲴ䈟ᐞ≲઼DŽ
& 1
E( w ) { ¦ ¦ (t kd okd ) 2
2 d D koutputs
˄4.13˅
ަѝoutputsᱟ㖁㔌䗃ࠪঅⲴݳ䳶ਸˈtkd઼okdᱟо䇝㓳ṧֻd઼ㅜkњ䗃ࠪঅⲴޣݳ䗃ࠪ
٬DŽ
৽ੁՐ㇇⌅䶒ѤⲴᆖҐ䰞仈ᱟᩌ㍒ањᐘབྷⲴٷ䇮オ䰤ˈ䘉њオ䰤⭡㖁㔌ѝᡰᴹঅݳ
Ⲵᡰᴹਟ㜭Ⲵᵳ٬ᇊѹDŽ䘉ᛵߥਟԕ⭘ањ䈟ᐞᴢ䶒ᶕᖒ䊑㺘⽪ˈоമ 4-4 㺘⽪Ⲵ㓯ᙗঅ
Ⲵݳ䈟ᐞᴢ䶒լDŽ䛓ᑵമѝⲴ䈟ᐞ㻛ᡁԜⲴᯠⲴ䈟ᐞᇊѹ E ᡰᴯԓˈᒦфオ䰤ѝⲴަԆ
㔤⧠൘ሩᓄ㖁㔌ѝоᡰᴹঅⲴޣݳᡰᴹᵳ٬DŽ઼䇝㓳অњঅⲴݳᛵߥаṧˈởᓖл䱽ਟ㻛
⭘ᶕቍ䈅ራањٷ䇮֯ E ᴰሿॆDŽ
4ˊ ᴤᯠ⇿њ㖁㔌ᵳ٬wji
wjim wji +'wji
ަѝ
'wji=KGjxji ˄T4.5˅
൘㺘 4-2 Ⲵ㇇⌅Ⲵᔰˈᔪ・ањާᴹᵏᵋᮠ䟿Ⲵ䳀অ઼ݳ䗃ࠪঅⲴݳ㖁㔌ˈᒦࡍॆ
ᡰᴹ㖁㔌Ⲵᵳ٬ѪሿⲴ䲿ᵪᮠDŽ㔉ᇊҶ䘉њപᇊⲴ㖁㔌㔃ᶴˈ㇇⌅Ⲵѫᗚ⧟ቡሩ䇝㓳ṧֻ䘋
㹼৽༽Ⲵ䘝ԓDŽሩҾ⇿ањ䇝㓳ṧֻˈᆳᓄ⭘ⴞࡽⲴ㖁㔌ࡠ䘉њṧֻˈ䇑㇇ሩҾ䘉њṧֻ㖁
㔌䗃ࠪⲴ䈟ᐞˈ❦ਾᴤᯠ㖁㔌ѝᡰᴹⲴᵳ٬DŽሩ䘉ṧⲴởᓖл䱽↕僔䘋㹼䘝ԓˈⴤࡠ㖁㔌Ⲵ
ᙗ㜭䗮ࡠਟ᧕ਇⲴ㋮ᓖ˄㓿ᑨᱟкॳ⅑ˈཊ⅑֯⭘਼ṧⲴ䇝㓳ṧֻ˅DŽ
㺘 4-2 ѝⲴ㇇⌅䲿⵰⇿њ䇝㓳ṧֻⲴࠪ⧠䙂໎ൠᴤᯠᵳDŽ䘉а⛩оởᓖл䱽Ⲵ䲿ᵪ䘁լ
㇇⌅а㠤DŽ㾱ਆᗇ䈟ᐞEⲴⵏᇎởᓖˈ䴰㾱൘؞᭩ᵳ٬ѻࡽሩᡰᴹ䇝㓳ṧֻⲴGjxji٬≲઼DŽ
൘ިරⲴᓄ⭘ѝˈ৽ੁՐ㇇⌅Ⲵᵳ٬ᴤᯠ䘝ԓՊ㻛䟽༽кॳ⅑DŽᴹᖸཊ㓸→ᶑԦਟԕ
⭘ᶕ→ڌ䘉њ䗷〻DŽаᯩ⌅ᱟ൘䘝ԓⲴ⅑ᮠࡠҶањപᇊ٬ᰦ˗→ڌᡆᖃ൘䇝㓳ṧֻкⲴ
䈟ᐞ䱽ࡠḀњ䰸٬ԕлᰦ˗ᡆ൘࠶Ⲵ傼䇱ṧֻ䳶ਸкⲴ䈟ᐞㅖਸḀњḷ߶ᰦDŽ㓸→ࡔᦞⲴ
䘹ᤙᱟᖸ䟽㾱ⲴˈഐѪཚቁⲴᗚ⧟ਟ㜭⋑ᴹᴹ᭸ൠ䱽վ䈟ᐞˈ㘼ཚཊⲴᗚ⧟Պሬ㠤ሩ䇝㓳ᮠ
ᦞⲴ䗷ᓖᤏਸDŽ൘ 4.6.5 㢲ѝᡁԜՊᴤ䈖㓶ൠ䇘䇪䘉њ䰞仈DŽ
4.5.2.1 ໔ࣖߨ䠅δMomentumε亯
ഐѪ৽ੁՐ㇇⌅Ⲵᓄ⭘ྲ↔ᒯ⌋ˈᡰԕᐢ㓿ᔰਁࠪҶᖸཊ৽ੁՐ㇇⌅ⲴਈփDŽަѝ
ᴰᑨ㿱Ⲵᱟ؞᭩㇇⌅ѝޜᔿ˄T4.5˅Ⲵᵳ٬ᴤᯠ⌅ࡉˈ֯ㅜ n ⅑䘝ԓⲴᵳ٬ᴤᯠ䜘࠶ൠ䎆
Ҿਁ⭏൘ㅜ n-1 ⅑䘝ԓᰦⲴᴤᯠˈণᢺޜᔿ˄T4.5˅ᦒѪྲлⲴᖒᔿ˖
'wjin KGjxjiD'wjin̢ ˄˅
4.5.2.2 ᆜҖԱᝅⲺᰖ⧥㖇㔒
㺘 4-2 㔉ࠪⲴ৽ੁՐ㇇⌅Ⲵᇊѹӵ䘲⭘ҾєቲⲴ㖁㔌DŽ❦㘼䛓䟼㔉ࠪⲴ㇇⌅ਟԕㆰঅ
ൠ᧘ᒯࡠԫ␡ᓖⲴࡽ侸㖁㔌DŽޜᔿ˄T4.5˅Ⲵᵳ٬ᴤᯠ⌅ࡉ؍ᤱнਈˈᜏаⲴਈॆᱟ䇑㇇
G٬Ⲵ䗷〻DŽᾲᤜൠ䈤ˈㅜmቲⲴঅݳrⲴGr٬ᱟ⭡ᴤ␡Ⲵm+1 ቲⲴG٬ṩᦞлᔿ䇑㇇Ⲵ˖
Gr =or(1- or) ¦
sm 1ቲ
wsrGs ˄4.19˅
ྲ᷌᧘ᒯࡠԫօᴹੁᰐ⧟㔃ᶴҏаṧⲴㆰঅˈ㘼н䇪㖁㔌ѝⲴঅݳᱟ䊑ᡁԜ㠣↔Ѫ→
ٷᇊⲴ䛓ṧ㻛㔏аൠᧂࡇ൘ቲкDŽሩҾ㖁㔌অ⋑ݳᴹ᤹↔ᧂࡇⲴᛵߥˈ䇑㇇ԫ䜘অ˄ݳҏ
ቡᱟᡰᴹ䶎䗃ࠪঅⲴ˅ݳGⲴ⌅ࡉᱟ˖
Gr =or(1- or) ¦
sDownStream (r )
wsrGs ˄4.20˅
4.5.3 ਃੇՖ⌋ࡏⲺ᧞ሲ
䘉а㢲㔉ࠪ৽ੁՐ㇇⌅Ⲵᵳ٬䈳ᮤ⌅ࡉⲴ᧘ሬˈྲ᷌ᱟㅜа䙽䰵䈫ਟԕ䐣䗷䘉а㢲ˈ
㘼нཡ䘎㔝ᙗDŽ
wE d
'wji= K ˄4.21˅
ww ji
ަѝˈEdᱟ䇝㓳ṧֻdⲴ䈟ᐞˈ䙊䗷ሩ㖁㔌ѝᡰᴹ䗃ࠪঅ઼≲Ⲵݳᗇࡠ
& 1
Ed( w ) { ¦ (t k ok ) 2
2 koutputs
䘉䟼outputsᱟ㖁㔌ѝ䗃ࠪঅⲴݳ䳶ਸˈtkᱟঅݳkሩҾ䇝㓳ṧֻdⲴⴞḷ٬ˈokᱟ㔉ᇊ䇝
㓳ṧֻdᰦঅݳkⲴ䗃ࠪ٬DŽ
䲿ᵪởᓖл䱽⌅ࡉⲴ᧘ሬᾲᘥкᱟ᱃៲Ⲵˈն䴰㾱⮉ᖸཊлḷ઼ਈ䟿DŽᡁԜሶ䚥ᗚമ
4-6 ѝᡰ⭫ࠪⲴㅖਧˈ໎࣐ањлḷ j ⭘ᶕ㺘⽪㖁㔌ѝⲴㅜ j њঅާˈݳփྲл˖
x xji=অݳjⲴㅜiњ䗃ޕ
x wji=оঅݳjⲴㅜiњ䗃ޣޕ㚄Ⲵᵳ٬
x netj=¦iwjixji˄অݳjⲴ䗃࣐Ⲵޕᵳ઼˅
x oj=অݳj䇑㇇ࠪⲴ䗃ࠪ
x tj=অݳjⲴⴞḷ䗃ࠪ
x V=sigmoid ࠭ᮠ
x outputs=㖁㔌ⲴᴰਾаቲⲴঅݳ䳶ਸ
x DownStream(j)=অ・Ⲵݳণ䗃˄ޕimmediate inputs˅ѝवਜ਼অ ݳj 䗃ࠪⲴঅ
ݳ䳶ਸ
wE d
⧠൘ᡁԜሬࠪ Ⲵањ㺘⽪ˈԕׯᇎ⧠ޜᔿ˄4.21˅ѝࠪ⧠Ⲵ䲿ᵪⲴởᓖл䱽⌅ࡉDŽ
ww ji
俆⌘ˈݸᵳ٬wjiӵ㜭䙊䗷netjᖡ૽㖁㔌ⲴަԆ䜘࠶DŽᡰԕˈᡁԜਟԕ֯⭘䬮ᔿ㿴ࡉ˄chain
rule˅ᗇࡠ
wE d wE d wnet j
=
ww ji wnet j ww ji
wE d
= xji ˄4.22˅
wnet j
wE d
ᐢ⸕ㅹᔿ˄4.22˅ˈᡁԜ࢙лⲴԫ࣑ቡᱟѪ ሬࠪањᯩⲴׯ㺘⽪DŽᡁԜ⅑㘳㲁
wnet j
ᛵߥ 1˖䗃ࠪঅⲴݳᵳ٬䇝㓳⌅ࡉDŽቡ䊑wjiӵ㜭䙊䗷netjᖡ૽ަ։Ⲵ㖁㔌аṧˈnetjӵ㜭
䙊䗷ojᖡ૽ަ։Ⲵ㖁㔌DŽᡰԕᡁԜਟԕ⅑֯⭘䬮ᔿ㿴ࡉᗇࠪ
wE d wE d wo j
= ˄4.23˅
wnet j wo j wnet j
俆ݸӵ㘳㲁ㅹᔿ˄4.23˅Ⲵㅜа亩
wE d w 1
= ¦ (t k o k ) 2
wo j wo j 2 koutputs
w
䲔Ҷᖃ k=j ᰦˈᡰᴹ䗃ࠪঅ ݳk Ⲵሬᮠ (t k o k ) 2 Ѫ 0DŽᡰԕᡁԜнᗵሩཊњ䗃ࠪ
wo j
অˈ઼≲ݳਚ䴰Ԕ k=jDŽ
wE d w 1
(t j o j ) 2
wo j wo j 2
1 w (t j o j )
2(t j o j )
2 wo j
= (-tj-oj) ˄4.24˅
wo j
᧕лᶕ㘳㲁ㅹᔿ˄4.23˅ⲴㅜҼ亩DŽᰒ❦oj=V˄netj˅ˈሬᮠ ቡᱟsigmoid࠭ᮠⲴሬ
wnet j
ᮠˈ㘼ᡁԜᐢ㓿ᤷࠪ䗷sigmoid࠭ᮠⲴሬᮠѪV(netj)(1-V(netj))DŽᡰԕˈ
wo j wV (net j )
wnet j wnet j ˄4.25˅
o j (1 o j )
ᢺ㺘䗮ᔿ˄4.24˅઼˄4.25˅ԓ˄ޕ4.23˅ˈᡁԜᗇࡠ
wE d
= -(tj-oj)oj(1-oj) ˄4.26˅
wnet j
❦ਾоㅹᔿ˄4.21˅઼˄4.22˅ਸᒦˈᡁԜ᧘ׯሬࠪҶ䗃ࠪঅⲴݳ䲿ᵪởᓖл䱽⌅ࡉ˖
wE d
'wji= K =K˄tj-oj˅oj˄1-oj˅xji ˄4.27˅
ww ji
wE d
ᡁԜਟԕਁ⧠ᔿ˄T4.3˅ѝⲴGkо ٬ㅹDŽ൘䘉а㢲Ⲵަ։䜘࠶ᡁԜሶ֯⭘Giᶕ㺘
wnet k
wE d
⽪ԫঅݳiⲴ DŽ
wnet i
ᛵߥ 2˖䳀㯿অⲴݳᵳ٬䇝㓳⌅ࡉDŽሩҾ㖁㔌ѝⲴ䜘অݳᡆ㘵䈤䳀㯿অⲴݳᛵߥˈ᧘
ሬwjiᗵ享㘳㲁wji䰤᧕ൠᖡ૽㖁㔌䗃ࠪˈӾ㘼ᖡ૽EdDŽ⭡Ҿ䘉њഐˈᡁԜਁ⧠ᇊѹ㖁㔌ѝঅ
ݳjⲴᡰᴹ・ণл⑨˄immediately downstream˅অⲴݳ䳶ਸ˄ҏቡᱟ・ণ䗃ޕѝवਜ਼অݳj
Ⲵ䗃ࠪⲴᡰᴹঅ˅ݳᱟᴹ⭘ⲴDŽᡁԜ⭘DownStream(j)㺘⽪䘉ṧⲴঅݳ䳶ਸDŽ⌘netjਚ㜭䙊
䗷Downstream(j)ѝⲴঅݳᖡ૽㖁㔌䗃ࠪ˄ᖡ૽Ed˅DŽᡰԕਟԕྲл᧘ሬ
wE d wE d wnet k
wnet j
¦
kDownStream ( j ) wnet j wnet j
wnet k
¦
kDownStream ( j )
Gk
wnet j
wnet k wo j
¦
kDownStream ( j )
Gk
wo j wnet j
(4.28)
wo j
¦
kDownStream ( j )
G k wkj
wnet j
¦
kDownStream ( j )
G k wkj o j (1 o j )
wE d
䟽ᯠ㓴㓷亩ᒦ֯⭘Gj㺘⽪ ˈᡁԜᗇࡠ
wnet j
Gj o j (1 o j ) ¦G w
k kj
kDownstream ( j )
઼
'wji = K Gj xji
кᔿቡᱟ⭡ޜᔿ˄4.20˅ᗇࡠⲴа㡜⌅ࡉˈ⭘ᶕᴤᯠԫᴹੁᰐ⧟㖁㔌㔃ᶴ䜘অⲴݳ
ᵳ٬DŽ⌘㺘 4-2 Ⲵᔿ˄T4.4˅ӵᱟ䘉њ⌅ࡉᖃ Downstream(j)=outputs ᰦⲴањ⢩ֻDŽ
4.6 ਃੇՖ㇍⌋Ⲻ䈪᱄
4.6.1 ᭬ᮑᙝૂቶ䜞ᶷቅٲ
↓ྲࡽ䶒ᡰ᧿䘠Ⲵˈ৽ੁՐ㇇⌅ᇎ⧠Ҷаሩਟ㜭Ⲵ㖁㔌ᵳ٬オ䰤Ⲵởᓖл䱽ᩌ㍒ˈ
ᆳ䘝ԓൠ߿ሿ䇝㓳ṧֻⲴⴞḷ٬઼㖁㔌䗃ࠪ䰤Ⲵ䈟ᐞDŽഐѪሩҾཊቲ㖁㔌ˈ䈟ᐞᴢ䶒ਟ㜭ਜ਼
ᴹཊњн਼Ⲵተ䜘ᶱሿ٬ˈởᓖл䱽ਟ㜭䲧ޕ䘉Ӌተ䜘ᶱሿ٬ѝⲴањDŽഐ↔ˈሩҾཊቲ㖁
㔌ˈ৽ੁՐ㇇⌅ӵ㜭؍䇱᭦ᮋࡠ䈟ᐞ E ⲴḀњተ䜘ᶱሿ٬ˈнаᇊ᭦ᮋࡠޘተⲴᴰሿ䈟
ᐞDŽ
ቭ㇑㕪ѿሩ᭦ᮋࡠޘተᴰሿ䈟ᐞⲴ؍䇱ˈ৽ੁՐ㇇⌅൘ᇎ䐥ѝᱟ䶎ᑨᴹ᭸Ⲵ࠭ᮠ䙬䘁
㇇⌅DŽሩҾᖸཊᇎ䱵Ⲵᓄ⭘ˈӪԜਁ⧠ተ䜘ᶱሿ٬Ⲵ䰞仈⋑ᴹᜣ䊑Ⲵ䛓Ѹѕ䟽DŽѪҶሩ䘉њ
䰞仈ᴹаӋⴤ㿲Ⲵ䇔䇶ˈ㘳㲁ਜ਼ᴹབྷ䟿ᵳ٬Ⲵ㖁㔌ˈᆳሩᓄ⵰㔤ᮠ䶎ᑨ儈Ⲵオ䰤ѝⲴ䈟ᐞᴢ
䶒˄⇿њᵳ٬а㔤˅DŽᖃởᓖл䱽䲧ޕሩḀњᵳⲴተ䜘ᶱሿ٬ᰦˈሩަԆⲴᵳ䘉䟼ᵚᗵ
ᱟተ䜘ᶱሿ٬DŽһᇎкˈ㖁㔌Ⲵᵳ䎺ཊˈ䈟ᐞᴢ䶒Ⲵ㔤ᮠ䎺ཊˈҏቡ䎺ਟ㜭Ѫởᓖл䱽ᨀ
ᴤཊⲴĀ䘳䙨䐟㓯āˈ䇙ởᓖл䱽ᔰሩ䈕অњᵳ٬Ⲵተ䜘ᶱሿ٬༴DŽ
ሩተ䜘ᶱሿ٬ⲴㅜҼ㿲⛩ᱟˈ㘳㲁䲿⵰䇝㓳ѝ䘝ԓ⅑ᮠⲴ໎࣐㖁㔌ᵳ٬Ⲵ╄ॆᯩᔿDŽ
⌘൘㇇⌅ѝˈྲ᷌ᢺ㖁㔌Ⲵᵳ٬ࡍॆѪ᧕䘁Ҿ 0 Ⲵ٬ˈ䛓Ѹ൘ᰙᵏⲴởᓖл䱽↕僔ѝˈ
㖁㔌ሶ㺘⧠Ѫањ䶎ᑨᒣ━Ⲵ࠭ᮠˈ䘁լѪ䗃Ⲵޕ㓯ᙗ࠭ᮠDŽ䘉ᱟഐѪ sigmoid ࠭ᮠᵜ䓛൘
ᵳ٬䶐䘁 0 ᰦ᧕䘁㓯ᙗ˄㿱മ 4-6 ѝⲴ sigmoid ࠭ᮠᴢ㓯˅
DŽӵᖃᵳ٬ᐢ㓿໎䮯Ҷаᇊᰦ䰤
ѻਾˈᆳԜՊࡠ䗮ਟԕ㺘⽪儈ᓖ䶎㓯ᙗ㖁㔌࠭ᮠⲴ〻ᓖDŽᡆ䇨ਟԕᵏᖵ൘ᵳオ䰤Ⲵ䘉њ४
ฏᆈ൘ᴤཊⲴተ䜘ᶱሿ٬ˈ䘉ṧਟԕ㺘⽪ᴤ༽ᵲⲴ࠭ᮠDŽҏਟᐼᵋᖃᵳࡠ䗮䘉а⛩ᰦᆳԜᐢ
㓿䏣ཏ䶐䘁ޘተᴰሿ٬ˈণׯᆳᱟ䘉њ४ฏⲴተ䜘ᶱሿ٬ҏᱟਟԕ᧕ਇⲴDŽ
4.6.2 ࢃ侾㖇㔒Ⲻ㺞ᖷ㜳࣑
ӰѸ㊫රⲴ࠭ᮠਟԕ֯⭘ࡽ侸㖁㔌ᶕ㺘⽪˛ᖃ❦䘉њ䰞仈ⲴㆄṸ䎆Ҿ㖁㔌Ⲵᇭᓖ
઼␡ᓖDŽቭ㇑ⴞࡽሩଚа᯿࠭ᮠਟԕ⭘ଚ㊫රⲴ㖁㔌᧿䘠䘈⸕䚃ᗇᖸቁˈնᐢ㓿⸕䚃Ҷй
ња㡜ᙗⲴ㔃䇪˖
x ᐳቄ࠭ᮠDŽԫօᐳቄ࠭ᮠਟԕ㻛ާᴹєቲঅⲴݳ㖁㔌߶⺞㺘⽪ˈቭ㇑ሩҾᴰ
ൿⲴᛵߥˈᡰ䴰䳀㯿অⲴݳᮠ䟿䲿⵰㖁㔌䗃ޕᮠ䟿Ⲵ໎࣐ᤷᮠ㓗໎䮯DŽѪҶ
䈤᰾䘉ᱟྲօᇎ⧠Ⲵˈ㘳㲁л䶒㺘⽪ԫօᐳቄ࠭ᮠⲴ䙊⭘ᯩṸ˖ሩҾ⇿ањ
ਟ㜭Ⲵ䗃ੁޕ䟿ˈࡋᔪн਼Ⲵ䳀㯿অˈݳᒦ䇮㖞ᆳⲴᵳ٬֯ᖃфӵᖃ䘉њ⢩
ᇊⲴੁ䟿䗃ࡠޕ㖁㔌ᰦ䈕অݳ㻛◰⍫DŽ䘉ṧቡӗ⭏ҶањሩҾԫօ䗃ޕӵᴹ
ањঅݳ㻛◰⍫Ⲵ䳀㯿ቲDŽ᧕лᶕᢺ䗃ࠪঅݳᇎ⧠Ѫањᡆ䰘ˈӵ⭡ᡰᐼᵋ
Ⲵ䗃⁑ޕᔿ◰⍫DŽ
x 䘎㔝࠭ᮠDŽԫօᴹ⭼Ⲵ䘎㔝࠭ᮠਟԕ⭡ањєቲⲴ㖁㔌ԕԫሿⲴ䈟ᐞ˄൘
ᴹ䲀Ⲵ㤳ᮠл˅䙬䘁˄Cybenko 1989˗Hornik et al. 1989˅DŽ䘉њ⨶䇪䘲⭘Ҿ
䳀㯿ቲ֯⭘ sigmoid অݳǃ䗃ࠪቲ֯⭘˄䶎䰸٬Ⲵ˅㓯ᙗঅⲴݳ㖁㔌DŽᡰ䴰
Ⲵ䳀㯿অݳᮠ䟿䎆Ҿ㾱䙬䘁Ⲵ࠭ᮠDŽ
x ԫ࠭ᮠDŽԫ࠭ᮠਟԕ㻛ањᴹйቲঅⲴݳ㖁㔌ԕԫ㋮ᓖ䙬䘁˄Cybenko
1988˅DŽоࡽ䶒਼ˈ䗃ࠪቲ֯⭘㓯ᙗঅˈݳєњ䳀㯿ቲ֯⭘ sigmoid অˈݳ
⇿аቲᡰ䴰Ⲵঅݳᮠ䟿а㡜н⺞ᇊDŽ䘉а㔃䇪Ⲵ䇱᰾ᯩ⌅Ѫ˖俆ݸ䈤᰾ԫօ
࠭ᮠਟԕ㻛䇨ཊተ䜘ॆ࠭ᮠⲴ㓯ᙗ㓴ਸ䙬䘁ˈ䘉Ӌተ䜘࠭ᮠⲴ٬䲔ҶḀњሿ
㤳തཆ䜭Ѫ 0˗❦ਾ䈤᰾єቲⲴ sigmoid অݳ䏣ԕӗ⭏㢟ྭⲴተ䜘䙬䘁DŽ
䘉Ӌ㔃䇪㺘᰾ᴹ䲀␡ᓖⲴࡽ侸㖁㔌Ѫ৽ੁՐ㇇⌅ᨀҶ䶎ᑨᴹ㺘ᖱ࣋Ⲵٷ䇮オ䰤DŽ❦
㘼䇠տл䶒а⛩ᱟ䟽㾱Ⲵ˖ởᓖл䱽ᱟӾањࡍⲴᵳ٬ᔰⲴˈഐ↔ᩌ㍒㤳ത䟼Ⲵ㖁㔌ᵳ
ੁ䟿ਟ㜭нवਜ਼ᡰᴹⲴᵳੁ䟿DŽHertz et al.˄1991˅ᨀҶк䶒㔃䇪Ⲵᴤ䈖㓶Ⲵ䇘䇪DŽ
4.6.3 ٽ䇴グ䰪ᩒ㍘ૂᖈ㓩څ㖤
ᢺ৽ੁՐ㇇⌅Ⲵٷ䇮オ䰤ᩌ㍒઼ަԆᆖҐ㇇⌅䟷ਆⲴᩌ㍒∄䖳ᖸᴹѹDŽሩҾ৽ੁ
Ր㇇⌅ˈ㖁㔌ᵳⲴ⇿аਟ㜭䍻٬䜭㺘⽪Ҷањਕ⌅н਼Ⲵٷ䇮ˈࡉк䜭൘ᆖҐಘⲴ㘳
㲁㤳തDŽᦒਕ䈍䈤ˈ䘉њٷ䇮オ䰤ᱟ n њ㖁㔌ᵳ٬Ⲵ n 㔤⅗∿オ䰤DŽ⌘䘉њオ䰤ᱟ䘎㔝
Ⲵˈ䘉оߣㆆṁᆖҐ઼ަԆสҾᮓ㺘⽪Ⲵᯩ⌅Ⲵٷ䇮オ䰤ᆼޘн਼DŽٷ䇮オ䰤Ⲵ䘎㔝ᙗԕ
৺䈟ᐞ E ޣҾٷ䇮Ⲵ䘎㔝৲ᮠਟᗞ䘉єњһᇎˈሬ㠤Ҷањ㢟ᇊѹⲴ䈟ᐞởᓖˈѪᴰ֣ٷ
䇮Ⲵᩌ㍒ᨀҶањ䶎ᑨᴹ⭘Ⲵ㔃ᶴDŽ䘉њ㔃ᶴоสҾㅖਧⲴᾲᘥᆖҐ㇇⌅ⲴĀа㡜ࡠ⢩↺
ᒿāᩌ㍒Ⲵ㔃ᶴˈᡆ ID3 ઼ C4.5 ㇇⌅ѝሩߣㆆṁⲴㆰঅࡠ༽ᵲᒿᩌ㍒ᡰ⭘Ⲵ㔃ᶴ䜭ᆼޘн
਼DŽ
৽ੁՐ㇇⌅Ӿ㿲⍻ᮠᦞѝ⌋ॆⲴᖂ㓣ٿ㖞ᱟӰѸ˛㋮⺞ൠ⭫৽ੁՐᆖҐⲴᖂ
㓣ٿ㖞ᱟᴹ䳮ᓖⲴˈഐѪᆳ䎆Ҿởᓖл䱽ᩌ㍒઼ᵳオ䰤㾶ⴆਟ㺘ᖱ࠭ᮠオ䰤ⲴᯩᔿⲴӂ
⭘ᙗDŽ❦㘼ˈਟԕᢺ䘉аٿ㖞㋇⮕ൠ⭫Ѫ在数据点之间平滑插值˄smooth interpolation
between data points˅DŽྲ᷌㔉ᇊєњ↓ֻˈᆳԜѻ䰤⋑ᴹ৽ֻˈ৽ੁՐ㇇⌅ՊੁٮҾᢺ䘉
є⛩ѻ䰤Ⲵ⛩ҏḷ䇠Ѫ↓ֻDŽֻྲˈ൘മ 4-5 ⭫ࠪⲴߣㆆ䶒ѝਟԕⴻࡠ䘉а⛩ˈ䇝㓳ṧֻⲴ
⢩ᇊṧᵜӗ⭏Ҷᒣ━ਈॆⲴߣㆆ४ฏDŽ
4.6.4 䳆㰅ቸ㺞⽰
৽ੁՐ㇇⌅Ⲵањ䘧ӪⲴ⢩ᙗᱟˈᆳ㜭ཏ൘㖁㔌䜘Ⲵ䳀㯿ቲਁ⧠ᴹ⭘Ⲵѝ䰤㺘⽪DŽ
ഐѪ䇝㓳ṧֻӵवਜ਼㖁㔌䗃઼ޕ䗃ࠪˈᵳ٬䈳㢲Ⲵ䗷〻ਟԕ㠚⭡ൠ䇮㖞ᵳ٬ˈᶕᇊѹ൘ᴰሿ
ॆ䈟ᐞᒣᯩ E ѝᴰᴹ᭸Ⲵԫօ䳀㯿অݳ㺘⽪DŽ䘉㜭ཏᕅሬ৽ੁՐ㇇⌅ᇊѹᯠⲴ䳀㯿ቲ⢩
ᖱˈ䘉Ӌ⢩ᖱ൘䗃ޕѝ⋑ᴹ᰾⺞㺘⽪ࠪᶕˈնত㜭ᦅ䗃ޕᇎֻѝоᆖҐⴞḷ࠭ᮠᴰⲴޣ
⢩ᖱDŽ
插图——原书页码:107
Inputs-䗃ޕ
Outputs-䗃ࠪ
Input-䗃ޕ٬
Output-䗃ࠪ٬
Hidden Values-䳀㯿٬
മ 4-7 ᆖҐࡠⲴ䳀㯿ቲ㺘⽪
䘉њ 8u3u8 Ⲵ㖁㔌㻛䇝㓳ԕᆖҐᚂㅹ࠭ᮠˈ֯⭘മѝᡰ⽪Ⲵ 8 њ䇝㓳ṧֻDŽ൘ 5000 䖞˄epochs˅
䇝㓳ѻਾˈ3 њ䳀㯿অ⭘֯ݳമਣⲴח㕆⸱ᯩᔿᶕ㕆⸱ 8 њӂн਼Ⲵ䗃ޕDŽ⌘ྲ᷌ᢺ㕆⸱ਾⲴ
٬ഋ㠽ӄޕѪ 0 ઼ 1ˈ䛓Ѹ㔃᷌ᱟ 8 њн਼٬Ⲵḷ߶Ҽ䘋٬㕆⸱DŽ
ᖃ৽ੁՐ㇇⌅㻛⭘ᶕᆼᡀ䘉њԫ࣑ᰦˈ֯⭘ 8 њਟ㜭ੁ䟿Ѫ䇝㓳ṧֻˈᆳᡀ࣏ൠᆖ
ՊҶⴞḷ࠭ᮠDŽởᓖл䱽Ⲵ৽ੁՐ㇇⌅ӗ⭏Ⲵ䳀㯿ቲ㺘⽪ᱟӰѸ˛䙊䗷࠶᷀ᆖҐࡠⲴ㖁
㔌ሩҾ 8 њਟ㜭䗃ੁޕ䟿ӗ⭏Ⲵ䳀㯿অⲴݳ٬ˈਟԕⴻࠪᆖࡠⲴ㕆⸱઼⟏⸕Ⲵሩ 8 њ٬֯⭘
3 սḷ߶Ҽ䘋ࡦ㕆⸱਼˄ҏቡᱟ 000ˈ001ˈ010ˈĂĂˈ111˅DŽമ 4-7 ᱮ⽪Ҷ৽ੁՐ㇇
⌅Ⲵа⅑䘀㹼ѝ䇑㇇ࠪⲴ䘉 3 њ䳀㯿অ࠷⺞Ⲵݳ٬DŽ
ѪҶ໎ᕪሩ䘉њֻᆀѝ৽ੁՐ㇇⌅Ⲵⴤ㿲⨶䀓ˈ䇙ᡁԜᴤ䈖㓶ൠ࠶᷀ởᓖл䱽䗷
〻ѝⲴާփķDŽ֯⭘㺘 4-2 ѝⲴ㇇⌅䇝㓳മ 4-7 ѝⲴ㖁㔌ˈ䇮㖞ࡍⲴᵳ٬Ѫ४䰤˄-0.1,
0.1˅ѝⲴ䲿ᵪᮠˈᆖҐ䙏⦷K=0.3ˈ⋑ᴹᵳߢ䟿˄ণD=0˅DŽ֯⭘ަԆⲴᆖҐ䙏⦷઼֯⭘䶎 0
Ⲵߢ䟿ᗇࡠⲴ㔃᷌լDŽ മ 4-7 ѝᱮ⽪Ⲵ䳀㯿অݳ㕆⸱ᱟ൘ᢗ㹼Ҷ㇇⌅Ⲵཆቲ䇝㓳䘝ԓ 5000
⅑ਾᗇࡠⲴ˄ҏቡᱟሩ 8 њ䇝㓳ṧֻⲴ⇿ањ䘝ԓ 5000 ⅑˅DŽ❦㘼੨ᕅᡁԜ⌘Ⲵབྷཊᮠᵳ
٬ਈॆᱟਁ⭏൘ࡽ 2500 ⅑ⲴDŽ
ᡁԜਟԕ᧿㔈ࠪ䗃ࠪ䈟ᐞⲴᒣᯩሩởᓖл䱽ᩌ㍒↕ᮠⲴ࠭ᮠᴢ㓯ˈ䘉ṧቡਟԕⴤ᧕㿲
ሏ৽ੁՐ㇇⌅Ⲵởᓖл䱽ᩌ㍒Ⲵ᭸᷌DŽᆳᱮ⽪൘മ 4-8 ѝᴰк䶒Ⲵᴢ㓯മѝDŽ䘉ᑵമⲴ 8
ᶑᴢ㓯ሩᓄ 8 њ㖁㔌䗃ࠪˈ⇿аᶑᴢ㓯䜭ᱮ⽪ҶᓄⲴ㖁㔌䗃ࠪሩᡰᴹ䇝㓳ṧֻⲴ䈟ᐞᒣᯩ
઼DŽ⁚䖤㺘⽪৽ੁՐ㇇⌅Ⲵᴰཆቲ䘝ԓⲴ⅑ᮠDŽྲമѝᡰᱮ⽪Ⲵˈ⇿њ䗃ࠪⲴ䈟ᐞᒣᯩ઼
䲿⵰ởᓖл䱽䗷〻㘼л䱽ˈḀӋঅݳᘛаӋˈḀӋঅݳ䖳ធDŽ
ķ
䘉њֻᆀⲴⓀԓ⸱ਟԕӾhttp://www.cs.cmu.edu/~tom/mlbook.htmlᗇࡠDŽ
᧕䘁 0 Ⲵᵳ٬ᱟٿ㖞ᵳw0DŽ
插图——原书页码:109
മ 4-8 ᆖҐ 8u3u8 㖁㔌
ᴰкമᱮ⽪Ҷ䲿⵰䇝㓳䘝ԓ⅑ᮠ˄䖞ᮠ˅Ⲵ໎࣐ˈ8 њ䗃Ⲵޕ䈟ᐞᒣᯩ઼Ⲵ╄ਈDŽѝമᱮ⽪ҶሩҾ
䗃ޕѢĀ01000000āⲴ䳀㯿ቲ㺘⽪Ⲵ╄ਈDŽлമᱮ⽪Ҷ 3 њ䳀㯿অݳѻаⲴᵳ٬╄ਈ䗷〻DŽ
4.6.5 ⌑ौθ䗽ᓜᤕਾૂᦤ࡚↘ڒ
൘㺘 4-2 ሩ৽ੁՐ㇇⌅Ⲵ᧿䘠ѝˈ⋑ᴹᤷᇊ㇇⌅֯⭘Ⲵ㓸→ᶑԦDŽ㓸→ᵳ٬ᴤᯠᗚ⧟
Ⲵਸ䘲ᶑԦᱟӰѸ˛ᖸ᰾ᱮˈа䘹ᤙᱟ㔗㔝䇝㓳ⴤࡠሩ䇝㓳ṧֻⲴ䈟ᐞ E 䱽վ㠣Ḁњ
亴ݸᇊѹⲴ䰸٬ѻлDŽһᇎкˈ䘉нᱟањྭⲴㆆ⮕ˈഐѪ৽ੁՐ㇇⌅ᇩ᱃䗷ᓖᤏਸ䇝㓳
ṧֻˈ䱽վҶሩҾަԆᵚ㿱䗷ᇎֻⲴ⌋ॆ㋮ᓖDŽ
ѪҶⴻࠪ֯䇝㓳ᮠᦞк䈟ᐞᴰሿॆⲴড䲙ˈ㘳㲁䈟ᐞ E ᱟྲօ䲿⵰ᵳ٬䘝ԓ⅑ᮠਈॆ
ⲴDŽമ 4-9 ᱮ⽪ҶєњᖃިරⲴ৽ੁՐ㇇⌅ᓄ⭘ѝⲴ䘉ਈॆDŽ俆ݸ㘳㲁മѝк䶒аᑵ
ᴢ㓯മDŽєᶑᴢ㓯ѝ䖳վⲴаᶑᱮ⽪Ҷ൘䇝㓳䳶ਸкⲴ䈟ᐞ E 䲿⵰ởᓖл䱽䘝ԓ⅑ᮠⲴ໎
࣐㘼অ䈳л䱽DŽ䖳儈Ⲵᴢ㓯ᱟ൘ањо䇝㓳ṧֻн਼Ⲵ傼䇱䳶ਸⲴᇎֻк⍻ࡠⲴ䈟ᐞ E Ⲵ
ᛵߥDŽ䘉ᶑ㓯⍻䟿Ҷ㖁㔌Ⲵ⌋ॆ㋮ᓖ˄generalization accuracy˅üü㖁㔌ᤏਸ䇝㓳ᮠᦞཆⲴ
ᇎֻⲴ㋮ᓖDŽ
⌘൘傼䇱ṧֻк⍻䟿ࡠⲴⲴ䈟ᐞEķݸл䱽ˈ❦ਾкॷˈቭ㇑൘䇝㓳ṧֻкⲴ䈟ᐞᤱ
㔝л䱽DŽѪӰѸՊਁ⭏䘉⧠䊑˛䘉ᱟഐѪ䘉Ӌᵳ٬ᤏਸҶ䇝㓳ṧֻⲴĀ⢩ᔲᙗā
˄idiosyncrasy˅ˈ㘼䘉њĀ⢩ᔲᙗāሩҾṧֻⲴа㡜࠶ᐳ⋑ᴹԓ㺘ᙗDŽANNѝབྷ䟿Ⲵᵳ٬৲
ᮠѪᤏਸ䘉ṧⲴĀ⢩ᔲᙗāᨀҶᖸབྷⲴ㠚⭡ᓖDŽ
ѪӰѸ䗷ᓖᤏਸᖰᖰᱟਁ⭏൘䘝ԓⲴਾᵏˈ㘼нᱟ䘝ԓⲴᰙᵏ˛䇮ᜣ㖁㔌Ⲵᵳ٬ᱟ㻛
ࡍॆѪሿ䲿ᵪ٬ⲴDŽ֯⭘䘉ӋࠐѾаṧⲴᵳ٬ӵ㜭᧿䘠䶎ᑨᒣ━Ⲵߣㆆ䶒DŽ䲿⵰䇝㓳Ⲵ䘋
㹼ˈаӋᵳ٬ᔰ໎䮯ˈԕ䱽վ൘䇝㓳ᮠᦞкⲴ䈟ᐞˈ਼ᰦᆖҐࡠⲴߣㆆ䶒Ⲵ༽ᵲᓖҏ൘ᨀ
儈DŽҾᱟˈ䲿⵰ᵳ٬䈳ᮤ䘝ԓ⅑ᮠⲴ໎࣐ˈ৽ੁՐ㇇⌅㧧ᗇⲴٷ䇮Ⲵᴹ᭸༽ᵲᓖҏ൘໎࣐DŽ
ྲ᷌ᵳ٬䈳ᮤ䘝ԓ⅑ᮠ䏣ཏཊˈ৽ੁՐ㇇⌅㓿ᑨՊӗ⭏䗷ᓖ༽ᵲⲴߣㆆ䶒ˈᤏਸҶ䇝㓳ᮠ
ᦞѝⲴಚ༠઼䇝㓳ṧֻѝ⋑ᴹԓ㺘ᙗⲴ⢩ᖱDŽ䘉њ䗷ᓖᤏਸ䰞仈оߣㆆṁᆖҐѝⲴ䗷ᓖᤏਸ
ķ
䈁⌘˖Җ↔༴ᴹ䈟ˈਕѪgeneralization accuracyݸл䱽ਾкॷˈᱮ❦䘉䟼Ⲵgeneralization accuracyᓄ
Ѫerror E˅DŽ
䰞仈լ˄㿱ㅜ 3 ㄐ˅DŽ
ᴹࠐᢰᵟਟԕ⭘Ҿ䀓ߣ৽ੁՐѝⲴ䗷ᓖᤏਸ䰞仈DŽаᯩ⌅㻛〠Ѫᵳ٬㺠߿
˄weight decay˅ˈᆳ൘⇿⅑䘝ԓ䗷〻ѝԕḀњሿഐᆀ䱽վ⇿њᵳ٬DŽ䘉ㅹ᭸Ҿ؞᭩ E Ⲵᇊѹˈ
࣐ޕањо㖁㔌ᵳ٬Ⲵᙫ䟿ᓄⲴ㖊亩DŽ↔ᯩ⌅Ⲵࣘᵪ൘Ҿ؍ᤱᵳ٬䖳ሿˈӾ㘼֯ᆖҐ䗷
〻ੁ⵰༽ᵲߣㆆ䶒Ⲵ৽ᯩੁٿ㖞DŽ
ݻᴽ䗷ᓖᤏਸ䰞仈Ⲵањᴰᡀ࣏Ⲵᯩ⌅ˈቡᱟ൘䇝㓳ᮠᦞཆѪ㇇⌅ᨀа྇傼䇱ᮠᦞ
˄validation data˅DŽ㇇⌅൘֯⭘䇝㓳䳶ਸ傡ࣘởᓖл䱽ᩌ㍒Ⲵ਼ᰦˈⴁ㿶ሩҾ䘉њ傼䇱䳶ਸ
Ⲵ䈟ᐞDŽᵜ䍘кˈ䘉ᖃҾݱ䇨㇇⌅ᵜ䓛⭫ࠪമ 4-9 ѝᱮ⽪Ⲵєᶑᴢ㓯DŽ㇇⌅ᓄ䈕䘋㹼ཊቁ
⅑ᵳ٬䈳ᮤ䘝ԓ˛ᱮ❦ˈᓄ䈕֯⭘൘傼䇱䳶ਸкӗ⭏ᴰሿ䈟ᐞⲴ䘝ԓ⅑ᮠˈഐѪ䘉ᱟ㖁㔌
ᙗ㜭ሩҾᵚ㿱䗷ᇎֻⲴᴰྭ㺘ᖱDŽ൘䘉ᯩ⌅Ⲵިරᇎ⧠ѝˈ㖁㔌Ⲵᵳ٬㻛⮉؍єԭᤧ䍍˖
аԭ⭘ᶕ䇝㓳ˈ㘼ਖаԭᤧ䍍ѪⴞࡽѪ→ᙗ㜭ᴰྭⲴᵳˈ㺑䟿Ⲵḷ߶ᱟᆳԜሩҾ傼䇱䳶ਸ
Ⲵ䈟ᐞDŽаᰖ䇝㓳ࡠⲴᵳ٬൘傼䇱䳶ਸкⲴ䈟ᐞ∄؍ᆈⲴᵳ٬Ⲵ䈟ᐞ儈ˈ䇝㓳㻛㓸→ˈᒦф
䘄എ؍ᆈⲴᵳ٬Ѫᴰ㓸Ⲵٷ䇮DŽᖃ䘉њ䗷〻㻛ᓄ⭘ࡠമ 4-9 ѝᴰкമⲴᛵߥᰦˈᆳሶ䗃ࠪ
൘ 9100 ⅑䘝ԓਾ㖁㔌ᗇࡠⲴᵳ٬DŽമ 4-9 ⲴㅜҼᑵᴢ㓯മᱮ⽪ˈнᱟᙫ㜭᰾ᱮ⺞ᇊ傼䇱䳶
ਸօᰦ䗮ࡠᴰሿ䈟ᐞDŽ൘䘉ᑵമѝˈ傼䇱䳶ਸⲴ䈟ᐞݸл䱽ˈ❦ਾкॷˈ❦ਾл䱽DŽᡰԕ
ᗵ享⌘䚯ݽ䭉䈟Ⲵ㔃䇪˖൘ 850 ⅑䘝ԓਾ㖁㔌ࡠ䗮ҶᆳⲴᴰሿ傼䇱䳶ਸ䈟ᐞDŽ
插图——原书页码:110
Error-䈟ᐞ
єᛵߥлˈ൘䇝㓳ṧֻкⲴ䈟ᐞ E 䜭অ䈳л䱽ˈഐѪởᓖл䱽Ⲵⴞḷᱟᴰሿॆ䘉њ䈟ᐞDŽሩҾঅ
⤜Ⲵ傼䇱䳶ਸѝⲴṧֻˈ䈟ᐞ E 䙊ᑨݸл䱽ˈ❦ਾ䈟ᐞਟ㜭ഐѪ䗷ᓖᤏਸ䇝㓳ṧֻ㘼кॷDŽᴰᴹਟ
㜭↓⺞⌋ॆࡠᵚ㿱䗷ᮠᦞⲴ㖁㔌ᱟሩҾ傼䇱䳶ਸᴹᴰሿ䈟ᐞⲴ㖁㔌DŽ⌘൘ㅜҼᑵᴢ㓯മѝˈᗵ享
ሿᗳн㾱䗷ᰙ→ڌ䇝㓳ˈഐѪ൘傼䇱䳶ਸкⲴ䈟ᐞ E ൘䘝ԓࡠ 850 ⅑ᰦᔰкॷ㘼ਾ৸л䱽DŽ
а㡜㘼䀰ˈ䗷ᓖᤏਸ䰞仈ԕ৺ݻᴽᆳⲴᯩ⌅ᱟањἈⲴ䰞仈DŽк䶒ⲴӔ৹傼䇱ᯩ⌅൘
ਟ㧧ᗇ仍ཆⲴᮠᦞᨀ傼䇱䳶ਸᰦᐕᗇᴰྭDŽ❦㘼нᒨⲴᱟˈ䗷ᓖᤏਸⲴ䰞仈ሩሿ䇝㓳䳶
ਸᴰѕ䟽DŽ൘䘉ᛵߥлˈᴹᰦ֯⭘а〠ѪĀk-foldӔ৹傼䇱˄k-fold cross-validation˅āⲴ
ᯩ⌅ˈ䘉ᯩ⌅䘋㹼k⅑н਼ⲴӔ৹傼䇱ˈ⇿⅑֯⭘ᮠᦞⲴн਼࠶ࢢѪ䇝㓳䳶ਸ઼傼䇱䳶
ਸˈ❦ਾሩ㔃᷌䘋㹼ᒣ൷DŽ൘䘉ᯩ⌅Ⲵањ⡸ᵜѝˈᢺਟⲴ⭘֯mњᇎֻ࠶ࢢᡀkњн
ӔⲴᆀ䳶ˈ⇿њᆀ䳶ᴹm/kњᇎֻDŽ❦ਾˈ䘀㹼k⅑Ӕ৹傼䇱䗷〻ˈ⇿а⅑֯⭘н਼Ⲵᆀ䳶
Ѫ傼䇱䳶ਸˈᒦਸᒦަԆⲴᆀ䳶Ѫ䇝㓳䳶ਸDŽҾᱟˈ⇿ањṧֻՊ൘а⅑ᇎ傼ѝ㻛⭘
傼䇱䳶ਸⲴᡀઈˈ൘k-1 ⅑ᇎ傼ѝ⭘䇝㓳䳶ਸⲴᡀઈDŽ൘⇿⅑䈅傼ѝˈ䜭֯⭘к䶒䇘䇪Ⲵ
Ӕ৹傼䇱䗷〻ˈᶕߣᇊ൘傼䇱䳶ਸкਆᗇᴰ֣ᙗ㜭Ⲵ䘝ԓ⅑ᮠiDŽ❦ਾ䇑㇇䘉ӋiⲴ൷٬ i ˈ
ᴰਾ䘀㹼а⅑৽ੁՐ㇇⌅ˈ䇝㓳ᡰᴹmњķᇎֻᒦ䘝ԓ i ⅑ˈ↔ᰦ⋑ᴹ傼䇱䳶ਸDŽ䘉њ䗷〻
оㅜ 5 ㄐ᧿䘠ⲴสҾᴹ䲀ᮠᦞ∄䖳єᆖҐᯩ⌅Ⲵ䗷〻ᖸ䘁DŽ
4.7 ⽰ׁφӰ㝮䇼ࡡ
ѪҶ䈤᰾৽ੁՐ㇇⌅ᓄ⭘ѝⲴаӋᇎ䱵Ⲵ䇮䇑䰞仈ˈ䘉а㢲䇘䇪ᢺ䘉њ㇇⌅ᓄ⭘ࡠӪ
㝨䇶࡛ⲴᆖҐԫ࣑DŽ䘉а㢲⭘ᶕӗ⭏䘉њֻᆀⲴᡰᴹമۿᮠᦞ઼ԓ⸱䜭ਟԕӾԕл㖁൰ᗇ
ࡠ˖http://www.cs.cmu.edu//~tom/mlbook.htmlˈ਼ᰦ䘈ᴹྲօ֯⭘䘉Ӌԓ⸱Ⲵᆼᮤ᮷ẓDŽ䈫
㘵ਟԕ㠚ᐡ䘋㹼䈅傼DŽ
4.7.1 Աࣗ
䘉䟼ⲴᆖҐԫ࣑ᱟ࠶㊫н਼ӪⲴн਼ုᘱⲴᩴᖡമۿDŽᡁԜ᭦䳶Ҷ 20 њн਼ⲴӪⲴᩴ
ᖡമ⇿ˈۿњӪབྷ㓖ᴹ 32 ᕐമˈۿሩᓄ䘉њӪн਼Ⲵ㺘ᛵ˄ᘛҀˈ⋞їˈᙂˈѝᙗ˅˗Ԇ
ԜⴻⲴн਼ᯩੁ˄ᐖˈਣˈ↓ࡽˈк˅˗઼ԆԜᱟᡤཚ䱣䮌DŽӾമ 4-10 Ⲵ⽪ֻമۿѝਟԕ
ⴻࡠˈӪਾ䶒Ⲵ㛼ᲟǃクⲴ㺓ᴽǃ઼Ӫ㝨൘മۿѝⲴս㖞ҏ䜭ᴹᐞᔲDŽᡁԜޡ᭦䳶Ҷ 624
ᑵ⚠ᓖമ⇿ˈۿаᑵⲴ࠶䗘⦷Ѫ 120u128ˈമ⇿Ⲵۿњۿ㍐֯⭘ 0˄唁㢢˅ࡠ 255˄ⲭ㢢˅
Ⲵ⚠ᓖ٬᧿䘠DŽ
Ӿ䘉ӋമۿᮠᦞѝਟԕᆖҐᖸཊн਼Ⲵⴞḷ࠭ᮠDŽֻྲˈᡁԜਟԕ䇝㓳ањ ANNˈ֯
㔉ᇊаᑵമۿ䗃ޕᰦ䗃ࠪ䘉њӪⲴᜏаḷ䇶˄identity˅ǃ㝨Ⲵᵍੁǃᙗ࡛ǃᱟᑖཚ䱣䮌ㅹDŽ
ᡰᴹ䘉Ӌⴞḷ࠭ᮠਟԕԕᖸ儈Ⲵ㋮ᓖӾ䘉ӋᮠᦞѝᆖҐࡠˈ啃࣡䈫㘵Ԝ㠚㹼䈅傼DŽ൘ᵜ㢲ਾ
䶒Ⲵ䜘࠶ˈᡁԜ㘳㲁ањ⢩ᇊⲴԫ࣑˖ᆖҐമۿѝӪ㝨Ⲵᵍੁ˄ᐖˈਣˈ↓ࡽˈ䘈ᱟк˅DŽ
插图——原书页码:113
Network weights after 100 iteration through each training example- ሩ⇿њ䇝㓳ṧֻ䘝ԓ
100 ⅑ਾⲴ㖁㔌ᵳ٬
left: ᐖ
straight: ࡽ
ķ
䈁⌘˖Җ↔༴䈟Ѫn
right: ਣ
up: к
മ 4-10 ᆖҐ䇶࡛Ӫ㝨ᵍੁⲴӪᐕ⾎㓿㖁㔌
4.7.2 䇴䇗㾷㍖
ᓄ⭘৽ੁՐ㇇⌅ࡠањ㔉ᇊԫ࣑ᰦˈᗵ享ߣᇊࠐњ䇮䇑㾱㍐DŽл䶒ᡁԜᖂ㓣ࠪҶᆖҐ
Ӫ㝨ᵍੁ䘉њᆖҐԫ࣑ⲴаӋ䇮䇑㾱㍐DŽቭ㇑ᡁԜ⋑ᴹᢃ㇇৫䘹ᤙ㋮⺞ⲴᴰՈ䇮䇑ˈն䘉䟼
᧿䘠Ⲵ䇮䇑ሩⴞḷ࠭ᮠᆖҐᗇᖃྭDŽ൘䇝㓳Ҷ 260 ᑵമۿṧֻѻਾˈሩҾ⤜・⍻䈅䳶ਸⲴ
㋮ᓖ䗮ࡠ 90%DŽሩ㘼䀰ˈྲ᷌䲿ᵪ⥌⍻ഋњ㝨ᵍੁѝⲴањˈਚ㜭䗮ࡠ 25%Ⲵ↓⺞⦷DŽ
䗃ࠪ㕆⸱DŽANN ᗵ享䗃ࠪഋњ٬ѝⲴањᶕ㺘⽪䗃ޕമۿѝӪ㝨Ⲵᵍੁ˄ᐖˈਣˈкˈ
ࡽ˅DŽ⌘ᡁԜਟԕ֯⭘অаⲴ䗃ࠪঅݳᶕ㕆⸱䘉ഋᛵߥⲴ࠶㊫ˈֻྲᤷᇊ䗃ࠪ٬ 0.2ˈ0.4ˈ
0.6 ઼ 0.8 ᶕ㕆⸱䘉ഋњਟ㜭٬DŽн䗷䘉䟼ᡁԜ֯⭘ 4 њн਼Ⲵ䗃ࠪঅ⇿ˈݳањሩᓄഋ
ਟ㜭ᵍੁѝⲴаˈਆާᴹᴰ儈٬Ⲵ䗃ࠪѪ㖁㔌Ⲵ亴⍻٬DŽ䘉ᯩ⌅㓿ᑨ㻛〠Ѫ n ਆ 1
˄1-of-n˅䗃ࠪ㕆⸱DŽ䘹ᤙ n ਆ 1 䗃ࠪ㕆⸱㘼н⭘অњঅݳᴹєњࣘᵪDŽㅜаˈ䘉Ѫ㖁㔌㺘
⽪ⴞḷ࠭ᮠᨀҶᴤབྷⲴ㠚⭡ᓖ˄ণ൘䗃ࠪቲঅݳѝᴹ n Ⲵؽਟ⭘ᵳ٬˅DŽㅜҼˈ൘ n ਆ 1
㕆⸱ѝˈᴰ儈٬䗃઼ࠪ⅑儈٬䗃ࠪ䰤ⲴᐞᔲਟԕѪሩ㖁㔌亴⍻Ⲵ㖞ؑᓖ˄н᰾⺞Ⲵ࠶㊫ਟ
㜭ሬ㠤㔃᷌䘁ᡆㅹ˅ DŽ䘋а↕Ⲵ䇮䇑䰞仈ᱟĀ䘉 4 њ䗃ࠪঅⴞⲴݳḷ٬ᓄ䈕ᱟӰѸ˛ā
ањᱮ㘼᱃㿱Ⲵ࣎⌅ᱟ⭘ 4 њⴞḷ٬<1ˈ0ˈ0ˈ0>ᶕ㕆⸱㝨ᵍੁᐖˈ<0ˈ1ˈ0ˈ0>ᶕ㕆⸱
㝨ᵍੁ↓ࡽˈ↔㊫᧘DŽᡁԜ䘉䟼֯⭘ 0.1 ઼ 0.9ˈ㘼нᱟ 0 ઼ 1ˈণ<0.9ˈ0.1ˈ0.1ˈ0.1>
㺘⽪㝨ᵍੁᐖⲴⴞḷ䗃ࠪੁ䟿DŽ䚯 ⭘֯ݽ0 ઼ 1 Ѫⴞḷ٬Ⲵഐᱟ sigmoid অݳሩҾᴹ䲀
ᵳ٬н㜭ӗ⭏䘉ṧⲴ䗃ࠪDŽྲ᷌ᡁԜԱമ䇝㓳㖁㔌ᶕ߶⺞३䝽ⴞḷ٬ 0 ઼ 1ˈởᓖл䱽ሶՊ
䘛֯ᵳ٬ᰐ⭼໎䮯DŽਖаᯩ䶒ˈ٬ 0.1 ઼ 0.9 ᱟ sigmoid অݳ൘ᴹ䲀ᵳ٬ᛵߥлਟԕᆼᡀⲴDŽ
㖁㔌㔃ᶴമDŽ↓ྲࡽ䶒ᡰ᧿䘠Ⲵˈ৽ੁՐ㇇⌅ਟԕ㻛ᓄ⭘ࡠԫօᴹੁᰐ⧟ sigmoid অ
Ⲵݳ㖁㔌DŽᡰԕˈᡁԜ䶒ѤⲴਖа䇮䇑䰞仈ᱟˈ䘉њ㖁㔌वਜ਼ཊቁњঅݳԕ৺ྲօӂ䘎DŽᴰ
Პ䙽Ⲵа㖁㔌㔃ᶴᱟ࠶ቲ㖁㔌ˈаቲⲴ⇿њঅࡽੁݳ䘎᧕ࡠлаቲⲴ⇿ањঅݳDŽⴞࡽⲴ
䇮䇑䘹ᤙ䘉ṧⲴḷ߶㔃ᶴˈ֯⭘єቲ sigmoid অ˄ݳањ䳀㯿ቲ઼ањ䗃ࠪቲ˅DŽ֯⭘аᡆ
єቲ sigmoid অݳᱟᖸᲞ䙽Ⲵˈڦቄ֯⭘йቲDŽ֯⭘ᴤཊⲴቲᱟнᑨ㿱ⲴˈഐѪ䇝㓳ᰦ䰤Պ
ਈᗇᖸ䮯ˈ㘼фйቲ sigmoid অⲴݳ㖁㔌ᐢ㓿㜭ཏ㺘⽪ᮠ䟿ᖃབྷⲴⴞḷ࠭ᮠ˄㿱 4.6.2 㢲˅
DŽ
ᡁԜᐢ㓿⺞ᇊ䘹ᤙањ࠶ቲⲴࡽ侸㖁㔌ˈ䛓Ѹަѝᓄ䈕वਜ਼ཊቁњ䳀㯿অݳ˛൘മ 4-10
ᣕⲴ㔃᷌ѝˈӵ֯⭘Ҷйњ䳀㯿অˈݳ䗮ࡠҶሩ⍻䈅䳶ਸ 90%Ⲵ㋮ᓖDŽ൘ਖањ֯⭘ 30
њ䳀㯿অⲴݳᇎ傼ѝˈᗇࡠⲴ㋮ᓖᨀ儈ҶаࡠєњⲮ࠶⛩DŽቭ㇑䘉єњᇎ傼ᗇࡠⲴ⌋ॆ㋮ᓖ
ᐞᖸሿˈնਾањ䈅傼᰾ᱮ䴰㾱ᴤཊⲴ䇝㓳ᰦ䰤DŽ֯⭘ 260 ᑵമⲴۿ䇝㓳ṧֻˈ30 њ䳀
অⲴݳ㖁㔌൘ Sun Sparc5 ᐕㄉкⲴ䇝㓳ᰦ䰤བྷ㓖ᱟањሿᰦDŽሩ㘼䀰ˈйњ䳀㯿অݳ
Ⲵ㖁㔌བྷ㓖ᱟ 5 ࠶䫏DŽӪԜᐢ㓿ਁ⧠൘ᖸཊᓄ⭘ѝ䴰㾱Ḁњᴰሿᮠ䟿Ⲵ䳀অݳᶕ㋮⺞ൠᆖҐ
ⴞḷ࠭ᮠˈᒦф䎵䗷䘉њᮠ䟿Ⲵཊ։Ⲵ䳀অݳнՊᱮ㪇ൠᨀ儈⌋ॆ㋮ᓖˈᶑԦᱟ֯⭘Ӕ৹傼
䇱ᯩ⌅ᶕߣᇊᓄ䈕䘋㹼ཊቁ⅑ởᓖл䱽䘝ԓDŽྲ᷌⋑ᴹ֯⭘Ӕ৹傼䇱ˈ䛓Ѹ໎࣐䳀㯿অݳᮠ
䟿㓿ᑨՊ໎࣐䗷ᓖᤏਸ䇝㓳ᮠᦞⲴˈੁٮӾ㘼䱽վ⌋ॆ㋮ᓖDŽ
4.7.3 ᆜҖࡦⲺ䳆㰅ቸ㺞⽰
ѪҶ⨶䀓䘉Ӌമݸˈۿ㘳㲁മѝ㍗䛫Ӫ㝨മۿлⲴഋњ⸙ᖒDŽ⇿ањ⸙ᖒ᧿㔈Ҷ㖁㔌ѝ
ഋњ䗃ࠪঅ˄ݳ㕆⸱Ҷᐖǃࡽǃਣ઼к˅ѝⲴањᵳ٬DŽ⇿њ⸙ᖒѝⲴഋњሿᯩᖒ㺘⽪઼䘉
ķ
䈁⌘˖2899=䗃ޕঅݳойњ䳀অݳ䰤䘎᧕ሩᓄⲴᵳ˄960u3˅+йњ䳀অݳоഋњ䗃ࠪঅݳ䰤䘎᧕ሩᓄ
Ⲵᵳ˄3u4˅+йњ䳀অ઼ݳഋњ䗃ࠪঅⲴݳw0ᵳ˄3+4˅
њ䗃ࠪঅޣݳ㚄Ⲵഋњᵳ٬üüᴰᐖ䗩ᱟᵳw0ˈᆳߣᇊঅⲴݳ䰸٬ˈ❦ਾᱟ䘎᧕йњ䳀㯿অ
ࡠݳ䘉њ䗃ࠪⲴйњᵳ٬DŽᯩᖒⲴӞᓖ㺘⽪ᵳ٬ˈӞⲭ㺘⽪䖳བྷⲴ↓ᵳ٬ˈ᳇唁㺘⽪䖳བྷⲴ
䍏ᵳ٬ˈӻҾѝ䰤Ⲵ⚠㢢䱤ᖡ㺘⽪ѝㅹⲴᵳ٬DŽֻྲˈḷѪĀкāⲴ䗃ࠪঅⲴݳ䰸٬ᵳw0᧕
䘁 0ˈӾㅜањ䳀㯿অݳᶕⲴᵳ٬Ѫ䖳བྷⲴ↓٬ˈӾㅜҼњ䳀㯿অݳᶕⲴᵳ٬Ѫ䖳བྷⲴ䍏٬DŽ
4.8 Ӱᐛ⾔㔅㖇㔒Ⲻ儎㓝䈓从
4.8.1 ެԌਥ䘿Ⲻ䈥ᐤ࠳ᮦ
↓ྲࡽ䶒ᡰᤷࠪⲴˈਚ㾱࠭ᮠ E ሩ৲ᮠॆⲴٷ䇮オ䰤ਟᗞˈ䛓Ѹቡਟԕᢗ㹼ởᓖл
䱽DŽ㲭❦สᵜⲴ৽ੁՐ㇇⌅ԕ㖁㔌䈟ᐞᒣᯩ઼Ⲵᖒᔿᇊѹ EˈնҏᴹӪᨀࠪަԆⲴᇊѹˈ
ԕׯᢺަԆⲴ㓖ᶏᕅޕᵳ٬䈳ᮤ⌅ࡉDŽྲ᷌ᇊѹҶањᯠⲴ Eˈ䛓Ѹቡᗵ享᧘ሬࠪањᯠⲴ
ᵳ٬䈳ᮤ⌅ࡉởᓖл䱽֯⭘DŽE ⲴަԆਟ䘹ᇊѹवᤜ˖
x Ѫᵳ٬໎࣐ањ㖊亩DŽྲ਼ࡽ䶒䇘䇪ⲴˈᡁԜਟԕ࣐ޕањ䲿⵰ੁ䟿ᑵᓖ໎
䮯Ⲵ亩ࡠ E ѝDŽ䘉ሬ㠤ởᓖл䱽ᩌራ䖳ሿⲴᵳ٬ੁ䟿ˈӾ㘼߿ሿ䗷ᓖᤏਸⲴ仾
䲙DŽа࣎⌅ᱟ᤹➗л䶒Ⲵㅹᔿ䟽ᯠᇊѹ E˖
& 1
E ( w) { ¦ ¦ (t kd o kd ) 2 J ¦ w ji
2
2 dD koutputs i, j
䘉ᗇࡠҶањо৽ੁՐ⌅ࡉสᵜа㠤Ⲵᵳᴤᯠ⌅ࡉˈਚᱟ൘⇿⅑䘝ԓᰦѪ⇿
њᵳ҈ԕᑨ䟿˄1-2JK˅DŽഐ↔䘹ᤙ䘉 E Ⲵᇊѹ઼֯⭘ᵳ㺠߿ㆆ⮕˄㿱㓳Ґ 4.10˅
ᱟㅹԧⲴDŽ
x ሩ䈟ᐞ໎࣐а亩ⴞḷ࠭ᮠⲴᯌ⦷˄slope˅ᡆሬᮠDŽḀӋᛵߥлˈ䇝㓳ؑѝн
ӵᴹⴞḷ٬ˈ㘼ф䘈ᴹޣҾⴞḷ࠭ᮠⲴሬᮠDŽֻྲˈSimard et al.˄1992˅᧿䘠
Ҷањᆇㅖ䇶࡛Ⲵᓄ⭘ˈ൘䘉њᓄ⭘ѝ֯⭘ҶаӋ䇝㓳ሬᮠᶕᕪ䘛㖁㔌ᆖҐ䛓
Ӌ൘മۿᒣ〫ѝнਈⲴᆇㅖ䇶࡛࠭ᮠDŽMitchell and Thrun˄1993˅᧿䘠Ҷṩᦞᆖ
ҐಘԕࡽⲴ⸕䇶䇑㇇䇝㓳ሬᮠⲴᯩ⌅DŽ൘䘉єњ㌫㔏ѝ˄൘ㅜ 12 ㄐѝ᧿䘠˅ˈ
䈟ᐞ࠭ᮠ䜭㻛໎࣐Ҷа亩ˈ⭘ᶕ㺑䟿䘉Ӌ䇝㓳ሬᮠ઼㖁㔌Ⲵᇎ䱵ሬᮠ䰤ⲴᐞᔲDŽ
䘉ṧⲴ䈟ᐞ࠭ᮠⲴањֻᆀᱟ
& 1 ª § wt wo ·
2
º
E ( w) { ¦ ¦ «(t kd okd ) 2 P ¦ ¨¨ kdj kdj ¸¸ »
2 dD koutputs « jinputs © wxd wxd ¹ »¼
¬
wt kd
wx j
j
x d
䘉䟼ˈ 㺘⽪ሩҾ䇝㓳ᇎֻdㅜjњ䗃ޕঅⲴݳ٬DŽҾᱟ d ᱟ᧿䘠ⴞḷ䗃ࠪ٬
wokd
wx dj 㺘⽪ᇎ䱵ⲴᆖҐ㖁㔌
j
x d
tkdᓄ䈕ྲօ䲿䗃ޕ٬ ਈॆⲴ䇝㓳ሬᮠDŽ㊫լⲴˈ
ⲴሩᓄሬᮠDŽᑨᮠPߣᇊ३䝽䇝㓳٬ሩҾ३䝽䇝㓳ሬᮠⲴሩᵳ٬DŽ
x ֯㖁㔌ሩⴞḷ٬ⲴӔ৹⟥˄cross entropy˅ᴰሿॆDŽ㘳㲁ᆖҐањᾲ⦷࠭ᮠˈ∄
ྲ亴⍻ањُ䍧⭣䈧㘵Պ䘈䍧ˈṩᦞᱟ䘉њ⭣䈧㘵Ⲵᒤ喴઼ᆈⅮ։仍DŽቭ㇑
䘉䟼Ⲵ䇝㓳ṧֻӵᨀҶᐳቄරⲴⴞḷ٬˄㾱Ѹᱟ 1ˈ㾱Ѹᱟ 0ˈṩᦞ䘉њ⭣䈧
㘵ᱟ䘈䍧˅ˈնสᵜⲴⴞḷ࠭ᮠᴰྭԕ⭣䈧㘵䘈䍧Ⲵᾲ⦷Ⲵᖒᔿ䗃ࠪˈ㘼н
ᱟሩ⇿њ䗃ޕᇎֻ䜭Աമ䗃ࠪ᰾⺞Ⲵ 0 ᡆ 1 ٬DŽ൘䘉ᛵߥлˈᡁԜᐼᵋ㖁㔌
䗃ࠪањᾲ⦷ՠ䇑ˈਟԕ䇱᰾ᴰሿॆӔ৹⟥˄cross entropy˅Ⲵ㖁㔌ਟԕ㔉ࠪᴰ
ྭⲴ˄ҏቡᱟᴰབྷլ❦˅ᾲ⦷ՠ䇑ˈӔ৹⟥Ⲵᇊѹྲл˖
¦ t d log od (1 t d ) log(1 od )
d D
䘉䟼odᱟ㖁㔌ሩҾ䇝㓳ṧֻd䗃ࠪⲴᾲ⦷ՠ䇑ˈtdᱟሩҾ䇝㓳ṧֻdⲴⴞḷ٬˄0
ᡆ 1˅DŽㅜ 6 ㄐ䇘䇪Ҷօᰦ৺ѪӰѸᴰਟ㜭Ⲵ㖁㔌ٷ䇮ቡᱟ֯Ӕ৹⟥ᴰሿॆⲴٷ
䇮ˈᒦ᧘ሬҶᓄⲴsigmoidঅⲴݳởᓖл䱽ᵳ٬䈳ᮤ⌅ࡉDŽㅜ 6 ㄐҏ᧿䘠Ҷ൘
ӰѸᶑԦлᴰਟ㜭Ⲵٷ䇮ቡᱟ֯䈟ᐞᒣᯩ઼ᴰሿॆⲴٷ䇮DŽ
x ᭩ਈᴹ᭸䈟ᐞ࠭ᮠҏਟԕ䙊䗷ᵳ٬ޡӛ˄weight sharing˅ᆼᡀˈҏቡᱟᢺон
਼অݳᡆ䗃ޣޕ㚄ⲴᵳĀ㔁൘а䎧āDŽ䘉䟼Ⲵᜣ⌅ᱟᕪ䘛н਼Ⲵ㖁㔌ᵳ٬
ਆа㠤Ⲵ٬ˈ䙊ᑨᱟѪҶᇎᯭӪ㊫䇮䇑㘵һ⸕ݸ䚃ⲴḀњ㓖ᶏDŽֻྲˈWaibel et
al.˄1989˅઼ Lang et al.˄1990˅᧿䘠Ҷ⾎㓿㖁㔌൘䈝丣䇶࡛ᯩ䶒Ⲵањᓄ⭘ ˈ
ަѝ㖁㔌Ⲵ䗃ޕᱟ൘ањ 144 ∛。Ⲵᰦ䰤デѝн਼ᰦ䰤Ⲵ䈝丣仁⦷࠶䟿DŽ൘䘉
њᓄ⭘ѝਟԕⲴڊањٷᇊᱟ˖ањ⢩ᇊ䈝丣˄ֻྲĀeeeā˅Ⲵ仁⦷࠶䟿Ⲵ䇶
࡛ᱟо䘉њ䈝丣൘ 144 ∛。ᰦ䰤デѝࠪ⧠Ⲵ⺞࠷ᰦ䰤ᰐⲴޣDŽѪҶᇎᯭ䘉њ㓖
ᶏˈᗵ享ᕪ䘛᧕᭦䘉њᰦ䰤デн਼䜘࠶Ⲵн਼অޡݳӛᵳ٬DŽ䘉ṧⲴڊ᭸᷌ᱟ
㓖ᶏҶٷ䇮Ⲵ▌൘オ䰤ˈӾ㘼߿ሿҶ䗷ᓖᤏਸⲴ仾䲙ˈᨀ儈Ҷ߶⺞⌋ॆࡠᵚ㿱
䗷ᛵᖒⲴਟ㜭ᙗDŽᵳ٬ޡӛ䙊ᑨ䘉ṧᇎ⧠˖俆ݸ൘ޡӛᵳ٬Ⲵ⇿њঅ࡛࠶ݳᴤ
ᯠњᵳ٬ˈ❦ਾਆ䘉Ӌᵳ٬Ⲵᒣ൷ˈ⭘䘉њᒣ൷٬ᴯᦒ⇿њ䴰ޡӛⲴᵳ٬DŽ
䘉њ䗷〻Ⲵ㔃᷌ᱟ㻛ޡӛⲴᵳ٬о⋑ᴹ㻛ޡӛⲴᵳ٬∄֯⭘Ҷн਼Ⲵ䈟ᐞ࠭
ᮠDŽ
4.8.2 ެԌਥ䘿Ⲻ䈥ᐤᴶቅौ䗽ぁ
㲭❦ởᓖл䱽ᱟᩌራ֯䈟ᐞ࠭ᮠᴰሿॆⲴٷ䇮Ⲵᴰ䙊⭘Ⲵᩌ㍒ᯩ⌅ѻаˈնᆳнᙫᱟᴰ
儈᭸ⲴDŽᖃ䇝㓳༽ᵲⲴ㖁㔌ᰦˈн䳮㿱ࡠ৽ੁՐ㇇⌅㾱䘋㹼кз⅑Ⲵᵳ٬ᴤᯠ䘝ԓDŽ⭡Ҿ
䘉њഐˈӪԜ᧒㍒ᒦᨀࠪҶᖸཊަԆⲴᵳ٬Ոॆ㇇⌅DŽѪҶ亶ՊަԆⲴਟ㜭ᯩ⌅ˈᡁԜн
࿘ᢺᵳ٬ᴤᯠᯩ⌅ቡⴻᱟ㾱ߣᇊєњ䰞仈˖䘹ᤙањ᭩ਈᖃࡽᵳ٬ੁ䟿Ⲵᯩੁ˗䘹ᤙ㾱〫
ࣘⲴ䐍DŽ൘৽ੁՐ㇇⌅ѝˈ䘉њᯩੁᱟ䙊䗷ਆởᓖⲴ䍏٬ᶕ䘹ᤙⲴˈ䐍ᱟ䙊䗷ᑨ䟿Ⲵ
ᆖҐ䙏⦷KߣᇊⲴDŽ
а㻛〠ѪĀ㓯 㓯ᩌ㍒˄line search˅āⲴՈॆᯩ⌅ˈ䟷⭘Ҷн਼Ⲵᯩ⌅䘹ᤙᵳ٬ᴤᯠⲴ䐍
DŽ⺞࠷ൠ䇢ˈ⇿ᖃ䘹ᇊҶаᶑ⺞ᇊᵳ٬ᴤᯠᯩੁⲴ䐟㓯ˈ䛓ѸᵳᴤᯠⲴ䐍ᱟ䙊䗷ራ⋯
䘉ᶑ㓯Ⲵ䈟ᐞ࠭ᮠⲴᴰሿ٬ᶕ䘹ᤙⲴDŽ⌘䘉ਟ㜭ሬ㠤ᖸབྷᑵᓖҏਟ㜭ᱟᖸሿᑵᓖⲴᵳ٬ᴤ
ᯠˈ㾱ⴻ⋯䘉ᶑ㓯Ⲵᴰሿ䈟ᐞ⛩Ⲵս㖞DŽਖаᯩ⌅ˈᱟṩᦞĀ㓯ᩌ㍒āⲴᙍᜣᔪ・Ⲵˈ㻛
〠Ѫޡ
ޡ䖝ởᓖ˄conjugate gradient˅⌅DŽ䘉ᯩ⌅䘋㹼а㌫ࡇ㓯ᩌ㍒ᶕᩌ㍒䈟ᐞᴢ䶒Ⲵᴰሿ
٬DŽ䘉а㌫ࡇᩌ㍒Ⲵㅜа↕ӽ❦֯⭘ởᓖⲴ৽ᯩੁѪᯩੁDŽ൘ਾᶕⲴ⇿а↕ˈ䘹ᤙ֯䈟ᐞ
ởᓖ࠶䟿ࡊྭѪ 0 ᒦ؍ᤱѪ 0 ⲴᯩੁDŽ
㲭❦ަԆⲴ䈟ᐞᴰሿॆᯩ⌅ᨀ儈Ҷ䇝㓳㖁㔌Ⲵ᭸⦷ˈն䊑ޡ䖝ởᓖ䘉ṧⲴᯩ⌅ሩҾᴰ㓸
㖁㔌Ⲵ⌋ॆ䈟ᐞ⋑ᴹ᰾ᱮⲴᖡ૽DŽሩᴰ㓸䈟ᐞᜏаਟ㜭Ⲵᖡ૽ᱟˈн਼Ⲵ䈟ᐞᴰሿॆ䗷〻Պ
䲧ޕн਼Ⲵተ䜘ᶱሿ٬DŽBishop˄1996˅वਜ਼ҶޣҾ䇝㓳㖁㔌Ⲵࠐ৲ᮠՈॆᯩ⌅Ⲵа㡜ᙗ
䇘䇪DŽ
ⴤࡠ⧠൘ᡁԜ㘳㲁Ⲵਚᱟᴹੁᰐ⧟Ⲵ㖁㔌ᤃᢁ㔃ᶴDŽ䙂ᖂ㖁㔌ᱟᴹྲл⢩ᖱⲴӪᐕ⾎㓿
㖁㔌˖䘲⭘Ҿᰦᒿᮠᦞ˗֯⭘㖁㔌অݳ൘ᰦ䰤 t Ⲵ䗃ࠪѪަԆঅݳ൘ᰦ䰤 t+1 Ⲵ䗃ޕDŽԕ
䘉ᯩᔿˈ䙂ᖂ㖁㔌᭟ᤱ൘㖁㔌ѝ֯⭘ḀᖒᔿⲴᴹੁ⧟˄directed cycles˅DŽѪҶ╄⽪䙂ᖂ
㖁㔌ˈ㘳㲁ањᰦᒿ亴⍻ԫ࣑üüṩᦞᖃཙⲴ㓿⍾ᤷḷ x(t)ˈ亴⍻лаཙⲴ㛑⾘ᒣ൷ᐲ٬
y(t+1)DŽ㔉ᇊҶ䘉ṧⲴᰦᒿᮠᦞˈањᱮ㘼᱃㿱Ⲵ࣎⌅ᱟṩᦞ䗃ޕ٬ x(t)䇝㓳ањࡽ侸㖁㔌
亴⍻䗃ࠪ y(t+1)DŽањ䘉ṧⲴ㖁㔌ᱮ⽪൘മ 4-11˄a˅ѝDŽ
插图——原书页码:120
Feedforward network-ࡽ侸㖁㔌
Recurrent network-䙂ᖂ㖁㔌
മ 4-11 䙂ᖂ㖁㔌
ྲօ䇝㓳䘉ṧⲴ䙂ᖂ㖁㔌˛䙂ᖂ㖁㔌ᴹཊਈփˈഐ↔ӪԜҏ࠶࡛ᨀࠪҶн਼Ⲵ䇝㓳
ᯩ⌅˄ֻྲ৲㿱Jordan 1986; Elman 1990; Mozer 1995; Williams & Zipser 1995˅DŽᴹ䏓Ⲵᱟˈ
䊑മ 4-11˄b˅䛓ṧⲴ䙂ᖂ㖁㔌ਟԕㆰঅ֯⭘৽ੁՐ㇇⌅Ⲵਈփᶕ䇝㓳DŽѪҶ⨶䀓ྲօᇎ
ᯭˈ㘳㲁മ 4-11˄c˅ˈᱮ⽪Ҷ䙂ᖂ㖁㔌᤹➗ᰦ䰤ኅᔰⲴᮠᦞ⍱DŽ䘉䟼ᡁԜᢺ䙂ᖂ㖁㔌ᤧ䍍ᡀ
ࠐԭˈ⭘н਼ᤧ䍍䰤Ⲵ䘎᧕ᴯᦒᦹ৽侸⧟DŽ⌘䘉њབྷⲴ㖁㔌нवਜ਼എ䐟DŽᡰԕኅᔰ㖁㔌
Ⲵᵳ٬ਟԕⴤ᧕֯⭘৽ੁՐ㇇⌅ᶕ䇝㓳DŽᖃ❦ᇎ䐥ѝᡁԜᐼᵋӵ⮉؍аԭ䙂ᖂ㖁㔌઼ᵳ٬
䳶ਸⲴᤧ䍍DŽᡰԕˈ൘䇝㓳ҶኅᔰⲴ㖁㔌ਾˈਟԕਆн਼ᤧ䍍ѝᵳ٬wjiⲴᒣ൷٬Ѫᴰ㓸㖁
㔌ⲴሩᓄⲴᵳ٬wjiDŽMozer˄1995˅䶎ᑨ䈖㓶ൠ᧿䘠Ҷ䘉њ䇝㓳䗷〻DŽᇎ䐥ѝˈ䙂ᖂ㖁㔌∄
⋑ᴹ৽侸⧟Ⲵ㖁㔌䳮ԕ䇝㓳ˈ⌋ॆⲴਟ䶐ᙗҏнྲਾ㘵DŽ❦㘼ᆳԜӽ❦ഐ䖳ᕪⲴ㺘ᖱ࣋؍ᤱ
⵰䟽㾱ᙗDŽ
4.8.4 ࣞᘷؤ᭯㖇㔒㔉ᶺ
ⴤࡠ⧠൘ᡁԜ㘳㲁Ⲵ⾎㓿㖁㔌ᆖҐ䰞仈ᱟ䈳ᮤањപᇊ㖁㔌㔃ᶴѝⲴᵳ٬DŽѪҶ᭩ழ⌋
ॆ㋮ᓖ઼䇝㓳᭸⦷ˈӪԜᨀࠪҶᖸཊࣘᘱ໎䮯ᡆ㕙㖁㔌অ઼ݳঅݳ䰤䘎᧕ᮠ䟿Ⲵᯩ⌅DŽ
аᜣ⌅ᱟӾањнवਜ਼䳀㯿অⲴݳ㖁㔌ᔰˈ❦ਾṩᦞ䴰㾱໎࣐䳀অݳ໎䮯㖁㔌ˈⴤ
ࡠ䇝㓳䈟ᐞл䱽ࡠḀњਟ᧕ਇⲴ≤ᒣDŽ㓗㚄˄ޣCascade-Correlation˅㇇⌅˄Fahlman &
Lebiere 1990˅ቡᱟ䘉ṧа㇇⌅DŽ㓗㚄ޣ㇇⌅Ӿࡋᔪањ⋑ᴹ䳀অⲴݳ㖁㔌ᔰDŽֻྲˈ
ሩҾᡁԜⲴӪ㝨ᵍੁⲴᆖҐԫ࣑ˈᆳՊᔪ・ањӵवਜ਼ഋњ䗃ࠪঅޘݳ䘎᧕ࡠ 30u32 њ䗃ޕ
㔃⛩Ⲵ㖁㔌DŽ൘䘉њ㖁㔌㻛䇝㓳Ҷа⇥ᰦ䰤ਾˈᡁԜਟԕᖸᇩ᱃ൠਁ⧠䘈ᴹ䖳བྷⲴ↻⮉䈟ᐞˈ
ഐѪһᇎк䘉њⴞḷ࠭ᮠнਟ㜭㻛ањঅቲ㔃ᶴⲴ㖁㔌⨶ᜣൠ㺘⽪DŽ൘䘉ᛵߥлˈ㇇⌅໎
࣐ањ䳀㯿অˈݳ䘹ᤙᆳⲴᵳ٬֯䘉њ䳀㯿অⲴݳ٬઼ᮤњ㖁㔌Ⲵ↻⮉䈟ᐞⲴޣᙗᴰབྷ
ॆDŽ⧠൘ањᯠⲴঅݳ㻛ᆹ㻵䘋Ҷ㖁㔌ˈᆳⲴᵳ٬؍ᤱнਈˈᒦф໎࣐䘉њᯠঅ⇿ࡠݳањ
䗃ࠪঅݳ䰤Ⲵ䘎᧕DŽ䟽༽䘉њ䗷〻DŽⲴᵳ٬㻛⅑䇝㓳˄؍ᤱ䳀㯿অⲴݳᵳ٬нਈ˅ˈ
Ựḕ↻⮉䈟ᐞˈྲ᷌↻⮉䈟ᐞ䘈儈Ҿ䰸٬ቡ࣐ޕㅜҼњ䳀অݳDŽ⇿ᖃ࣐ޕањᯠⲴ䳀㯿অˈݳ
ᆳⲴ䗃ޕवᤜᡰᴹⲴ㖁㔌䗃઼ޕᐢ㓿ᆈ൘Ⲵ䳀㯿অⲴݳ䗃ࠪDŽ㖁㔌ԕ䘉ᯩᔿ໎䮯ˈ〟
㚊䳀㯿অࡠⴤˈݳ㖁㔌Ⲵ↻։䈟ᐞл䱽ࡠḀњਟ᧕ਇⲴ≤ᒣDŽFahlman & Lebiere˄1990˅ᣕ
Ҷ㓗㚄ޣ㇇⌅ᱮ㪇߿ቁ䇝㓳ᰦ䰤Ⲵֻᆀˈഐᱟ⇿а↕ӵᴹаቲ㖁㔌൘㻛䇝㓳DŽ䘉њ㇇
⌅Ⲵањᇎ䱵ഠ䳮ᱟഐѪ㇇⌅ਟԕᰐ䲀ࡦൠ໎࣐অˈݳᆳቡᖸᇩ᱃䗷ᓖᤏਸ䇝㓳ᮠᦞˈᡰԕ
ᗵ享䟷ਆ䚯ݽ䗷ᓖᤏਸⲴ亴䱢᧚ᯭDŽ
ࣘᘱ؞᭩㖁㔌㔃ᶴⲴㅜҼњᜣ⌅ᱟ֯⭘৽Ⲵ䙄ᖴDŽнӾਟ㜭Ⲵᴰㆰঅ㖁㔌ᔰ໎࣐
༽ᵲᙗˈ㘼ᱟӾањ༽ᵲⲴ㖁㔌ᔰᦹ࢚؞ḀӋᰐޣ㍗㾱Ⲵ䘎᧕DŽࡔᯝḀњᵳᱟᰐޣ㍗㾱
Ⲵаᯩ⌅ᱟⴻᆳⲴ٬ᱟ᧕䘁 0DŽㅜҼⴻᶕ൘ᇎ䐥ѝᴤ࣐ᡀ࣏Ⲵᯩ⌅ᱟ㘳㲁䘉њᵳ٬Ⲵ
wE
ањሿⲴਈॆሩ䈟ᐞ E Ⲵᖡ૽DŽਈॆ w ሩ E Ⲵᖡ૽˄ҏቡᱟ ˅ਟԕ㻛ⴻ㺑䟿䘉њ䘎
ww
᧕Ⲵᱮ㪇ᙗ˄salient˅ⲴቪᓖDŽLeCun et al.˄1990˅᧿䘠Ҷањ㖁㔌㻛䇝㓳Ⲵ䗷〻ˈᴰнᱮ
㪇Ⲵ䘎᧕㻛䲔ˈ䟽༽䘉њ䗷〻ⴤࡠ䙷ࡠḀњ㓸→ᶑԦDŽԆԜ〠䘉ᯩ⌅ѪĀᴰՈ㝁ᦏՔ
˄optimal brain damage˅ā⌅ˈഐѪ൘⇿а↕㇇⌅䜭䈅മ৫䲔ᴰ⋑ᴹ⭘Ⲵ䘎᧕DŽԆԜᣕҶ
൘ањᆇㅖ䇶࡛ᓄ⭘ѝ䘉ᯩ⌅ሶањབྷⲴ㖁㔌ѝᵳ٬߿ቁࡠഋ࠶ѻаˈሩ⌋ॆ㋮ᓖᴹᗞሿ
Ⲵ᭩ழˈᒦфབྷབྷ᭩ழҶਾᶕⲴ䇝㓳᭸⦷DŽ
а㡜㘼䀰ˈࣘᘱ؞᭩㖁㔌㔃ᶴⲴᯩ⌅ᐢ㓿ਆᗇҶаӋᡀ࣏ˈնҏᴹн䏣DŽ䘉ᯩ⌅ᱟ
㜭っᇊൠᨀ儈৽ੁՐ㇇⌅Ⲵ⌋ॆ㋮ᓖ䘈ᴹᖵ⹄ウDŽ❦㘼ᐢ㓿䇱᰾൘аӋᛵᖒлᆳਟԕᱮ㪇
ൠ䱽վ䇝㓳ᰦ䰤DŽ
4.9 ቅ㔉ૂ㺛ݻ䈱⢟
䘉аㄐⲴ㾱⛩वᤜ˖
x Ӫᐕ⾎㓿㖁㔌ᆖҐѪᆖҐᇎᮠ٬઼ੁ䟿٬࠭ᮠᨀҶаᇎ䱵Ⲵᯩ⌅ˈሩҾ
䘎㔝Ⲵ઼ᮓ٬Ⲵᙗ䜭ਟԕ֯⭘ˈᒦфሩ䇝㓳ᮠᦞѝⲴಚ༠ᴹᖸྭⲴ励ἂ
ᙗDŽ৽ੁՐ㇇⌅ᱟᴰᑨ㿱Ⲵ㖁㔌ᆖҐ㇇⌅ˈᐢ㓿ᡀ࣏ᓄ⭘ࡠᖸཊᆖҐԫ࣑ˈ
∄ྲ߉䇶઼࡛ᵪಘӪ᧗ࡦDŽ
x ৽ੁՐ㇇⌅㘳㲁Ⲵٷ䇮オ䰤ᱟപᇊ䘎᧕Ⲵᴹᵳ㖁㔌ᡰ㜭㺘⽪Ⲵᡰᴹ࠭ᮠ
オ䰤DŽवਜ਼йቲঅࡽⲴݳ侸㖁㔌㜭ཏԕԫ㋮ᓖ䙬䘁ԫ࠭ᮠˈਚ㾱⇿аቲ
ᴹ䏣ཏᮠ䟿˄ਟ㜭䶎ᑨཊ˅ⲴঅݳDŽণ֯ᱟањᇎ䱵བྷሿⲴ㖁㔌ҏ㜭ཏ㺘⽪
ᖸབྷ㤳തⲴ儈ᓖ䶎㓯ᙗⲴ࠭ᮠˈ䘉֯ᗇࡽ侸㖁㔌ᡀѪᆖҐ亴ݸᵚ⸕Ⲵа㡜ᖒ
ᔿⲴᮓ઼䘎㔝࠭ᮠⲴᖸྭ䘹ᤙDŽ
x ৽ੁՐ㇇⌅֯⭘ởᓖл䱽ᯩ⌅ᩌ㍒ਟ㜭ٷ䇮Ⲵオ䰤ˈ䘝ԓ߿ሿ㖁㔌Ⲵ䈟ᐞ
ԕᤏਸ䇝㓳ᮠᦞDŽởᓖл䱽᭦ᮋࡠ䇝㓳䈟ᐞሩ㖁㔌ᵳ٬Ⲵተ䜘ᶱሿ٬DŽᴤ
а㡜Ⲵˈởᓖл䱽ᱟаᴹᓄ⭘▌࣋Ⲵᯩ⌅ˈᆳਟ⭘ᶕᩌ㍒ᖸཊ䘎㔝৲ᮠⲴ
ٷ䇮オ䰤ˈਚ㾱䇝㓳䈟ᐞᱟٷ䇮৲ᮠⲴਟᗞ࠭ᮠDŽ
x ৽ੁՐ㇇⌅ᴰԔӪᝏޤ䏓Ⲵ⢩ᖱѻаᱟˈᆳ㜭ཏࡋ䙐ࠪ㖁㔌䗃ޕѝ⋑ᴹ᰾
⺞ࠪ⧠Ⲵ⢩ᖱDŽ⺞࠷ൠ䇢ˈཊቲ㖁㔌Ⲵ䜘˄䳀㯿˅ቲ㜭ཏ㺘⽪ሩᆖҐⴞḷ
࠭ᮠᴹ⭘Ⲵն䳀ਜ਼൘㖁㔌䗃ޕѝⲴѝ䰤⢩ᖱDŽ䘉㜭࣋㻛ֻᆀྲ 4.6.4 㢲Ⲵ
8u3u8 㖁㔌ѝࡋ䙐Ⲵᮠᆇ 1 ࡠ 8 Ⲵᐳቄ㕆⸱˗ԕ৺ 4.7 㢲Ӫ㝨䇶࡛ᓄ⭘ѝ䳀
㯿ቲ㺘⽪Ⲵമۿ⢩ᖱDŽ
x 䗷ᓖᤏਸ䇝㓳ᮠᦞᱟ ANN ᆖҐѝⲴањ䟽㾱䰞仈DŽ䗷ᓖᤏਸሬ㠤㖁㔌⌋ॆ
ࡠᯠⲴᮠᦞᰦᙗ㜭ᖸᐞˈቭ㇑㖁㔌ሩҾ䇝㓳ᮠᦞ㺘⧠䶎ᑨྭDŽӔ৹傼䇱ᯩ⌅
ਟԕ⭘ᶕՠ䇑ởᓖл䱽ᩌ㍒Ⲵਸ䘲㓸→⛩ˈӾ㘼ᴰሿॆ䗷ᓖᤏਸⲴ仾䲙DŽ
x ቭ㇑৽ੁՐ㇇⌅ᱟᴰᑨ㿱Ⲵ ANN ᆖҐ㇇⌅ˈӪԜҏᨀࠪᖸཊަԆⲴ㇇⌅ˈ
वᤜሩҾ⢩↺ԫ࣑ⲴаӋ㇇⌅DŽֻྲˈ䙂ᖂ㖁㔌ᯩ⌅䇝㓳वਜ਼ᴹੁ⧟Ⲵ㖁㔌ˈ
㊫լ㓗㚄Ⲵޣ㇇⌅᭩ਈᵳⲴ਼ᰦҏ᭩ਈ㖁㔌㔃ᶴDŽ
ᖸཊᮉ、Җу䰘䇪䘠Ҷ⾎㓿㖁㔌ᆖҐDŽаᵜᰙᵏⲴնӽᴹ⭘ⲴޣҾ⁑ᔿ䇶࡛Ⲵ৲ᮠᆖҐ
ᯩ⌅ⲴҖᱟ Duda & Hart˄1973˅DŽWindrow & Stearns˄1985˅Ⲵᮉ、Җ㾶ⴆҶᝏ⸕ಘ઼ޣ
Ⲵঅቲ㖁㔌ԕ৺ᆳԜⲴᓄ⭘DŽRumelhart & McClelland˄1986˅᭦㕆Ҷ 80 ᒤԓѝᵏᔰⲴ䟽
ᯠ◰ਁ䎧ӪԜሩ⾎㓿㖁㔌ᯩ⌅ޤ䏓Ⲵ䇪᮷DŽޣҾ⾎㓿㖁㔌ᴰ䘁ࠪ⡸ⲴҖ㉽वᤜ Bishop
˄1996˅˗Chauvin & Rumelhart˄1995˅˗Freeman & Skapina˄1991˅
˗Fu˄1994˅˗Hecht-Nielson
˄1990˅઼ Hertz et al.˄1991˅DŽ
Ґ仈
w0=1ˈw1=2ˈw2=1
ᝏ⸕ಘ B Ⲵᵳ٬Ѫ
w0=0ˈw1=2ˈw2=1
䈧 ࡔ ᯝ ԕ л 㺘 䗮 ሩ ᡆ 䭉 DŽ ᝏ ⸕ ಘ A ᱟ more_general_than ᝏ ⸕ ಘ B Ⲵ DŽ
˄more_general_than ൘ㅜ 2 ㄐѝᇊѹ˅
4.4 ᇎ⧠ањє䗃ޕ㓯ᙗঅⲴݳdelta䇝㓳⌅ࡉDŽ䇝㓳ᆳᶕᤏਸⴞḷᾲᘥ-2+x1+2x2>0DŽ⭫
ࠪ䈟ᐞEሩ䇝㓳䘝ԓ⅑ᮠⲴ࠭ᮠᴢ㓯DŽ⭫ࠪ 5ˈ10ˈ50ˈ100ˈĂĂ⅑䘝ԓਾⲴߣㆆ䶒DŽ
˄a˅ ѪK䘹ਆн਼Ⲵᑨ䟿٬ˈᒦ֯⭘㺠߿ⲴᆖҐ䙏⦷üüҏቡᱟㅜi⅑䘝ԓ
֯⭘K0/iˈ䘋㹼䈅傼DŽଚањ᭸᷌ᴤྭ˛
˄b˅ 䈅傼໎䟿˄incremental˅઼ᢩ䟿˄batch˅ᆖҐDŽ䛓њ᭦ᮋᗇᴤᘛ˛㘳
㲁ᵳ٬ᴤᯠ⅑ᮠ઼ᙫᢗ㹼ᰦ䰤DŽ
o w0 w1 x1 w1 x12 wn x n wn x n2
4.7 㘳㲁ањєቲⲴࡽ侸ANNˈᆳާᴹєњ䗃ޕa઼bˈањ䳀অݳcˈ઼ањ䗃ࠪঅݳdDŽ
䘉њ㖁㔌ᴹӄњᵳ٬˄wcaˈwcbˈwc0ˈwdcˈwd0˅ˈަѝwx0㺘⽪অݳxⲴ䰸٬ᵳDŽݸᢺ䘉Ӌᵳ
Ⲵ٬ࡍॆѪ˄0.1ˈ0.1ˈ0.1ˈ0.1ˈ0.1˅ˈ❦ਾ㔉ࠪ֯⭘৽ੁՐ㇇⌅䇝㓳䘉њ㖁㔌Ⲵࡽє
⅑䘝ԓѝ⇿а⅑䘉Ӌᵳ٬Ⲵ٬DŽٷᇊᆖҐ䙏⦷K=0.3ˈߢ䟿D=0.9ˈ䟷⭘໎䟿Ⲵᵳ٬ᴤᯠˈ઼
ԕл䇝㓳ṧֻ˖
a b d
1 0 1
0 1 0
& 1
E ( w) { ¦ ¦ (t kd o kd )2 J ¦ w ji
2
2 dD koutputs i, j
Ѫ䘉њ䈟ᐞ E ᧘ሬࠪởᓖл䱽ᵳᴤᯠ⌅ࡉDŽ䇱᰾䘉њᵳ٬ᴤᯠ⌅ࡉⲴᇎ⧠ਟ䙊䗷൘䘋
㹼㺘 4-2 Ⲵḷ߶ởᓖл䱽ᵳᴤᯠࡽᢺ⇿њᵳ٬҈ԕањᑨᮠDŽ
4.11 ᓄ ⭘ ৽ ੁ Ր ㇇ ⌅ ᶕ ᆼ ᡀ Ӫ 㝨 䇶 ࡛ ԫ ࣑ DŽ ৲ 㿱 ӂ 㚄 㖁 亥
http://www.cs.cmu.edu/~tom/mlbook.html ᶕ㧧ᗇަ㓶㢲ˈवᤜӪ㝨മۿᮠᦞˈ৽ੁՐ〻ᒿ
Ⓚԓ⸱઼ާփⲴԫ࣑DŽ
৲㘳᮷⥞
ㅢ5ㄖ 䇺զٽ䇴
ᇍ؛䆒ⱘ㊒ᑺ䖯㸠㒣偠ⱘ䆘Ԅᰃᴎ఼ᄺдЁⱘᴀ䯂乬DŽᴀゴҟ㒡њ⫼㒳䅵ᮍ⊩Ԅ䅵؛
䆒㊒ᑺˈЏ㽕Ў㾷އҹϟϝϾ䯂乬˖佪ˈܜᏆⶹϔϾ؛䆒᳝䰤᭄ḋᴀϞ㾖ᆳࠄⱘ㊒ᑺˈ
ᗢḋԄ䅵ᅗ݊Ҫᅲ՟Ϟⱘ㊒ᑺDŽ݊ˈབᵰϔϾ؛䆒ᶤѯ᭄ḋᴀϞདѢϔϾˈ䙷М
ϔ㠀ᚙމϟᰃ৺䆹؛䆒⹂ޚDŽϝˈᔧ᭄᳝䰤ᯊˈᗢḋ催ᬜഄ߽⫼䖭ѯ᭄ˈ䗮䖛ᅗӀ
᮶㛑ᄺдࠄ؛䆒ˈ䖬㛑Ԅ䅵݊㊒ᑺ˛⬅Ѣ᳝䰤ⱘ᭄ḋᴀৃ㛑ϡҷ㸼᭄ⱘϔ㠀ߚᏗˈ᠔ҹ
Ң䖭ѯ᭄ϞԄ䅵ߎⱘ؛䆒㊒ᑺৃ㛑᳝䇃ᏂDŽ㒳䅵ⱘᮍ⊩ˈ㒧ড়᭄᳝݇ߚޚᏗⱘ؛ᅮˈ
Փ៥Ӏৃҹ⫼᳝䰤᭄ḋᴀϞⱘ㾖ᆳ㊒ᑺᴹ䘐䖥ᭈϾ᭄ߚᏗϞⱘⳳᅲ㊒ᑺDŽ
5.1 ࣞᵰ
᭄ᚙމϟˈᇍᄺдࠄⱘ؛䆒䖯㸠ሑৃ㛑ⱘ⹂ޚᗻ㛑䆘Ԅकߚ䞡㽕DŽॳПϔᕜㅔऩˈ
ᰃЎњⶹ䘧ᰃ৺ৃҹՓ⫼䆹؛䆒DŽ՟བˈҢϔϾ䭓ᑺ᳝䰤ⱘ᭄ᑧЁᄺдˈҹњ㾷ϡৠए⭫
↉ⱘᬜᵰˈህ᳝ᖙ㽕ሑৃ㛑⹂ޚഄⶹ䘧ᄺд㒧ᵰⱘℷ⹂ᗻDŽϔॳѢˈᇍ؛䆒ⱘ䆘Ԅ
ᰃ䆌ᄺдᮍ⊩ⱘ䞡㽕㒘៤䚼ߚDŽ՟བއㄪᷥᄺдЁˈЎ䙓ܡ䖛ᑺᢳড়䯂乬ᖙ乏䖯㸠ৢׂ
࠾ˈ䖭ᯊ៥Ӏᖙ乏䆘Ԅ↣ϔℹׂ࠾ᇍᷥⱘ㊒ᑺѻ⫳ⱘᕅડDŽℸˈ᳝ᖙ㽕њ㾷Ꮖׂ࠾ׂ
࠾ᷥⱘ㊒ᑺԄ䅵Ё᳝ⱘৃ㛑䇃ᏂDŽ
ᔧ᭄कߚܙ䎇ᯊˈ؛䆒㊒ᑺⱘԄ䅵ⳌᇍᆍᯧDŽ✊㗠ᔧ㒭ᅮⱘ᭄䲚䴲ᐌ᳝䰤ᯊˈ㽕ᄺ
дϔϾὖᗉᑊԄ䅵݊ᇚᴹⱘ㊒ᑺˈᄬϸϾᕜ݇䬂ⱘೄ䲒˖
z Ԅ䅵ⱘأᏂ(Bias in the estimate)DŽ佪ˈܜᄺдࠄⱘὖᗉ䆁㒗ḋ՟Ϟⱘ㾖ᆳ㊒ᑺ
䗮ᐌϡ㛑ᕜདഄ⫼ѢԄ䅵ᇚᴹḋ՟Ϟⱘ㊒ᑺDŽЎ؛䆒ᰃҢ䖭ѯḋ՟Ёᕫߎ
ⱘˈℸᇍᇚᴹḋ՟ⱘ㊒ᑺԄ䅵䗮ᐌأѢФ㾖DŽᇸ݊ᄺд఼䞛⫼њᕜⱘ؛
䆒ぎ䯈ˈᑊ䖛ᑺᢳড়䆁㒗ḋ՟ᯊˈ䖭ϔᚙމৃ㛑ߎ⦄DŽ㽕ᇍᇚᴹⱘ㊒ᑺ䖯㸠
᮴أԄ䅵ˈൟⱘᮍ⊩ᰃ䗝ᢽϢ䆁㒗ḋ՟؛䆒᮴݇ⱘẔ偠ḋ՟ˈ䖭Ͼḋ՟
䲚ড়ϞẔ偠؛䆒DŽ
z Ԅ䅵ⱘᮍᏂ(Variance in the estimate)DŽ݊ˈेՓ؛䆒㊒ᑺ⣀ゟⱘ᮴أẔ偠ḋ
՟Ϟ⌟䞣ˈᕫࠄⱘ㊒ᑺҡৃ㛑Ϣⳳᅲ㊒ᑺϡৠˈ䖭পއѢ⡍ᅮẔ偠ḋ՟䲚ড়ⱘ
㒘៤DŽẔ偠ḋ՟䍞ᇥˈѻ⫳ⱘᮍᏂ䍞DŽ
ᴀゴ䅼䆎њᇍᄺࠄⱘ؛䆒ⱘ䆘ԄǃᇍϸϾ؛䆒㊒ᑺⱘ↨䕗ǃ᳝䰤᭄ḋᴀᚙމϟϸϾ
ᄺдㅫ⊩㊒ᑺⱘ↨䕗DŽ݊Ёⱘ䅼䆎᭄䲚Ё㒳䅵䞛ḋ⧚䆎ⱘᴀᅮᕟˈ㗠ᴀゴ؛ᅮ䇏㗙
㒳䅵ᄺᮍ䴶≵᳝㚠᱃ⶹ䆚DŽ؛䆒ⱘ㒳䅵Ẕ偠䳔㽕䕗ⱘ⧚䆎ⶹ䆚DŽᴀゴᦤկњҟ㒡ᗻⱘ㓐
䗄ˈ䲚Ё䅼䆎䙷ѯϢ؛䆒ⱘᄺдǃ䆘Ԅ↨䕗Ⳍ݇ⱘ䯂乬DŽ
5.2 զ䇗ٽ䇴㋴ᓜ
䆘ԄϔϾ؛䆒ᯊˈ៥Ӏϔ㠀ᛳ݈䍷ѢԄ䅵݊ᇍᴹᅲ՟ⱘߚ㉏㊒ᑺDŽৠᯊˈг䳔㽕
ⶹ䘧䖭ϔ㊒ᑺԄ䅵Ёⱘৃ㛑ⱘ䇃Ꮒ˄ेϢℸԄ䅵Ⳍ㘨㋏ⱘ䇃Ꮒ䮼䰤˅DŽ
ᴀゴՓ⫼ⱘᄺд䯂乬ⱘḚᶊབϟDŽ᳝ϔ᠔᳝ৃ㛑ᅲ՟ⱘぎ䯈 X˄བ᠔᳝Ҏⱘ䲚ড়˅ ˈ݊
ϞᅮНњϾⳂᷛߑ᭄˄བ䅵ߦᴀᑈ䌁ф⒥䲾ᵓ㗙˅DŽ៥Ӏ؛ᅮ X Ёϡৠᅲ՟᳝ϡৠⱘߎ
⦄乥⥛ˈᇍℸˈϔ⾡ড়䗖ⱘᓎᮍᓣᰃˈ؛ᅮᄬϔⶹⱘὖ⥛ߚᏗ DˈᅗᅮНњ X Ё↣ϔ
ᅲ՟ߎ⦄ⱘὖ⥛˄བ 19 ቕⱘҎⱘὖ⥛↨ 109 ቕⱘҎὖ⥛催˅
DŽ⊼ᛣ D ᑊ≵᳝䇈ᯢ x ᰃϔℷ՟
䖬ᰃϔড՟ˈা⹂ᅮњ݊ߎ⦄ὖ⥛DŽᄺдӏࡵᰃ؛䆒ぎ䯈 H ϞᄺдϔϾⳂᷛὖᗉ˄ेⳂ
ᷛߑ᭄˅fDŽⳂᷛߑ᭄ f ⱘ䆁㒗ḋ՟⬅ᮑᬭ㗙ᦤկ㒭ᄺд఼˖↣ϔϾᅲ՟ᣝ✻ߚᏗ D 㹿⣀ゟ
ഄᢑপˈ✊ৢᅗ䖲ৠ݊ℷ⹂ⱘⳂᷛؐ f(x)㹿ᦤկ㒭ᄺд఼DŽ
Ў䇈ᯢ䖭ϔ⚍ˈ㗗㰥Ⳃᷛߑ᭄Ā䅵ߦᴀᑈ䌁ф⒥䲾ᵓ㗙āˈৃҹ䇗ᶹএ⒥䲾ᵓଚᑫⱘ乒
ᅶˈ䗮䖛ℸ䇗ᶹᴹᬊ䲚䆁㒗ḋ՟DŽ䖭䞠ᅲ՟ぎ䯈 X Ў᠔᳝Ҏ㒘៤ⱘ䲚ড়ˈ↣Ͼᅲ՟ৃ⬅
Ҏⱘ⾡ሲᗻᦣ䗄ˈབᑈ啘ǃ㘠Ϯǃ↣ᑈ⒥䲾᭄ㄝDŽߚᏗᚙ މD ᣛᅮњ⒥䲾ᵓଚᑫЁ
䘛ࠄⱘ↣ϾҎⱘὖ⥛DŽⳂᷛߑ᭄ f:Xė{0,1}ᇚ↣ϾҎ䖯㸠ߚ㉏ˈ߸ᮁᅗᰃ৺Ӯᴀᑈݙ䌁ф
⒥䲾ᵓDŽ
䖭Ͼϔ㠀ⱘḚᶊЁˈ៥Ӏᛳ݈䍷ⱘᰃҹϟϸϾ䯂乬˖
2. 䖭ϔ㊒ᑺԄ䅵ⱘৃ㛑ⱘ䇃Ꮒᰃᇥ˛
5.2.1 ṭᵢ䭏䈥⦽ૂⵕᇔ䭏䈥⦽
Ў㾷އϞ䗄ⱘϸϾ䯂乬ˈ䳔㽕⹂ߛഄऎߚߎϸ⾡㊒ᑺ˄ϸ⾡䫭䇃⥛˅DŽ݊ϔᰃৃ⫼᭄
ḋᴀϞ䆹؛䆒ⱘ䫭䇃⥛DŽ݊ѠᰃߚᏗЎ D ⱘᭈϾᅲ՟䲚ড়Ϟ䆹؛䆒ⱘ䫭䇃⥛DŽᅗӀߚ
߿㹿⿄Ўḋᴀ䫭䇃⥛ⳳᅲ䫭䇃⥛DŽ
ḋᴀ䫭䇃⥛˄ᷛ䆄ЎerrorS(h)˅Ў˖
定义: ؛䆒h݇ѢⳂᷛߑ᭄f᭄ḋᴀSⱘḋ
1
errorS (h) { ¦ G ( f ( x), h( x))
n xS
݊Ё n Ў S Ёḋ՟ⱘ᭄䞣ˈ㗠 G ( f ( x ), h( x )) f ( x ) z h( x ) ᯊЎ 1ˈ৺߭Ў 0DŽ
ⳳᅲ䫭䇃⥛˄⬅errorD(h)㸼⼎˅ˈЎh䇃ߚ㉏ᣝD
定义: ؛䆒h݇ѢⳂᷛߑ᭄fߚᏗDⱘⳳ
ߚᏗ䱣ᴎᢑপᅲ՟ⱘὖ⥛˖
errorD ( h) { Pr [ f ( x ) z h( x )]
xD
៥Ӏ䗮ᐌᛇⶹ䘧ⱘᰃ؛䆒ⱘⳳᅲ䫭䇃⥛errorD(h)ˈЎ䖭ᰃߚ㉏ᴹḋ՟ᯊߎ⦄䫭䇃
ⱘৃ㛑ᗻDŽ✊㗠៥Ӏ᠔㛑⌟䞣ⱘাᰃḋᴀ䫭䇃⥛errorS(h)ˈᅗ᠔㽕∖ⱘ᭄ḋᴀSᰃ៥Ӏ᠔
ᢹ᳝ⱘDŽᴀ㡖᠔㽕㗗㰥ⱘЏ㽕䯂乬ህᰃĀerrorS(h)ԩ⾡ᑺϞᦤկњᇍerrorD(h) ⱘԄ
䅵˛āDŽ
5.2.2 ⿱ᮙٽٲ䇴Ⲻ㖤ؗ॰䰪
Ў㾷އĀerrorS(h)ԩ⾡ᑺϞᦤկњᇍerrorD(h) ⱘԄ䅵āⱘ䯂乬ˈܜ㗗㰥hЎ⾏ᬷؐ
؛䆒ⱘᚙމDŽԧഄ䇈ˈ↨བ㽕Ѣᶤ⾏ᬷؐ؛䆒hḋᴀSϞ㾖ᆳࠄⱘḋᴀ䫭䇃⥛ˈԄ䅵ᅗ
ⱘⳳᅲ䫭䇃⥛ˈ݊Ё˖
z ḋᴀ S ࣙ n Ͼḋ՟ˈᅗӀⱘᢑপᣝ✻ὖ⥛ߚᏗ Dˈᢑপ䖛ᰃⳌѦ⣀ゟⱘˈᑊ
Ϩϡձ䌪Ѣ h
z nı30
z ؛䆒h䖭nϾḋ՟Ϟ⢃њrϾ䫭䇃˄errorS(h)=r/n˅
Ꮖⶹ䖭ѯᴵӊˈ㒳䅵⧚䆎ৃ㒭ߎҹϟᮁ㿔˖
1.≵᳝݊Ҫֵᙃⱘ䆱ˈerrorD(h)᳔ৃ㛑ⱘؐЎerrorS(h)
2.᳝㑺 95ˁⱘৃ㛑ᗻˈⳳᅲ䫭䇃⥛errorD(h)໘Ѣϟ䴶ⱘऎ䯈˖ݙ
В՟䇈ᯢˈ؛བ᭄ḋᴀSࣙn=40 Ͼḋ՟ˈᑊϨ؛䆒h䖭ѯ᭄Ϟѻ⫳њr=12 Ͼ䫭
䇃DŽ䖭ḋˈḋᴀ䫭䇃⥛ЎerrorS(h)=12/40˙0.3DŽབᵰ≵᳝ⱘֵᙃˈᇍⳳᅲ䫭䇃⥛errorD(h)
ⱘ᳔དⱘԄ䅵ेЎḋᴀ䫭䇃⥛ 0.3DŽ✊㗠៥Ӏϡ㛑ᳳᳯ䖭ᰃᇍⳳᅲ䫭䇃⥛ⱘᅠ㕢Ԅ䅵DŽབᵰ
᧰䲚 40 Ͼ䱣ᴎᢑপⱘḋ՟S´ˈḋᴀ䫭䇃⥛errorS´(h)ᇚϢॳᴹⱘerrorS(h)ᄬѯ䆌ϡৠDŽ
䖭⾡ϡৠᰃ⬅S´S㒘៤Ϟⱘ䱣ᴎᏂᓖ᠔ѻ⫳ⱘDŽᅲ䰙Ϟˈབᵰϡᮁ䞡䖭ϔᅲ偠ˈ↣ᢑ
পϔϾࣙ 40 ḋ՟ⱘḋᴀSiˈᇚӮথ⦄㑺 95%ⱘᅲ偠Ё䅵ㅫ᠔ᕫⱘऎ䯈ࣙⳳᅲ䫭䇃⥛DŽ
ℸˈ៥Ӏᇚℸऎ䯈⿄ЎerrorD(h)ⱘ 95%㕂ֵऎ䯈Ԅ䅵DŽᴀ՟Ёˈr=12 n=40ˈḍϞᓣˈ
95%㕂ֵऎ䯈Ў 0.30f(1.96h0.07)˙0.30f0.14DŽ
㸼 5-1 ঠջⱘNˁ㕂ֵऎ䯈ⱘzNؐ
Ϟ䴶៥Ӏὖ䗄њ䅵ㅫ⾏ᬷؐ؛䆒ⱘ㕂ֵऎ䯈ⱘ䖛ˈϟϔ㡖ᇚ㒭ߎ䖭ϔ䖛ⱘ㒳䅵ᄺ
⸔DŽ
5.3 䟽ṭ⨼䇰ะ
ᴀ㡖ҟ㒡њ㒳䅵ᄺ䞛ḋ⧚䆎ⱘϾᴀὖᗉˈࣙᣀὖ⥛ߚᏗǃᳳᳯؐǃᮍᏂǃѠ乍ߚ
ᏗℷᗕߚᏗǃҹঞঠջऩջऎ䯈DŽᇍѢ䖭ѯὖᗉⱘᴀњ㾷ᇚ᳝ࡽѢ⧚㾷؛䆒䆘Ԅㅫ
⊩䆘ԄDŽЎ䞡㽕ⱘˈᅗӀᦤկњϔ⾡䞡㽕ⱘὖᗉḚᶊˈҹ֓Ѣ⧚㾷Ⳍ݇ⱘᴎ఼ᄺд䯂乬˄བ
䖛ᑺᢳড়䯂乬˅ҹঞ⧚㾷៤ࡳⱘ⊯࣪䆁㒗ḋ՟᭄ⳂП䯈ⱘ݇㋏DŽᏆ㒣❳ᙝ䖭ѯὖᗉⱘ䇏
㗙ৃҹ䏇䖛ᴀ㡖DŽ݊Ёҟ㒡ⱘ݇䬂ὖᗉ㸼 5-2 Ё߫ߎDŽ
㸼 5-2 㒳䅵ᄺЁⱘᴀᅮНὖᗉ
䱣ᴎব䞣(random variable)ৃ㹿ⳟᰃ᳝ὖ⥛䕧ߎⱘϔϾᅲ偠DŽᅗⱘؐЎᅲ偠ⱘ䕧ߎ㒧ᵰDŽ
ᶤ䱣ᴎব䞣ⱘὖ⥛ߚᏗ(probability distribution)ᣛᅮњYপؐЎӏϔৃ㛑ⱘؐyiⱘৃ㛑ᗻPr(Y=yi)
5.3.1 䭏䈥⦽զ䇗ૂӂ亯∊ׁզ䇗
ḋᴀ䫭䇃⥛ⳳᅲ䫭䇃⥛П䯈ⱘᏂᓖϢ᭄ḋᴀᇣⱘձ䌪݇㋏བԩ˛䖭ϔ䯂乬
㒳䅵ᄺЁᏆ䗣ᕏⷨおDŽᅗৃ㸼䗄Ў˖㒭ᅮϔᘏԧЁ䱣ᴎᢑপⱘ䚼ߚḋᴀⱘ㾖ᆳ乥⥛ˈԄ䅵ᭈ
Ͼᘏԧⱘὖ⥛DŽ䖭䞠ˈ៥Ӏᛳ݈䍷ⱘ㾖ᆳ䞣Ў h ᰃ৺䇃ߚ㉏ḋ՟DŽ
㾷އ䆹䯂乬佪ܜ㽕⊼ᛣࠄˈ⌟䞣ḋᴀ䫭䇃⥛ⳌᔧѢϔϾ᳝䱣ᴎ䕧ߎⱘᅲ偠DŽ៥Ӏܜ
ҢߚᏗDЁ䱣ᴎᢑপߎnϾ⣀ゟⱘᅲ՟ˈᔶ៤ḋᴀSˈ✊ৢ⌟䞣ḋᴀ䫭䇃⥛errorS(h)ˈབࠡϔ
㡖᠔䗄ˈབᵰᇚᅲ偠䞡ˈ↣ᢑপᇣЎnⱘϡৠⱘḋᴀSiˈᇚৃҹᕫࠄϡৠⱘerrorSi(h)
ⱘؐˈᅗপއѢϡৠSiⱘ㒘៤Ёⱘ䱣ᴎᏂᓖDŽ䖭⾡ᚙމϟˈiϾ䖭ḋⱘᅲ偠ⱘ䕧ߎerrorSi(h)
㹿⿄Ўϔ䱣ᴎব䞣˄random variable˅
DŽϔ㠀ᚙމϟˈৃҹᇚ䱣ᴎব䞣ⳟ៤ϔϾ᳝䱣ᴎ䕧ߎⱘ
ᅲ偠DŽ䱣ᴎব䞣ؐेЎ䱣ᴎᅲ偠ⱘ㾖ᆳ䕧ߎDŽ
㸼 5-3 Ѡ乍ߚᏗ
插图——原书页码:25
n!
P(r ) p r (1 p) n r
r!(n r )!
བᵰ䱣ᴎব䞣 X 䙉ᕾѠ乍ߚᏗˈ߭˖
X পؐЎ r ⱘὖ⥛ Pr(X=r)⬅ P(r)㒭ߎDŽ
X ⱘᳳᳯؐഛؐ E[X]Ў˖
E[X]=np
X ⱘᮍᏂ Var(X)Ў
Var(X)=np(1-p)
XⱘᷛޚᏂЎ³XЎ˖
VX np(1 p)
ᇍѢ䎇ⱘ n ؐˈѠ乍ߚᏗᕜ䖥Ѣ᳝ৠḋഛؐᮍᏂⱘℷᗕߚᏗ˄㾕㸼 5-4˅DŽ᭄㒳䅵ᄺᆊᓎ䆂
া np(1-p)ı5 ᯊՓ⫼ℷᗕߚᏗᴹ䖥ԐѠ乍ߚᏗDŽ
5.3.2 ӂ亯࠼ᐹ
Ў䕗དഄ⧚㾷Ѡ乍ߚᏗˈ㗗㰥ҹϟⱘ䯂乬DŽ᳝ϔ⺼ᤳᑊᔃ᳆њⱘ⹀Ꮥˈ㽕Ԅ䅵ᡯ⹀Ꮥ
ᯊߎ⦄ℷ䴶ⱘὖ⥛DŽҸℸⶹὖ⥛Ў pDŽᡩᦋ䆹⹀Ꮥ n ᑊ䅵ㅫߎ⦄ℷ䴶ⱘ᭄ rDŽᇍѢ p
ⱘϔড়⧚ⱘԄ䅵Ў r/nDŽ⊼ᛣˈབᵰ䞡ᮄ䖯㸠ϔ䆹ᅲ偠ˈ⫳៤ϔϾᮄⱘ n ᡯ⹀Ꮥⱘ䲚ড়ˈ
݊ߎ⦄ℷ䴶᭄ r ᇚϢϔᅲ偠᳝䆌ϡৠˈҢ㗠ᕫࠄᇍ p ⱘϔϾԄ䅵DŽѠ乍ߚᏗᦣ䗄
ⱘᰃᇍӏϔৃ㛑ⱘ r ؐ˄Ң 0 ࠄ n˅ˈ䖭Ͼℷ䴶ὖ⥛Ў p ⱘ⹀Ꮥᡯᦋ n ᙄདߎ⦄ r ℷ䴶ⱘ
ὖ⥛DŽ
᳝䍷ⱘᰃˈҢᡯᦋ⹀Ꮥⱘ䱣ᴎḋᴀЁԄ䅵pˈϢᅲ՟ⱘ䱣ᴎḋᴀϞ⌟䆩hҹԄ䅵errorD(h)
ᰃⳌৠⱘ䯂乬DŽϔ⹀ᏕᡯᦋᇍᑨѢҢDЁᢑপϔϾᅲ՟ᑊ⌟䆩ᅗᰃ৺㹿h䇃ߚ㉏DŽϔ䱣
ᴎᡯᦋߎ⦄ℷ䴶ⱘὖ⥛pᇍᑨѢ䱣ᴎᢑপⱘᅲ՟㹿䇃ߚ㉏ⱘὖ⥛˄ेpᇍᑨerrorD(h)˅ DŽnᡯ
ᦋⱘḋᴀ㾖ᆳࠄrℷ䴶ˈᇍᑨnϾᢑপⱘᅲ՟㹿䇃ߚ㉏ⱘ᭄ⳂDŽℸr/nᇍᑨerrorS(h)DŽԄ䅵
pⱘ䯂乬ㄝᬜѢԄ䅵errorD(h)DŽѠ乍ߚᏗ㒭ߎњϔϾϔ㠀ᔶᓣⱘὖ⥛ߚᏗˈ᮴䆎⫼Ѣ㸼⼎n
⹀Ꮥߎ⦄ℷ䴶ⱘ᭄䖬ᰃnϾḋ՟Ё؛䆒ߎ䫭ⱘ᭄DŽѠ乍ߚᏗⱘ䆺㒚ᔶᓣձ䌪Ѣḋᴀ
ᇣnҹঞὖ⥛perrorD(h)DŽ
ϔ㠀ᴹ䇈ᑨ⫼Ѡ乍ߚᏗⱘᴵӊࣙᣀ˖
3.ޚᅲ偠ⱘn⣀ゟᇱ䆩ᣝᑣ߫ᠻ㸠ˈ⫳៤ϔϾ⣀ゟৠߚᏗⱘ䱣ᴎব䞣ᑣ߫Y1ˈY2ˈĂĂ
YnDŽҸRҷ㸼n䆩偠Ёߎ⦄Yi˙1 ⱘ᭄˖
n
R { ¦ Yi
i 1
n!
Pr( R r) p r (1 p) n r ˄5.2˅
r!(n r )!
5.3.3 ൽૂٲᯯᐤ
䱣ᴎব䞣ⱘϸϾ᳔ᐌ⫼ࠄⱘሲᗻЎ݊ᳳᳯؐ˄г⿄Ўഛؐ˅ᮍᏂDŽᳳᳯؐᰃ䞡䞛ḋ
䱣ᴎব䞣ᕫࠄⱘؐⱘᑇഛDŽ㊒⹂ⱘᅮНབϟ˖
定义: 㗗㰥䱣ᴎব䞣Yৃ㛑ⱘপؐЎy1…ynˈYⱘᳳ
ᳳᳯؐ(expected value)E(Y)Ў˖
n
E[Y ] { ¦ y i Pr(Y yi ) ˄5.3˅
i 1
E[Y ] np ˄5.4˅
݊Ё n p Ўᓣ 5.2 ЁᅮНⱘѠ乍ߚᏗⱘখ᭄DŽ
ϔ䞡㽕ሲᗻᮍ
ᮍᏂᦣ䗄ⱘᰃὖ⥛ߚᏗⱘᆑᑺᬷᑺˈेᅗᦣ䗄њ䱣ᴎব䞣Ϣ݊ഛؐП䯈
ⱘᏂ᳝DŽ
定义: 䱣ᴎব䞣 Y ⱘᮍ
ᮍᏂ˄variance˅Var[Y]Ў˖
ᮍᏂᦣ䗄ⱘᰃҢYⱘϔϾ㾖ᆳএԄ䅵݊ഛؐE(Y)ⱘ䇃ᏂᑇᮍⱘᳳᳯDŽᮍᏂⱘᑇᮍḍ㹿⿄
ЎYⱘᷛޚᏂˈ䆄Ў³YDŽ
ᷛޚᏂ˄standard deviation˅³YЎ˖
定义: 䱣ᴎব䞣Yⱘᷛ
㢹䱣ᴎব䞣 Y ᳡ҢѠ乍ߚᏗˈ߭ᮍᏂᷛޚᏂߚ߿Ў˖
Var[Y ] { np (1 p )
V Y { np(1 p) ˄5.7˅
5.3.4 զ䇗䠅θڅᐤૂᯯᐤ
៥ӀᏆᕫߎ䱣ᴎব䞣errorS(h)᳡ҢѠ乍ߚᏗˈ⦄ಲࠄࠡ䴶ⱘ䯂乬˖errorS(h)ⳳᅲ䫭
䇃⥛errorD(h)П䯈ৃ㛑ⱘᏂᓖᰃᇥ˛
⫼ᓣ 5.2 ЁѠ乍ߚᏗⱘᅮНᴹᦣ䗄errorS(h)errorD(h)ˈৃᕫ˖
r
errorS (h)
n
errorD (h) p
㒳䅵ᄺЁᇚerrorS(h)⿄Ўⳳᅲ䫭䇃⥛errorD(h)ⱘϔϾԄ䅵䞣 (estimator)DŽϔ㠀ഄˈԄ䅵
䞣ᰃ⫼ᴹԄ䅵ᶤޚᘏԧⱘᶤϔখ᭄ⱘ䱣ᴎব䞣DŽᇍѢԄ䅵䞣ˈᰒ✊᳔݇ᖗⱘᰃᅗᑇഛᴹ䇈
ᰃ৺㛑ѻ⫳ℷ⹂Ԅ䅵DŽϟ䴶ᅮНԄ䅵أᏂ(estimation bias)ЎԄ䅵䞣ⱘᳳᳯؐৠⳳᅲখ᭄ؐП
䯈ⱘᏂᓖDŽ
E[Y]-p
errorS(h)ᰃ৺ЎerrorD(h)ⱘϔϾ᮴أԄ䅵䞣˛⹂ᅲབℸˈЎᇍѢѠ乍ߚᏗˈrⱘᳳᳯؐ
Ўnp˄ㄝᓣ[5.4]˅DŽ⬅ℸˈᑊϨЎnЎϔᐌ᭄ˈ䙷Мr/nⱘᳳᳯؐЎpDŽ
ᇍԄ䅵أᏂ䖬䳔㽕ϸ⚍䇈ᯢDŽ佪ˈܜᴀゴᓔྟ៥Ӏᦤࠄˈ䆁㒗ḋ՟Ϟ⌟䆩؛䆒ᕫ
ࠄⱘᇍ؛䆒䫭䇃⥛ⱘԄ䅵أѢФ㾖࣪ˈ᠔ᣛⱘℷᰃԄ䅵أᏂDŽ㽕ՓerrorS(h)ᇍerrorD(h)᮴أ
Ԅ䅵ˈ؛䆒hḋᴀSᖙ乏⣀ゟ䗝পDŽѠˈԄ䅵أᏂ(estimation bias)䖭ϔὖᗉϡ㛑ϢѠゴ
ҟ㒡ⱘᄺд఼ⱘᔦ㒇أ㕂(inductive bias)Ⳍ⏋⎚DŽԄ䅵أᏂЎϔ᭄ᄫ䞣ˈ㗠ᔦ㒇أ㕂Ўᮁ㿔
䲚ড়DŽ
Ԅ䅵䞣ⱘϔ䞡㽕ሲᗻЎ݊ᮍᏂDŽ㒭ᅮϾ᮴أԄ䅵䞣ˈⳈ㾖Ϟᑨ䗝প݊ЁᮍᏂ᳔ᇣⱘDŽ
⬅ᮍᏂⱘᅮНˈ᠔䗝ᢽⱘᑨЎখ᭄ؐԄ䅵ؐП䯈ᳳᳯᑇᮍ䇃Ꮒ᳔ᇣⱘDŽ
ϔ㠀ᴹ䇈ˈ㢹nϾ䱣ᴎ䗝পⱘḋᴀЁ᳝rϾ䫭䇃ˈerrorS (h)ⱘᷛޚᏂЎ˖
Vr p(1 p)
V error ( h ) ˄5.8˅
S
n n
ᅗ㑺ㄝѢ⫼r/n˙errorS (h)ᴹҷ᳓p˖
5.3.5 㖤ؗ॰䰪
䗮ᐌᦣ䗄ᶤԄ䅵ⱘϡ⹂ᅮᗻⱘᮍ⊩ᰃՓ⫼ϔ㕂ֵऎ䯈ˈⳳᅲⱘؐҹϔᅮⱘὖ⥛㨑ܹ䆹ऎ
䯈ЁDŽ䖭ḋⱘԄ䅵⿄Ў㕂
㕂ֵऎ䯈˄confidence interval˅Ԅ䅵DŽ
བԩ㦋ᕫerrorD(h)ⱘ㕂ֵऎ䯈˛ㄨḜѢԄ䅵䞣errorS(h)᳡ҢѠ乍ߚᏗDŽ䖭ϔߚᏗⱘഛ
ؐЎerrorD(h)ˈᷛޚᏂৃ⬅ᓣ 5.9 䅵ㅫDŽℸˈЎ䅵ㅫ 95ˁ㕂ֵऎ䯈ˈা䳔㽕ᡒࠄϔϾҹഛ
ؐerrorD(h)ЎЁᖗⱘऎ䯈ˈᅗⱘᆑᑺ䎇ҹࣙ䆹ߚᏗϟܼ䚼ὖ⥛ⱘ 95ˁDŽㄝӋഄˈᅗᣛᅮњ
errorD(h)᳝ 95ˁⱘᴎӮ㨑ܹerrorS(h)਼ೈⱘᶤऎ䯈ⱘᇣDŽ
П᠔ҹՓ⫼ℷᗕߚᏗᴹҷ᳓ˈϔϾॳᰃ᭄㒳䅵খ㗗䛑߫㸼㒭ߎњℷᗕߚᏗϟࣙN
ˁⱘὖ⥛䋼䞣ⱘഛ਼ؐೈⱘऎ䯈ⱘᇣDŽ䖭ህᰃ䅵ㅫNˁ㕂ֵऎ䯈᠔䳔ⱘֵᙃDŽᅲ䰙Ϟ㸼 5-1
ℷᰃ䖭ḋϔϾ㸼DŽ㸼 5-1 Ё㒭ᅮⱘᐌ᭄zNᅮНⱘᰃ䩳ᔶℷᗕߚᏗϟˈࣙNˁὖ⥛䋼䞣ⱘ
ഛ਼ؐೈⱘ᳔ᇣऎ䯈ⱘᆑᑺDŽ㊒⹂ഄ䇈ˈzNҹᷛޚᏂ㒭ᅮњऎ䯈ⱘञᆑᑺ˄ेӏϔᮍ
䎱ഛؐⱘ䎱⾏˅ˈ 5-1(a)㒭ߎњ䩜ᇍz80ⱘϔϾऎ䯈DŽ
㸼 5-4 ℷᗕ催ᮃߚᏗ
插图——原书页码:139
ϔϾℷᗕߚᏗ˄г㹿⿄Ў催ᮃߚᏗ˅ᰃϔ䩳ൟߚᏗˈᅗᅮНЎϟ䴶ⱘὖ⥛ᆚᑺߑ᭄˖
2
1 § xP ·
1 ¨ ¸
2© V ¹
p ( x) e
2SV 2
ϔϾℷᗕߚᏗ⬅Ϟ䴶݀ᓣЁⱘϸϾখ᭄ᅠܼ⹂ᅮ˖³DŽ
བᵰ䱣ᴎব䞣 X 䙉ᕾℷᗕߚᏗˈ߭˖
X 㨑ܹࠄ(a, b)ⱘὖ⥛Ў˖
b
³ p( x)dx
a
X ⱘᳳᳯؐഛؐ E[X]Ў˖
E[X]=
X ⱘᮍᏂ Var(X)Ў
Var(X)=³2
XⱘᷛޚᏂЎ³XЎ˖
³X=³
Ёᖗᵕ䰤ᅮ⧚˄5.4.1 㡖˅䇈ᯢ䞣⣀ゟৠߚᏗⱘ䱣ᴎব䞣ⱘ䙉ᕾⱘߚᏗ䖥ԐЎℷᗕߚᏗDŽ
插图——原书页码:140
fzN³ ˄5.10˅
ⳌԐഄˈഛ᳝ؐ N%ⱘᴎӮ㨑ܹϟ䴶ⱘऎ䯈˖
yfzN³ ˄5.11˅
ಲᖚϔϟˈ㸼䖒ᓣⱘᇐЁ᳝ϸϾ䖥Ԑ࣪˖
2.Ѡ乍ߚᏗ⬅ℷᗕߚᏗ䖥ԐDŽ
5.3.6 ਂૂםঋם䗯⮂
Ϟ䗄ⱘ㕂ֵऎ䯈ᰃঠջⱘˈेᅗ㾘ᅮњԄ䅵䞣ⱘϞ⬠ϟ⬠DŽᶤѯᚙމϟˈৃ㛑㽕⫼
ࠄऩջ䖍⬠DŽ՟བˈᦤߎ䯂乬ĀerrorD(h)㟇ЎUⱘὖ⥛āDŽা㽕䰤ᅮhⱘ᳔䫭䇃⥛ˈ㗠
ϡТⳳᅲ䫭䇃⥛ᰃ৺ᇣѢԄ䅵䫭䇃⥛ᯊˈᕜ㞾✊Ӯᦤߎ䖭⾡䯂乬DŽ
া㽕ᇍϞ䗄ⱘ䖛ϔᇣⱘׂᬍህৃ䅵ㅫऩջ䫭䇃⥛䖍⬠DŽᅗ᠔ѢⱘџᅲЎℷᗕߚᏗ
݇Ѣ݊ഛؐᇍ⿄DŽℸˈӏᛣℷᗕߚᏗϞⱘঠջ㕂ֵऎ䯈㛑䕀ᤶЎⳌᑨⱘऩջऎ䯈ˈ㕂ֵ
ᑺЎॳᴹⱘϸסDŽ˄㾕 5-1(b)˅DŽᤶ㿔Пˈ⬅ϔϾ᳝ϟ⬠ L Ϟ⬠ U ⱘ 100(1-¢)%㕂ֵऎ
䯈ˈৃᕫࠄϔϾϟ⬠Ў L ᮴Ϟ⬠ⱘ 100(1-¢/2)%㕂ֵऎ䯈ˈৠᯊгৃᕫߎϔϾ᳝Ϟ⬠ U ᮴
ϟ⬠ⱘ 100(1-¢/2)%㕂ֵऎ䯈DŽ䖭䞠¢ᇍᑨѢⳳᅲؐ㨑ᣛᅮऎ䯈ⱘὖ⥛DŽᤶহ䆱䇈ˈ¢
ᰃⳳᅲؐ㨑ܹ 5-1(a)Ё᮴䰈ᕅ䚼ߚⱘὖ⥛ˈ¢/2 ᰃ㨑ܹ 5-1˄b˅ⱘ᮴䰈ᕅ䚼ߚⱘὖ⥛DŽ
5.4 ᧞ሲ㖤ؗ॰䰪Ⲻж㡢ᯯ⌋
ࠡϔ㡖ҟ㒡ⱘᰃ䩜ᇍϔ⡍ᅮᚙމᇐ㕂ֵऎ䯈Ԅ䅵˖Ѣ⣀ゟᢑপⱘnḋᴀˈԄ䅵⾏ᬷ
ؐ؛䆒ⱘerrorD(h)DŽᴀ㡖ҟ㒡ⱘᮍ⊩ᰃ䆌Ԅ䅵䯂乬Ё⫼ࠄⱘ䗮⫼ⱘᮍ⊩DŽ⹂ߛഄ䆆ˈ៥
ӀৃҹᇚℸⳟᰃѢᇣЎnⱘ䱣ᴎᢑপḋᴀⱘഛؐˈᴹԄ䅵ᘏԧഛؐⱘ䯂乬DŽ
䗮⫼ⱘ䖛ࣙҹϟℹ偸˖
1.⹂ᅮޚᘏԧЁ㽕Ԅ䅵ⱘখ᭄pˈ՟བerrorD(h)DŽ
2.ᅮНϔϾԄ䅵䞣Y˄བerrorS(h)˅ᅗⱘ䗝ᢽᑨЎ᳔ᇣᮍᏂⱘ᮴أԄ䅵䞣DŽ
3.⹂ᅮԄ䅵䞣᠔᳡Ңⱘὖ⥛ߚᏗDYˈࣙᣀ݊ഛؐᮍᏂDŽ
4.⹂ᅮNˁ㕂ֵऎ䯈ˈ䗮䖛ᇏᡒ䯜ؐLUҹՓ䖭ϾᣝDYߚᏗⱘ䱣ᴎব䞣᳝NˁᴎӮ㨑ܹL
UП䯈DŽ
ৢ䴶ⱘ㡖ᇚᑨ⫼䆹䗮⫼ⱘᮍ⊩ࠄ݊Ҫ⾡ᴎ఼ᄺдЁᐌ㾕ⱘԄ䅵䯂乬DŽ佪ܜ៥Ӏ䳔㽕
䅼䆎Ԅ䅵⧚䆎ⱘϔϾᴀ៤ᵰˈ⿄ЎЁᖗᵕ䰤ᅮ⧚(Central Limit Theorem)DŽ
5.4.1 ѣᗹᶷ䲆ᇐ⨼
Ёᖗᵕ䰤ᅮ⧚ᰃㅔ࣪㕂ֵऎ䯈ⱘᇐⱘϔϾᴀḍDŽ㗗㰥བϟⱘϔ㠀Ḛᶊ˖nϾ⣀
ゟᢑপⱘϨ᳡Ңৠḋὖ⥛ߚᏗⱘ䱣ᴎব䞣Y1ĂYnЁ㾖ᆳᅲ偠ؐ˄བৠϔ⹀Ꮥⱘnᡯᦋ˅DŽҸ
ҷ㸼↣ϔব䞣Yi᳡ҢⱘⶹߚᏗⱘഛؐˈᑊҸ³ҷ㸼ᷛޚᏂDŽ⿄䖭ѯব䞣YiЎ⣀ ⣀ゟৠߚᏗ
(independent, identically distributed)䱣ᴎব䞣ˈЎᅗӀᦣ䗄ⱘᰃ㞾⣀ゟᑊϨ᳡Ңৠḋὖ⥛
1 n
ߚᏗⱘᅲ偠DŽЎԄ䅵Yi᳡ҢⱘߚᏗⱘഛؐˈ៥Ӏ䅵ㅫḋᴀⱘؐ Yn { ¦ Yi ˄བnᡩᦋ
n i1
DŽЁᖗᵕ䰤ᅮ⧚䇈ᯢnėĞᯊ Yn ᠔᳡Ңⱘὖ⥛ߚᏗЎϔℷᗕߚᏗˈ
⹀ᏕЁߎ⦄ℷ䴶ⱘ↨՟˅
V
㗠ϡ䆎Yiᴀ䑿᳡ҢҔМḋⱘߚᏗDŽ䖯ϔℹˈYn ᳡ҢⱘߚᏗഛؐЎ㗠ϨᷛޚᏂЎ ˈ㊒
n
⹂ⱘᅮНབϟ˖
ᅮ⧚ 5.1˖Ёᖗᵕ䰤ᅮ⧚DŽ㗗㰥⣀ゟৠߚᏗⱘ䱣ᴎব䞣Y1…Ynⱘ䲚ড়ˈᅗӀ᳡Ңϔӏᛣⱘὖ⥛ߚ
1 n
ᏗˈഛؐЎˈ᳝䰤ᮍᏂ³2DŽᅮНḋᴀഛؐ Yn { ¦ Yi
n i1
DŽ߭ᔧnėĞᯊϟ䴶ⱘᓣᄤ
Yn P
V
n
᳡ҢϔℷᗕߚᏗˈഛؐЎ 0 ϨᷛޚᏂЎ 1DŽ
䖭ϔ㒧䆎䴲ᐌҸҎৗˈЎᅗ䇈ᯢϡⶹ䘧⣀ゟⱘYi᠔᳡ҢⱘߚޚᏗⱘᚙމϟˈ៥
Ӏৃҹᕫⶹḋᴀഛؐ Y ⱘߚᏗᔶᓣDŽ䖯ϔℹˈЁᖗᵕ䰤ᅮ⧚䇈ᯢњᗢḋՓ⫼ Y ⱘഛؐ
ᮍᏂᴹ⹂ᅮऩ⣀ⱘYiⱘഛؐᮍᏂDŽ
Ёᖗᵕ䰤ᅮ⧚ᰃϔϾ䴲ᐌ᳝⫼ⱘ㒧䆎ˈЎᅗ㸼⼎ӏᛣḋᴀഛؐⱘԄ䅵䞣˄བerrorS(h)
Ўഛؐ䫭䇃⥛˅᳡ҢⱘߚᏗn䎇ᯊৃ䖥ԐЎℷᗕߚᏗDŽབᵰ䖬ⶹ䘧䖭ϔ䖥Ԑⱘℷᗕߚ
ᏗⱘᮍᏂˈህৃ⫼ᓣ 5.11 ᴹ䅵ㅫ㕂ֵऎ䯈DŽϔϾ䗮ᐌⱘ㾘߭ᰃnı30 ᯊৃՓ⫼䖭ϔ䖥ԐDŽ
ࠡ䴶ⱘゴ㡖៥ӀℷᰃՓ⫼њℷᗕߚᏗᴹ䖥Ԑഄᦣ䗄errorS(h)᳡ҢⱘѠ乍ߚᏗDŽ
5.5 њٽ䇴䭏䈥⦽䰪Ⲻᐤᔸ
⦄㗗㰥ᇍᶤ⾏ᬷⳂᷛߑ᭄᳝ϸϾ؛䆒h1h2DŽ؛䆒h1ϔᢹ᳝n1Ͼ⣀ゟᢑপḋ՟ⱘḋᴀ
S1Ϟ⌟䆩ˈϨh2n2Ͼৠḋᢑপⱘḋ՟ⱘḋᴀS2Ϟ⌟䆩DŽ؛ᅮ㽕Ԅ䅵䖭ϸϾ؛䆒ⱘⳳᅲ䫭䇃
⥛䯈ⱘᏂᓖ˖
䱣ᴎব䞣 dˆ ᳡Ңⱘὖ⥛ߚᏗᰃҔМ˛Ңࠡ䴶ⱘゴ㡖Ёˈ៥Ӏⶹ䘧ᇍѢ䕗ⱘn1n2˄↨
བ䛑ı30˅ˈerrorS1(h1)errorS2(h2)䛑䖥Ԑ䙉ҢℷᗕߚᏗDŽ⬅ѢϸℷᗕߚᏗⱘᏂҡЎϔℷᗕߚ
Ꮧˈℸ dˆ г䖥Ԑ䙉ҢℷᗕߚᏗˈഛؐЎdDŽৠᯊˈৃᕫ䆹ߚᏗⱘᮍᏂЎerrorS1(h1)errorS2(h2)
ⱘᮍᏂⱘDŽՓ⫼ᓣ 5.9 㦋ᕫ䖭ϸϾߚᏗⱘ䖥ԐᮍᏂˈ᳝˖
errorS1 (h1 )(1 errorS1 (h1 )) errorS 2 (h2 )(1 errorS 2 (h2 ))
V d2ˆ | ˄5.12˅
n1 n2
errorS1 (h1 )(1 errorS1 (h1 )) errorS 2 (h2 )(1 errorS 2 (h2 ))
dˆ r z N (5.13)
n1 n2
5.5.1 ٽ䇴Ỷ僂
᳝ᯊ៥Ӏᛳ݈䍷ⱘᰃᶤ⡍ᅮⱘ⣰ᛇℷ⹂ⱘὖ⥛ˈ㗠ϡᰃᇍᶤখ᭄ⱘऎ䯈Ԅ䅵DŽ↨བϟ䴶
ⱘ䯂乬ĀerrorD(h1)>errorD(h2)ⱘৃ㛑ᗻ᳝˛āDŽҡՓ⫼ࠡϔ㡖ⱘᴵӊ䆒ᅮˈ؛ᅮ㽕⌟䞣h1
h2ⱘḋᴀ䫭䇃⥛ˈՓ⫼ᇣЎ 100 ⱘ⣀ゟḋᴀS1S2ˈᑊϨⶹ䘧errorS1(h1)˙0.30 ϨerrorS2(h2)
˙0.20ˈℸᏂᓖ d̂ Ў 0.10DŽᔧ✊ˈ⬅Ѣ᭄ḋᴀⱘ䱣ᴎᗻˈेՓerrorD(h1)İ errorD(h2)ˈ
ҡ᳝ৃ㛑ᕫࠄ䖭ḋⱘᏂᓖDŽ䖭䞠ˈ㒭ᅮḋᴀ䫭䇃⥛ d̂ ˙0.10ˈerrorD(h1)>errorD (h2)ⱘὖ⥛
ᰃᇥ˛ㄝӋഄˈབԩ䅵ㅫ d̂ ˙0.10 ᯊd>0 ⱘὖ⥛˛
dˆ P dˆ 1.64V dˆ
5.6 ᆜҖ㇍⌋∊䖹
᳝ᯊ៥Ӏᛳ݈䍷Ѣ↨䕗ϸϾᄺдㅫ⊩LALBⱘᗻ㛑ˈ㗠ϡᰃϸϾ⡍ᅮ؛䆒DŽᗢḋ䖥Ԑ
ഄẔ偠Ͼᄺдㅫ⊩ˈབԩ⹂ᅮϸϾㅫ⊩П䯈ⱘᏂᓖ㒳䅵Ϟᰃ᳝ᛣНⱘ˛㱑✊ˈᴎ఼ᄺ
дⷨお乚ඳˈᇍѢ↨䕗ⱘᮍ⊩ҡѝ䆎Ёˈϡ䖛䖭䞠ҟ㒡њϔϾড়⧚ⱘ䗨ᕘDŽ݇Ѣϡৠᮍ⊩
ⱘ䅼䆎㾕Dietterich˄1996˅
DŽ
ᓔྟܜᣛᅮ㽕Ԅ䅵ⱘখ᭄DŽ؛ᅮ᳝LALBϸϾㅫ⊩ˈ㽕⹂ᅮЎњᄺдϔ⡍ᅮⳂᷛߑ᭄f
ᑇഛᴹ䇈䙷Ͼㅫ⊩ӬDŽᅮНĀᑇഛāⱘϔ⾡ড়⧚ᮍ⊩ᰃˈҢϔޚᅲ՟ߚᏗDЁᢑপ᠔᳝
ࣙnϾḋ՟ⱘ䆁㒗䲚ড়ˈ᠔᳝䖭ḋⱘ䲚ড়Ё⌟䞣ϸϾㅫ⊩ⱘᑇഛᗻ㛑DŽᤶহ䆱䇈ˈ䳔㽕
Ԅ䅵؛䆒䫭䇃⥛П䯈Ꮒᓖⱘᳳᳯؐ˖
݊ЁL(S)ҷ㸼㒭ᅮ䆁㒗ḋᴀSᯊᄺдㅫ⊩L䕧ߎⱘ؛䆒ˈϟᷛSD㸼⼎ᳳᳯؐᰃߚޚ
ᏗDЁᢑপⱘḋᴀSϞ䅵ㅫDŽϞ䗄㸼䖒ᓣᦣ䗄ⱘᰃᄺдㅫ⊩LALBⱘᏂⱘᳳᳯؐDŽ
ᅲ䰙ⱘᄺдㅫ⊩↨䕗Ёˈ៥Ӏা᳝ϔϾ᳝䰤ⱘḋᴀD0DŽ䖭⾡ᚙމϟˈᕜᰒ✊ˈ㽕
Ԅ䅵Ϟ䗄ⱘ䞣䳔㽕ᇚD0ߚࡆ៤䆁㒗䲚ড়S0ϡⳌѸⱘ⌟䆩䲚ড়T0DŽ䆁㒗᭄ৃҹ⫼ᴹ᮶䆁㒗
LAজ䆁㒗LBˈ㗠⌟䆩᭄߭⫼ᴹ↨䕗ϸϾᄺдࠄⱘ؛䆒ⱘ⹂ޚᑺˈгህᰃˈՓ⫼ϟᓣᴹ䅵ㅫ˖
ᬍ䖯 5.15 ᓣⱘϔ⾡ᮍ⊩ᰃᇚ᭄D0ߚࡆЎϡⳌѸⱘ䆁㒗⌟䆩䲚ড়ˈ✊ৢ݊Ё
䅵ㅫ䫭䇃⥛ⱘᑇഛؐDŽ䖭ϔ䖛㸼 5-5 Ё߫ߎˈᅗϔৃ⫼᭄ⱘᅮḋᴀD0ϞԄ䅵ϸϾ
ᄺдㅫ⊩䫭䇃⥛П䯈ⱘᏂᓖDŽ䆹䖛佪ܜᇚ᭄ᢚߚЎkϾϡⳌѸⱘⳌㄝᄤ䲚ˈᄤ䲚ᇣ㟇
ᇥЎ 30DŽ✊ৢ䆁㒗⌟䆩ㅫ⊩kˈ↣Փ⫼݊ЁϔϾᄤ䲚Ў⌟䆩᭄䲚ˈ݊Ҫk-1 Ͼᄤ
䲚Ў䆁㒗䲚DŽՓ⫼䖭⾡ࡲ⊩ˈᄺдㅫ⊩kϾ⣀ゟ⌟䆩䲚Ϟ⌟䆩ˈ㗠䫭䇃⥛ⱘᏂᓖⱘഛؐ G
ЎϸϾᄺдㅫ⊩䯈ᏂᓖⱘԄ䅵DŽ
㸼 5-5 Ԅ䅵ϸᄺдㅫ⊩LALB䫭䇃⥛Ꮒᓖⱘϔ⾡ᮍ⊩
䖥Ԑⱘ㕂ֵऎ䯈ᇚℷ᭛Ё㒭ߎDŽ
S i m {D0 Ti }
hA m LA (S i )
hB m LB ( S i )
G i m errorT (hA ) errorT (hB )
i i
3.䖨ಲؐ G ˈ݊Ё
1 k
G { ¦G i
k i1
㸼 5-5 䖨ಲⱘ G ৃ㹿⫼ᇍᓣ 5.14 ᠔䳔㒧ᵰⱘϔϾԄ䅵DŽড়䗖ⱘ䇈⊩ᰃᡞ G ⳟϟ
ᓣⱘԄ䅵˖
k 1
݊ЁSҷ㸼ϔϾᇣЎ D0 ˈҢD0Ёϔ㟈ᢑপⱘ䱣ᴎḋᴀDŽ䆹ᓣ 5.14 Ёॳᴹ
k
ⱘ㸼䖒ᓣП䯈ˈᚳϔⱘᏂ߿Ѣ݊ᳳᳯؐⱘ䅵ㅫᰃৃ⫼᭄ⱘᄤ䲚D0Ϟ䅵ㅫˈ㗠ϡᰃ
ҢᭈϾߚᏗDϞᢑপⱘᄤ䲚Ϟ䅵ㅫDŽ
G r t N ,k 1 sG ˄5.17˅
k
1
sG { ¦
k (k 1) i 1
(G i G ) 2 ˄5.18˅
⊼ᛣ䖭䞠ᦣ䗄ⱘ↨䕗ᄺдㅫ⊩ⱘ䖛㽕ৠḋⱘ⌟䆩䲚ড়Ϟ⌟䆩ϸϾ؛䆒DŽ䖭Ϣ 5.5 㡖
Ёᦣ䗄ⱘ↨䕗ϸϾ⫼⣀ゟ⌟䆩䲚ড়䆘Ԅ䖛ⱘ؛䆒ϡৠDŽՓ⫼Ⳍৠḋᴀᴹ⌟䆩؛䆒㹿⿄Ў䜡ᇍ
⌟䆩(paired test)DŽ䜡ᇍ⌟䆩䗮ᐌӮѻ⫳㋻ᆚⱘ㕂ֵऎ䯈DŽЎ䜡ᇍ⌟䆩ЁӏᛣⱘᏂᓖ䛑
ᴹ⑤Ѣ؛䆒П䯈ⱘᏂᓖDŽⳌডˈ㢹؛䆒ߚᓔⱘ᭄ḋᴀϞⱘ⌟䆩ˈϸϾḋᴀ䫭䇃⥛П䯈ⱘ
Ꮒᓖгৃ㛑䚼ߚᴹ⑤ѢϸϾḋᴀ㒘៤ϞⱘϡৠDŽ
㸼 5-6 ঠջ㕂ֵऎ䯈tN,vⱘؐDŽᔧvėĞᯊˈtN,v䍟䖥ѢzNDŽ
㕂ֵᑺ N
90% 95% 98% 99%
v=2 2.92 4.30 6.96 9.92
v=5 2.02 2.57 3.36 4.03
v=10 1.81 2.23 2.76 3.17
v=20 1.72 2.09 2.53 2.84
v=30 1.70 2.04 2.46 2.75
v=120 1.66 1.98 2.36 2.62
v=Ğ 1.64 1.96 2.33 2.58
5.6.1 䞃ሯ t ⎁䈋
Ϟ䴶ᦣ䗄њ㒭ᅮᅮ᭄䲚ᯊ↨䕗ϸϾᄺдㅫ⊩ⱘ䖛DŽᴀ㡖䅼䆎䖭ϔ䖛ҹঞ 5.17
5.18 ᓣЁ㕂ֵऎ䯈ⱘ㒳䅵ᄺ䆎䆕DŽབᵰϔ䯙䇏ˈৃҹ䏇䖛ᅗ㗠ϡ༅䖲㓁ᗻDŽ
佪⊼ˈܜᛣࠄ⌟䆩䲚Tiⱘᇣ㟇ᇥࣙ 30 Ͼḋ՟DŽℸˈऩ⣀ⱘ¥iᇚ䖥Ԑ䙉ᕾℷᗕߚ
Ꮧ˄⬅Ёᖗᵕ䰤ᅮ⧚˅DŽℸˈ៥Ӏ᳝ϔ⡍⅞ᴵӊेYi᳡Ң䖥ԐⱘℷᗕߚᏗDŽৃҹᕫࠄˈϔ
㠀ഄˈᔧ↣ϾYi䙉ᕾℷᗕߚᏗᯊˈḋᴀഛؐ Y г䙉ᕾℷᗕߚᏗDŽ⬅ℸˈৃҹ㗗㰥Փ⫼ࠡ䴶䅵
ㅫ㕂ֵऎ䯈ⱘ㸼䖒ᓣ˄ㄝᓣ 5.11˅ˈ݊ЁⱘԄ䅵䞣ℷᰃ䙉ᕾњℷᗕߚᏗDŽ✊㗠ˈ䆹ㄝᓣ㽕∖
ⶹ䘧ߚᏗⱘᷛޚᏂˈԚ䖭䞠ⶹDŽ
t ⌟䆩ℷད⫼Ѣ䖭ḋⱘᚙᔶˈेԄ䅵ϔ㋏߫⣀ゟৠℷᗕߚᏗⱘ䱣ᴎব䞣ⱘḋᴀഛؐDŽ
䖭䞠ˈৃՓ⫼ᓣ 5.17 5.18 Ёⱘ㕂ֵऎ䯈ˈᅗৃ㹿䞡ᮄ㸼䗄Ў˖
P Y r t N ,k 1 sY
݊Ё sY ЎԄ䅵ⱘḋᴀഛؐⱘᷛޚᏂ˖
k
1
sY { ¦ (Yi Y )2
k (k 1) i 1
Ϟ䴶ⱘ䅼䆎䆕ᯢњՓ⫼ḋᴀഛؐ Y ᴹԄ䅵ϔϾࣙkϾ⣀ゟৠℷᗕߚᏗⱘ䱣ᴎব䞣
ⱘḋᴀഛؐᯊˈՓ⫼ᓣ 5.17 ᴹԄ䅵㕂ֵऎ䯈DŽ䖭ऍ䜡њ៥Ӏⱘ⧚ᛇⱘᴵӊˈे؛ᅮᇍѢⳂ
ᷛߑ᭄ⱘḋ՟ৃ䖯㸠᮴䰤ᄬপDŽᅲ䰙Ёˈ㢹᭄䲚D0᳝䰤ˈϨㅫ⊩Փ⫼㸼 5-5 ᦣ䗄ⱘᅲ䰙
ᮍ⊩ˈ䖭ϔ䆕ᯢᑊϡϹḐ䗖⫼DŽᅲ䰙ⱘ䯂乬ᰃˈЎѻ⫳¥iা᳝䞡ᮄ䞛ḋD0ˈҹⱘᮍ⊩
ᡞᅗߚࡆЎ⌟䆩䲚䆁㒗䲚DŽ¥iℸᯊⳌѦᑊϡ⣀ゟˈЎᅗӀѢҢ᳝䰤ᄤ䲚D0Ёᢑপⱘ
ⳌѦ䞡ⱘ䆁㒗ḋ՟ˈ㗠ϡᰃҢᭈϾߚᏗDЁᢑপDŽ
ὖᣀഄ䇈ˈѢ᳝䰤᭄ⱘᄺдㅫ⊩ⱘ↨䕗Ё≵᳝ϔϾऩ⣀ⱘᮍ⊩㛑⒵䎇៥ӀᏠᳯⱘ᠔
᳝㑺ᴳDŽ᳝ᖙ㽕䆄ԣ㒳䅵ᄺൟ᭄᳝䰤ᯊᕜᇥ㛑ᅠ㕢ഄऍ䜡ᄺдㅫ⊩偠䆕ⱘ᠔᳝㑺ᴳDŽ
✊㗠ᅗӀ⹂ᅲᦤկњ䖥Ԑⱘ㕂ֵऎ䯈ˈ᳝ࡽѢ㾷䞞ᄺдㅫ⊩ⱘᅲ偠ᗻ↨䕗DŽ
5.7 ቅ㔉ૂ㺛ݻ䈱⢟
ᴀゴⱘ㽕⚍ࣙᣀ˖
z 㒳䅵⧚䆎ᦤկњϔϾ⸔ˈҢ㗠Ѣ᭄ḋᴀSϞⱘ㾖ᆳ䫭䇃⥛errorS(h)ˈԄ
䅵؛䆒hⱘⳳᅲ䫭䇃⥛errorD(h)DŽ՟བˈབᵰhЎϔ⾏ᬷؐ؛䆒ˈ㗠Ϩ᭄ḋᴀࣙ
ᣀnı30 Ͼϡձ䌪hϨⳌѦ⣀ゟⱘḋ՟ᯊˈ䙷МerrorD(h)ⱘNˁ㕂ֵऎ䯈䖥ԐЎ˖
errorS (h)(1 errorS (h))
errorS (h) r z N
n
݊ЁzNⱘؐ⬅㸼 5-1 㒭ߎDŽ
z ϔ㠀ഄˈԄ䅵㕂ֵऎ䯈ⱘ䯂乬ৃ䗮䖛⹂ᅮϔᕙԄ䅵ⱘখ᭄˄བerrorD (h)˅ҹঞⳌ
ᇍᑨⱘԄ䅵䞣˄errorS (h)˅ᴹᅠ៤DŽ⬅ѢԄ䅵䞣ᰃϔ䱣ᴎব䞣˄བerrorS(h)ձ䌪
Ѣ䱣ᴎḋᴀS˅ˈᅗৃ⬅݊᳡Ңⱘὖ⥛ߚᏗᴹᦣ䗄DŽ㕂ֵऎ䯈ⱘ䅵ㅫৃ䗮䖛⹂ᅮ
䆹ߚᏗϟࣙ᠔䳔ὖ⥛䋼䞣ⱘऎ䯈ᴹᦣ䗄DŽ
z Ԅ䅵؛䆒㊒ᑺⱘϔ⾡䇃Ꮒৃ㛑ЎԄ䅵أᏂ˄estimation bias˅DŽབᵰYЎᇍᶤখ᭄
pⱘԄ䅵䞣ˈYⱘԄ䅵أᏂЎYⱘᳳᳯؐpП䯈ⱘᏂDŽ՟བˈབᵰSᰃ⫼ᴹᔶ៤؛
䆒hⱘ䆁㒗᭄ˈ߭errorS(h)㒭ߎњⳳᅲ䫭䇃⥛errorD(h)ⱘϔϾأѢФ㾖࣪ⱘԄ
䅵DŽ
z Ԅ䅵ѻ⫳䇃ᏂⱘѠ⾡ॳᰃԄ䅵ᮍᏂ˄variance˅DŽेՓᇍѢ᮴أԄ䅵ˈԄ䅵
䞣ⱘ㾖ᆳؐг᳝ৃ㛑ᅲ偠ЁϡৠDŽԄ䅵䞣ߚᏗⱘᮍᏂ³2ᦣ䗄њ䆹Ԅ䅵Ϣⳳ
ᅲؐⱘϡৠ᳝DŽ䆹ᮍᏂ᭄ḋᴀᯊ䰡ԢDŽ
z ↨䕗ϸᄺдㅫ⊩ᬜᵰⱘ䯂乬᭄ᯊ䯈᮴䰤ᯊᰃϔϾⳌᇍᆍᯧⱘԄ䅵䯂乬ˈ
Ԛ䌘⑤᳝䰤ᯊ㽕ೄ䲒ᕫDŽᴀゴᦣ䗄ⱘϔ⾡䗨ᕘᰃৃ⫼᭄ⱘϡৠᄤ䲚Ϟ
䖤㸠ᄺдㅫ⊩ˈ࠽ԭ᭄Ϟ⌟䆩ᄺࠄⱘ؛䆒ˈ✊ৢᇚ䖭ѯᅲ偠ⱘ㒧ᵰᑇഛDŽ
z 䖭䞠᠔㗗㰥ⱘ᭄ᚙމϟˈᇐ㕂ֵऎ䯈䳔㽕䖯㸠Ͼ؛ᅮ䖥ԐDŽ՟བϞ䴶
ⱘerrorD (h)ⱘ㕂ֵऎ䯈䳔㽕ᇚѠ乍ߚᏗ䖥ԐЎℷᗕߚᏗ˗䖥Ԑ䅵ㅫߚᏗⱘᮍᏂ˗
ҹঞ؛ᅮᅲ՟Ңϔᅮϡবⱘὖ⥛ߚᏗЁ⫳៤DŽѢ䖭ѯ䖥Ԑᕫࠄⱘऎ䯈াᰃ
䖥Ԑ㕂ֵऎ䯈ˈԚᅗӀҡᦤկњ䆒䅵㾷䞞ᴎ఼ᄺдᅲ偠㒧ᵰⱘ᳝ᬜᣛᇐDŽ
Փ⫼㒳䅵ⱘᮍ⊩ᴹԄ䅵⌟䆩؛䆒䖭ϔЏ乬᳝䞣ⱘ᭛⤂DŽᴀゴাҟ㒡њᴀὖᗉˈ㒚
㡖ⱘ䯂乬ৃ䆌к㈡᭛ゴЁᡒࠄDŽBillingsley et al.˄1986˅ᦤկњᇍ㒳䅵ᄺⱘϔϾᕜㅔ
ᯢⱘҟ㒡ˈ䆺ሑᦣ䗄њ䖭䞠᠔䅼䆎ⱘϔѯ䯂乬DŽ݊Ҫ᭛⤂ࣙᣀ DeGroot˄1986˅˗ Casella &
Berger˄1990˅DŽDuda & Hart˄1973˅᭄ؐᓣ䆚߿乚ඳᦤߎњ䖭ѯ䯂乬ⱘ㾷އDŽ
Geman et al.˄1992˅䅼䆎њৠᯊ᳔ᇣ࣪أᏂ᳔ᇣ࣪ᮍᏂП䯈ߎⱘᡬЁDŽ䖭ϔҢ
᳝䰤᭄Ёᄺд↨䕗؛䆒ⱘЏ乬ҡѝ䆎ЁDŽ՟བˈDietterich˄1996˅䅼䆎њϡৠⱘ䆁
㒗-⌟䆩᭄ߚࡆϟՓ⫼䜡ᇍᏂᓖ t ⌟䆩ᏺᴹⱘ亢䰽DŽ
д乬
5.5 ᇍѢϡৠ᭄ḋᴀϞ⌟䆩ⱘϸ؛䆒䫭䇃⥛ⱘᏂˈ㒭ߎ䅵ㅫऩջϞ⬠ऩջϟ⬠ⱘ
Nˁ㕂ֵऎ䯈ⱘ䗮⫼㸼䖒ᓣDŽ
䋱ᮃ⧚ᦤկњ⧚ⱘϔ⾡ὖ⥛↉DŽᅗѢབϟⱘ؛ᅮˈेᕙ㗗ᶹⱘ䞣䙉ᕾᶤὖ⥛
ߚᏗˈϨৃḍ䖭ѯὖ⥛ঞᏆ㾖ᆳࠄⱘ᭄䖯㸠⧚ˈҹߎ᳔ӬⱘއㄪDŽ䋱ᮃ⧚ᇍᴎ
఼ᄺдकߚ䞡㽕ˈЎᅗЎ㸵䞣Ͼ؛䆒ⱘ㕂ֵᑺᦤկњᅮ䞣ⱘᮍ⊩DŽ䋱ᮃ⧚ЎⳈ᪡
ὖ⥛ⱘᄺдㅫ⊩ᦤկњ⸔ˈ㗠ϨᅗгЎ݊Ҫㅫ⊩ⱘߚᵤᦤկњ⧚䆎ḚᶊDŽ
6.1 ԁ㔃
䋱ᮃᄺдৠ៥Ӏⱘᴎ఼ᄺдⷨおⳌ݇ˈ᳝ϸϾॳDŽ佪ˈܜ䋱ᮃᄺдㅫ⊩㛑䅵ㅫ
ᰒᓣⱘ؛䆒ὖ⥛ˈབᴈ㋴䋱ᮃߚ㉏఼ˈᅗᰃ㾷Ⳍއᑨᄺд䯂乬ⱘ᳔᳝ᅲ䰙Ӌؐⱘᮍ⊩ПϔDŽ
՟བˈMichie et al.˄1994˅䆺㒚ⷨお↨䕗њᴈ㋴䋱ᮃߚ㉏఼˄naïve Bayesian classifier˅
݊Ҫᄺдㅫ⊩ˈࣙᣀއㄪᷥ⼲㒣㔥㒰DŽҪӀথ⦄ᴈ㋴䋱ᮃߚ㉏఼᭄ᚙމϟϢ݊Ҫᄺ
дㅫ⊩ᗻ㛑Ⳍᔧˈᶤѯᚙމϟ䖬ӬѢ݊Ҫㅫ⊩DŽᴀゴᦣ䗄њᴈ㋴䋱ᮃߚ㉏఼ˈᑊᦤկњ
ϔϾ䆺㒚՟ᄤ˖ेᅗᑨ⫼Ѣ᭛ᴀ᭛ḷߚ㉏ⱘᄺд䯂乬˄བ⬉ᄤᮄ䯏ߚ㉏˅DŽᇍѢ䖭ḋⱘᄺд
ӏࡵˈᴈ㋴䋱ᮃߚ㉏ᰃ᳔᳝ᬜⱘㅫ⊩ПϔDŽ
䋱ᮃᮍ⊩ᇍѢᴎ఼ᄺдⷨおⱘ䞡㽕ᗻ䖬ԧ⦄ˈᅗЎ⧚㾷᭄ᄺдㅫ⊩ᦤկњϔ⾡᳝
ᬜⱘ↉ˈ㗠䖭ѯㅫ⊩ϡϔᅮⳈ᪡ὖ⥛᭄DŽ՟བˈᴀゴߚᵤњ 2 ゴⱘ Find-S
䗝⍜䰸ㅫ⊩ˈҹ߸ᮁ㒭ᅮ᭄ᯊાϔϾㅫ⊩ᇚ䕧ߎ᳔᳝ৃ㛑ⱘ؛䆒DŽ៥Ӏ䖬Փ⫼䋱ᮃߚ
ᵤ䆕ᯢњ⼲㒣㔥㒰ᄺдЁⱘϔϾ݇䬂ᗻⱘ䗝ᢽ˖े᧰㋶⼲㒣㔥㒰ぎ䯈ᯊˈ䗝ᢽՓ䇃Ꮒᑇᮍ
᳔ᇣ࣪ⱘ⼲㒣㔥㒰DŽ៥Ӏ䖬ᇐߎϔ⾡䇃Ꮒߑ᭄˖Ѹঝ➉DŽᅗᄺд乘⌟ὖ⥛Ⳃᷛߑ᭄
ᯊ↨䇃Ꮒᑇᮍড়䗖DŽᴀゴ䖬⫼䋱ᮃⱘ↉ߚᵤњއㄪᷥⱘᔦ㒇أ㕂˄ेӬ䗝᳔ⷁⱘއ
ㄪᷥ˅ˈᑊ㗗ᶹњᆚߛⳌ݇ⱘ᳔ᇣᦣ䗄䭓ᑺ˄Minimum Description Length˅ॳ߭DŽᇍ䋱ᮃ
ᮍ⊩ⱘᴀњ㾷ˈᇍѢ⧚㾷ࠏ⬏ᴎ఼ᄺдЁ䆌ㅫ⊩ⱘ᪡ᕜ䞡㽕DŽ
䋱ᮃᄺдᮍ⊩ⱘ⡍ᗻࣙᣀ˖
x 㾖ᆳࠄⱘ↣Ͼ䆁㒗ḋ՟ৃҹ䞣ᓣഄ䰡Ԣछ催ᶤ؛䆒ⱘԄ䅵ὖ⥛DŽ䖭ᦤկњ
ϔ⾡↨݊Ҫㅫ⊩ড়⧚ⱘᄺд䗨ᕘDŽ݊Ҫㅫ⊩ӮᶤϾ؛䆒Ϣӏϔḋ՟ϡϔ㟈
ᯊᅠܼএᥝ䆹؛䆒DŽ
x ܜ偠ⶹ䆚ৃҹϢ㾖ᆳ᭄ϔ䍋އᅮ؛䆒ⱘ᳔㒜ὖ⥛DŽ䋱ᮃᄺдЁˈܜ偠ⶹ
䆚ⱘᔶᓣৃҹᰃ˄1˅↣Ͼ䗝؛䆒ⱘܜ偠ὖ⥛˄2˅↣Ͼৃ㛑؛䆒ৃ㾖ᆳ᭄
Ϟⱘὖ⥛ߚᏗDŽ
x 䋱ᮃᮍ⊩ৃܕ䆌؛䆒ߎخϡ⹂ᅮᗻⱘ乘⌟DŽ˄↨བ䖭ḋⱘ؛䆒˖䖭ϔ㚎♢⮙
Ҏ᳝ 93%ⱘᴎӮᒋ˅DŽ
x ᮄⱘᅲ՟ߚ㉏ৃ⬅Ͼ؛䆒ϔ䍋ߎ乘⌟ˈҹᅗӀⱘὖ⥛Ўᴗ䞡DŽ
x ेՓ䋱ᮃᮍ⊩䅵ㅫᴖᑺ䕗催ᯊˈᅗӀҡৃخЎϔϾ᳔Ӭⱘއㄪⱘᷛޚ㸵
䞣݊Ҫᮍ⊩DŽ
ᅲ䏉Ёᑨ⫼䋱ᮃᮍ⊩ⱘ䲒ᑺПϔѢˈᅗӀ䳔㽕ὖ⥛ⱘ߱ྟⶹ䆚DŽᔧ䖭ὖ⥛乘ܜ
ⶹᯊˈৃҹѢ㚠᱃ⶹ䆚ǃ乘ޚܜདⱘ᭄ҹঞ݇ѢߚޚᏗⱘ؛ᅮᴹԄ䅵䖭ѯὖ⥛DŽ
ϔᅲ䰙ೄ䲒Ѣˈϔ㠀ᚙމϟ⹂ᅮ䋱ᮃ᳔Ӭ؛䆒ⱘ䅵ㅫҷӋ↨䕗˄ৠ䗝؛䆒ⱘ᭄䞣៤
㒓ᗻ݇㋏˅DŽᶤѯ⡍ᅮᚙᔶϟˈ䖭⾡䅵ㅫҷӋৃҹ㹿䰡ԢDŽ
ᴀゴ࠽ԭ䚼ߚⱘ㒘៤བϟDŽ6.2 㡖ҟ㒡њ䋱ᮃ⧚䆎ˈᑊᅮНњᵕԐ✊˄maximum
likelihood˅؛䆒ᵕৢ偠ὖ⥛؛䆒˄maximum a posteriori probability hypotheses˅DŽϟᴹ
ⱘಯ㡖ᇚℸὖ⥛Ḛᶊᑨ⫼Ѣߚᵤࠡ䴶ゴ㡖ⱘⳌ݇䯂乬ᄺдㅫ⊩DŽ՟བˈ៥Ӏ䆕ᯢњ⡍ᅮ
ࠡᦤϟˈϾࠡ䗄ⱘㅫ⊩㛑䕧ߎᵕԐ✊؛䆒DŽ࠽ԭⱘ㡖߭ҟ㒡њ⾡Ⳉ᪡ὖ⥛ⱘᄺ
дㅫ⊩DŽࣙᣀ䋱ᮃ᳔Ӭߚ㉏఼ǃGibbs ㅫ⊩ᴈ㋴䋱ᮃߚ㉏఼DŽ᳔ৢˈ៥Ӏ䅼䆎њ䋱
ᮃ㕂ֵ㔥ˈᅗᰃϔ⾡Ѣὖ⥛⧚ⱘ䕗ᮄⱘᄺдᮍ⊩˗ҹঞ EM ㅫ⊩ˈᰃᔧᄬ㾖⌟ࠄব
䞣ᯊᑓ⊯Փ⫼ⱘᄺдㅫ⊩DŽ
6.2 䍓ਬᯥ⌋ࡏ
㽕㊒⹂ഄᅮН䋱ᮃ⧚䆎ˈܜᓩܹϔѯ䆄োDŽ៥Ӏ⫼ P(h)ᴹҷ㸼䖬≵᳝䆁㒗᭄ࠡˈ؛
䆒 h ᢹ᳝ⱘ߱ྟὖ⥛DŽP(h)ᐌ㹿⿄Ў h ⱘܜ偠ὖ⥛˄prior probability ˅ˈᅗডњ៥Ӏ᠔ᢹ
᳝ⱘ݇Ѣ h ᰃϔℷ⹂؛䆒ⱘᴎӮⱘ㚠᱃ⶹ䆚DŽབᵰ≵᳝䖭ϔܜ偠ⶹ䆚ˈ䙷Мৃҹㅔऩഄᇚ↣
ϔ䗝؛䆒䌟ќⳌৠⱘܜ偠ὖ⥛DŽⳌԐഄˈৃ⫼ P(D)ҷ㸼ᇚ㽕㾖ᆳⱘ䆁㒗᭄ D ⱘܜ偠ὖ
⥛˄ᤶ㿔Пˈ≵᳝⹂ᅮᶤϔ؛䆒៤ゟᯊˈD ⱘὖ⥛˅DŽϟϔℹˈҹ P(D|h)ҷ㸼؛䆒 h ៤ゟ
ⱘᚙᔶϟ㾖ᆳࠄ᭄ D ⱘὖ⥛DŽϔ㠀ഄˈ៥ӀՓ⫼ P(x|y)ҷ㸼㒭ᅮ y ᯊ x ⱘὖ⥛DŽᴎ఼
ᄺдЁˈ៥Ӏᛳ݈䍷ⱘᰃ P(h|D)ˈे㒭ᅮ䆁㒗᭄ D ᯊ h ៤ゟⱘὖ⥛DŽP(h|D)㹿⿄Ў h ⱘৢ
偠ὖ⥛˄posterior probability˅ˈЎᅗডњⳟࠄ䆁㒗᭄ D ৢ h ៤ゟⱘ㕂ֵᑺDŽᑨ⊼ᛣˈ
ৢ偠ὖ⥛ P(h|D)ডњ䆁㒗᭄ D ⱘᕅડ˗Ⳍডˈܜ偠ὖ⥛ P(h)ᰃ⣀ゟѢ D ⱘDŽ
䋱ᮃ݀ᓣ
P ( D | h) P ( h)
P(h | D) ˄6.1˅
P( D)
䆌ᄺдഎ᱃Ёˈᄺд఼㗗㰥䗝؛䆒䲚ড়Hᑊ݊Ёᇏᡒ㒭ᅮ᭄Dᯊৃ㛑ᗻ᳔
ⱘ؛䆒hęH˄㗙ᄬϾ䖭ḋⱘ؛䆒ᯊ䗝ᢽ݊ЁПϔ˅DŽ䖭ḋⱘ᳔᳝ৃ㛑ᗻⱘ؛䆒㹿
⿄Ўᵕৢ偠˄maximum a posteriori, MAP˅؛䆒DŽ⹂ᅮMAP؛䆒ⱘᮍ⊩ᰃ⫼䋱ᮃ݀ᓣ䅵
ㅫ↣Ͼ䗝؛䆒ⱘৢ偠ὖ⥛DŽ㊒⹂ഄ䇈ᔧϟᓣ៤ゟᯊˈ⿄hMAPЎüMAP؛䆒˖
ЎњՓϞ䴶ⱘ䅼䆎Ϣᴎ఼ᄺд䯂乬Ⳍ㘨㋏ˈ៥Ӏᡞ᭄ D ⿄ᶤⳂᷛߑ᭄ⱘ䆁㒗ḋ՟ˈ
㗠ᡞ H ⿄Ў䗝Ⳃᷛߑ᭄ぎ䯈DŽᅲ䰙Ϟˈ䋱ᮃ݀ᓣ᳝ⴔЎ᱂䘡ⱘᛣНDŽᅗৠḋৃҹᕜ
དഄ⫼ѢӏᛣѦ᭹ੑ乬ⱘ䲚ড় Hˈা㽕䖭ѯੑ乬ⱘὖ⥛ПЎ 1˄՟བ˖Āぎᰃ݄㡆ⱘā
Āぎϡᰃ݄㡆ⱘā˅DŽᴀゴЁ᳝ᯊᇚ H ЎࣙⳂᷛߑ᭄ⱘ؛䆒ぎ䯈ˈ㗠 D Ў䆁㒗՟
䲚ড়DŽ݊Ҫϔѯᯊ㗗㰥ᇚ H ⳟϔѯѦ᭹ੑ乬ⱘ䲚ড়ˈ㗠 D Ўᶤ⾡᭄DŽ
6.2.1 ⽰ׁ
Ў䇈ᯢ䋱ᮃ㾘߭ˈৃ㗗㰥ϔए⭫䆞ᮁ䯂乬ˈ݊Ё᳝ϸϾৃ䗝ⱘ؛䆒˖ ˄1˅⮙Ҏ᳝ᶤ⾡
㉏ൟⱘⰠ⮛ˈ ˄2˅⮙Ҏ᮴Ⱐ⮛DŽৃ⫼ⱘ᭄ᴹ㞾Ѣϔ࣪偠⌟䆩ˈᅗ᳝ϸ⾡ৃ㛑ⱘ䕧ߎ˖˄ℷ˅
˄䋳˅DŽ៥Ӏ᳝ܜ偠ⶹ䆚˖᠔᳝ҎষЁা᳝ 0.008 ⱘҎᙷ᳝䆹⮒⮙DŽˈ䆹࣪偠⌟
䆩াᰃ䆹⮙ⱘϔϾϡᅠܼⱘ乘䅵DŽ䆹⌟䆩䩜ᇍ⹂ᅲ᳝⮙ⱘᙷ㗙᳝ 98%ⱘৃ㛑䖨ಲℷ⹂ⱘ㒧
ᵰˈ㗠ᇍ᮴䆹⮙ⱘᙷ㗙᳝ 97%ⱘৃ㛑ℷ⹂䖨ಲ 㒧ᵰDŽ䰸ℸҹˈ⌟䆩䖨ಲⱘ㒧ᵰᰃ䫭䇃
ⱘDŽϞ䴶ⱘᚙ⬅ৃމҹϟⱘὖ⥛ᓣὖᣀ˖
؛ᅮ⦄᳝ϔᮄ⮙Ҏˈ࣪偠⌟䆩䖨ಲњ㒧ᵰDŽᰃ৺ᑨᇚ⮙ҎᮁᅮЎ᳝Ⱐ⮛ਸ਼˛ᵕৢ偠
؛䆒ৃ⫼ᓣ 6.2 ᴹ䅵ㅫ˖
ℸˈhMAP=cancerDŽ⹂ߛⱘৢ偠ὖ⥛ৃᇚϞ䴶ⱘ㒧ᵰᔦϔ࣪ҹՓᅗӀⱘЎü ˄े
0.0078
P(cancer|)= =0.21˅DŽ䆹ℹ偸ⱘḍѢˈ䋱ᮃ݀ᓣ䇈ᯢৢ偠ὖ⥛ህᰃ
0.0078 0.0298
Ϟ䴶ⱘ䞣䰸ҹ᭄P()DŽ㱑✊P()≵᳝Ў䯂乬䰜䗄ⱘϔ䚼ߚⳈ㒭ߎˈԚЎᏆⶹ
ˈℸৃҹ䖯㸠ᔦ
P(cancer|)P(cancer|)ⱘᖙЎ 1˄े䆹⮙Ҏ㽕М᳝Ⱐ⮛ˈ㽕М≵᳝˅
ϔ࣪DŽ⊼ᛣ㱑✊᳝Ⱐ⮛ⱘৢ偠ὖ⥛↨ܜ偠ὖ⥛㽕ˈԚ᳔ৃ㛑ⱘ؛䆒ҡЎℸҎ≵᳝Ⱐ⮛DŽ
བϞ՟᠔⼎ˈ䋱ᮃ⧚ⱘ㒧ᵰᕜഄձ䌪Ѣܜ偠ὖ⥛ˈ㽕Ⳉᑨ⫼䆹ᮍ⊩ᖙ乏ܜ㦋প
䆹ؐDŽ䖬㽕⊼ᛣ䆹՟Ёᑊ≵᳝ᅠܼഄ㹿ফᢦ㒱؛䆒ˈ㗠াᰃ㾖ᆳࠄ䕗ⱘ᭄ৢ؛䆒
ⱘৃ㛑ᗻޣᇣњDŽ
P ( D | h) P ( h)
P(h | D)
P( D)
¦
n
ܼὖ⥛݀ᓣ(Theorem of total probability)˖བᵰџӊA1, …, AnѦ᭹Ϩ P( Ai ) 1 ˈ߭˖
i 1
n
P( B) ¦ P( B | A ) P( A )
i 1
i i
㸼 6-1 ᴀὖ⥛݀ᓣ㸼
6.3 䍓ਬᯥ⌋ࡏૂᾸᘫᆜҖ
䋱ᮃ⊩߭ὖᗉᄺд䯂乬ⱘ݇㋏ᰃҔМ˛Ў䋱ᮃ⊩߭Ў䅵ㅫ㒭ᅮ䆁㒗᭄ϟӏ
ϔ؛䆒ⱘৢ偠ὖ⥛ᦤկњॳ߭ᗻᮍ⊩ˈ៥ӀৃⳈᇚ݊ЎϔϾᴀⱘᄺдㅫ⊩˖䅵ㅫ↣Ͼ
؛䆒ⱘὖ⥛ˈݡ䕧ߎ݊Ёὖ⥛᳔ⱘDŽᴀ㡖㗗㰥њ䖭ḋϔϾ Brute-Force 䋱ᮃὖᗉᄺдㅫ
⊩ˈ✊ৢᇚ݊Ϣ 2 ゴҟ㒡ⱘὖᗉᄺдㅫ⊩Ⳍ↨䕗DŽ䗮䖛↨䕗ৃҹⳟࠄϔϾ᳝䍷ⱘ㒧䆎ˈे
⡍ᅮᴵӊϟˈࠡ䴶ᦤࠄⱘ⾡ㅫ⊩䛑䕧ߎϢ Brute-Force 䋱ᮃㅫ⊩Ⳍৠⱘ؛䆒ˈাϡ䖛
ࠡ䴶ⱘㅫ⊩ϡᯢ⹂䅵ㅫὖ⥛ˈ㗠ϨⳌᔧᑺϞᬜ⥛催DŽ
㗗㰥 2 ゴ佪ⱘࠄᦤܜὖᗉᄺд䯂乬DŽ݊Ёˈ៥Ӏ؛ᅮᄺд఼㗗㰥ⱘᰃᅮНᅲ՟ぎ䯈
XϞⱘ᳝䰤ⱘ؛䆒ぎ䯈HˈӏࡵᰃᄺдᶤϾⳂᷛὖᗉc:Xė{0,1}DŽབ䗮ᐌ䙷ḋˈ؛ᅮ㒭ќᄺд
఼ᶤ䆁㒗ḋ՟ᑣ߫LJLJx1ˈd1ˈLjĂLJxmˈdmLjLjˈ݊ЁxiЎXЁⱘᶤᅲ՟ˈdiЎxiⱘⳂᷛߑ᭄ؐ
˄ेdi=c(xi)˅
DŽЎㅔ࣪䅼䆎ˈ؛ᅮᅲ՟ᑣ߫LJx1ĂxmLjᰃᅮϡবⱘˈℸ䆁㒗᭄Dৃ㹿ㅔ
ऩഄݭⳂᷛߑ᭄ؐᑣ߫˖D=LJd1ĂdmLjDŽৃҹⳟࠄ˄㾕д乬 6.4˅ˈ䖭ϔㅔ࣪ϡӮᬍবᴀ㡖
ⱘЏ㽕㒧䆎DŽ
Ѣ䋱ᮃ⧚䆎ⱘⳈὖᗉᄺдㅫ⊩ᅮНབϟ˖
2ˊ䕧ߎ᳔᳝催ৢ偠ὖ⥛ⱘ؛䆒hMAP
˗
1ˊ䆁㒗᭄Dᰃ᮴ాໄⱘ˄ेdi=c(xi)˅
2ˊⳂᷛὖᗉ c ࣙ؛䆒ぎ䯈 H Ё˗
3ˊ≵᳝ӏԩ⧚⬅䅸Ўᶤ؛䆒↨݊Ҫⱘ؛䆒ⱘৃ㛑ᗻDŽ
᳝њ䖭ѯ؛ᅮˈབԩ⹂ᅮ P(h)ⱘؐ˛⬅Ѣӏϔ؛䆒ϡ↨݊Ҫ؛䆒ৃ㛑ᗻˈᕜᰒ✊ৃᇍ
H Ё↣Ͼ؛䆒 h 䌟ҹⳌৠⱘܜ偠ὖ⥛DŽ䖯ϔℹഄˈ⬅ѢⳂᷛὖᗉ H Ёˈ᠔ҹৃ㽕∖ H Ё
᠔᳝؛䆒ⱘὖ⥛Ў 1DŽᇚ䖭ѯ䰤ࠊড়䍋ᴹৃᕫ˖
1
ᇍ H Ёӏϔ h ˈ P ( h)
H
བԩ䗝ᢽP(D|h)ⱘؐ˛P(D|h)ᰃᏆⶹ؛䆒h៤ゟⱘᴵӊϟ˄ेᏆⶹhЎⳂᷛὖᗉcⱘℷ⹂ᦣ
䗄˅ˈ㾖ᆳࠄⳂᷛؐD=LJd1…dmLjⱘὖ⥛DŽ⬅Ѣ؛ᅮ䆁㒗᭄᮴ాໄˈ䙷М㒭ᅮhᯊˈབᵰ
di=h(xi)߭ߚ㉏diЎ 1ˈབᵰdiĮh(xi)߭diЎ 0DŽℸ˖
P ( D | h) P ( h)
P(h | D)
P( D)
Ϣ D ϡϔ㟈ⱘ؛䆒 h ⱘৢ偠ὖ⥛Ў 0DŽ
݊ЁVSH,DᰃHЁϢDϔ㟈ⱘ؛䆒ᄤ䲚˄ेVSH,DᰃⳌᇍѢDⱘবൟぎ䯈ˈབ 2 ゴⱘᅮН˅DŽ
VS H , D
ᕜᆍᯧৃ偠䆕P(D)= ˈЎ᠔᳝؛䆒ϞP(h|D)ⱘᖙЎ 1ˈᑊϨHЁϢDϔ㟈ⱘ؛
H
䆒᭄䞣Ў|VSH,D|DŽˈৃҢܼὖ⥛݀ᓣ˄㾕㸼 6-1˅ҹঞ᠔᳝؛䆒ᰃѦ᭹ⱘᴵӊ˄े
(i z j )( P(hi h j ) 0) ˅ˈᇐߎP(D)ⱘؐ˖
P(D) ¦ P( D | h ) P (h )
hi H
i i
1 1
¦
hi VS H , D
1 ¦ 0
H hi VS H ,D H
1
¦
hi VS H , D
1
H
VS H , D
H
Ϟ䴶ⱘߚᵤ䇈ᯢˈ៥Ӏ䗝ᅮⱘP(h)P(D|h)পؐϟˈ↣Ͼϔ㟈ⱘ؛䆒ৢ偠ὖ⥛Ў
˄1/|VSH,D|˅
ˈ↣Ͼϡϔ㟈؛䆒ৢ偠ὖ⥛Ў 0DŽℸˈ↣Ͼϔ㟈ⱘ؛䆒䛑ᰃMAP؛䆒DŽ
原书页码: 162
hypotheses: ؛䆒
6-1 ৢ偠ὖ⥛䱣ⴔ䆁㒗᭄䭓ⱘⓨ࣪
Ϟ䴶ⱘߚᵤ䇈ᯢ㒭ᅮᴵӊϟˈϢDϔ㟈ⱘ↣Ͼ؛䆒䛑ᰃMAP؛䆒DŽḍ䖭ϔ㒧䆎ৃⳈ
ᕫࠄϔ㉏᱂䘡ⱘᄺд఼ˈ⿄Ўϔ㟈ᄺд఼DŽᶤᄺдㅫ⊩㹿⿄Ўϔ㟈ᄺд఼ˈ䇈ᯢᅗ䕧ߎⱘ
؛䆒䆁㒗՟Ϟ᳝䳊䫭䇃⥛DŽ⬅ҹϞⱘߚᵤৃᕫˈབᵰ؛ᅮHϞ᳝ഛࣔⱘܜ偠ὖ⥛˄े
P(hi)=P(hj)ˈᇍ᠔᳝ⱘi,j˅
ˈϨ䆁㒗᭄ᰃ⹂ᅮᗻⱘ᮴ాໄⱘ˄ेᔧDhϔ㟈ᯊˈP(D|h)=1˅
ˈ
৺߭Ў 0˅ᯊˈӏᛣϔ㟈ᄺд఼ᇚ䕧ߎϔϾMAP؛䆒DŽ
ᰃ৺䖬᳝݊Ҫৃ㛑ⱘP(h)P(D|h)ߚᏗˈՓFind-S䕧ߎMAP؛䆒˛ಲㄨᰃ㚃ᅮⱘDŽЎ
Find-SҢবൟぎ䯈Ё䕧ߎᵕ⡍⅞ᗻ(maximally specific)؛䆒ˈ᠔ҹᇍѢܜ偠ὖ⥛أ㹦Ѣ⡍
⅞؛䆒ⱘӏԩὖ⥛ߚᏗˈᅗ䕧ߎⱘ؛䆒䛑ᇚᰃMAP؛䆒DŽ㊒⹂ഄ䆆ˈ؛བHᰃHϞӏᛣὖ
⥛ߚᏗP(h)ˈᅗh1↨h2⡍⅞ᯊ䌟ќP(h1)ıP(h2)DŽৃ㾕ˈ؛ᅮ᳝ܜ偠ߚᏗHϢϞ䴶Ⳍ
ৠⱘP(D|h)ߚᏗᯊˈFind-S䕧ߎϔMAP؛䆒DŽ
Փ⫼䋱ᮃⱘ䗨ᕘࠏ⬏ᄺдㅫ⊩ˈϢᧁ⼎ᄺд఼Ёⱘᔦ㒇أ㕂ᗱᛇϞᰃⳌ㉏ԐⱘDŽ⊼
ᛣ 2 ゴᇚᄺдㅫ⊩ⱘᔦ㒇أ㕂ᅮНЎᮁ㿔䲚ড় Bˈ䗮䖛ᅗৃߚܙഄⓨ㒢ᮁߎᄺд఼᠔
ᠻ㸠ⱘᔦ㒇⧚㒧ᵰDŽ՟བˈ䗝⍜䰸ㅫ⊩ⱘᔦ㒇أ㕂Ўˈ؛ᅮⳂᷛὖᗉ c ࣙ؛ᅮぎ䯈
H ЁDŽ䖯ϔℹഄˈ៥Ӏ䖬䆕ᯢᄺдㅫ⊩ⱘ䕧ߎᰃ⬅݊䕧ܹҹঞ䖭ϔ䱤ⱘᔦ㒇أ㕂؛ᅮ᠔ⓨ
㒢ᕫߎⱘDŽϞ䴶ⱘ䋱ᮃ㾷䞞ᇍѢᦣ䗄ᄺдㅫ⊩Ёⱘ䱤؛ᅮᦤկњϔ⾡ᮍ⊩DŽ䖭䞠ˈϡ
ᰃ⫼ϔㄝᬜⱘⓨ㒢㋏㒳এᇍᔦ㒇⧚ᓎˈ㗠ᰃ⫼Ѣ䋱ᮃ⧚䆎ⱘϔϾㄝᬜⱘὖ⥛⧚
˄probabilistic reasoning˅㋏㒳DŽ䖭䞠ᑨ⫼Ѣᄺд఼ⱘ䱤؛ᅮᔶᓣЎ˖ĀH Ϟⱘܜ偠ὖ⥛⬅
P(h)ߚᏗ㒭ߎˈ㗠᭄ᢦ㒱ফ؛䆒ⱘᔎᑺ⬅ P(D|h)㒭ߎDŽ āᴀкⱘ P(h) P(D|h)ᅮНࠏ
⬏њ䗝⍜䰸 Find-S ㋏㒳Ёⱘ䱤؛ᅮDŽᏆⶹ䖭ѯ؛ᅮⱘὖ⥛ߚᏗৢˈϔϾѢ䋱
ᮃ⧚䆎ⱘὖ⥛⧚㋏㒳ᇚѻ⫳ㄝᬜѢ䖭ѯㅫ⊩ⱘ䕧ܹ-䕧ߎ㸠ЎDŽ
ᴀ㡖Ёⱘ䅼䆎ᰃ䋱ᮃ⧚ⱘϔ⾡⡍⅞ᔶᓣˈЎ៥Ӏা㗗㰥њ P(D|h)পؐা㛑Ў 0
1 ⱘᚙˈމᅗডњ؛䆒乘⌟ⱘ⹂ᅮᗻҹঞ᮴ాໄ᭄ⱘࠡᦤDŽབৢϔ㡖᠔⼎ˈ䖬ৃҹ䗮
䖛ܕ䆌 P(D|h)পؐЎ 0 1 Пⱘؐˈҹঞ P(D|h)Ёࣙ䰘ࡴⱘᦣ䗄ҹ㸼⼎ాໄ᭄ⱘߚ
ᏗᚙˈމᴹᢳҢ᳝ాໄ䆁㒗᭄Ёᄺдⱘ㸠ЎDŽ
6.4 ᶷཝղ❬ૂᴶቅ䈥ᐤᒩᯯٽ䇴
ᴀ㡖㗗㰥ᄺд䖲㓁ؐⳂᷛߑ᭄ⱘ䯂乬ˈ䖭ᰃ䆌ᄺдㅫ⊩Ё䛑Ӯ䘛ࠄⱘˈབ⼲㒣㔥㒰
ᄺдǃ㒓ᗻಲᔦǃҹঞ乍ᓣ᳆㒓ᢳড়DŽ䗮䖛ㅔऩⱘ䋱ᮃߚᵤˈৃҹ㸼ᯢ⡍ᅮࠡᦤϟˈ
ӏϔᄺдㅫ⊩བᵰՓ䕧ߎⱘ؛䆒乘⌟䆁㒗᭄П䯈ⱘ䇃Ꮒᑇᮍ᳔ᇣ࣪ˈᅗᇚ䕧ߎϔᵕԐ
✊؛䆒DŽ䖭ϔ㒧䆎ⱘᛣНѢˈᇍѢ䆌⼲㒣㔥㒰᳆㒓ᢳড়ⱘᮍ⊩ˈབᵰᅗӀ䆩䆁㒗
᭄ϞՓ䇃Ꮒᑇᮍ᳔ᇣ࣪ˈℸ㒧䆎ᦤկњϔ⾡䋱ᮃⱘ䆎䆕ᮍ⊩˄⡍ᅮࠡᦤϟ˅DŽ
䆒ᛇ䯂乬ᅮНབϟˈᄺд఼LᎹᅲ՟ぎ䯈X؛䆒ぎ䯈HϞˈHЁⱘ؛䆒ЎXϞᅮН
ⱘᶤ⾡ᅲ᭄ؐߑ᭄˄ेˈHЁ↣ϾhЎϔߑ᭄˖h: Xėˈ݊Ёҷ㸼ᅲ᭄䲚˅DŽL䴶Јⱘ䯂乬
ᰃᄺдϔϾҢHЁᢑপߎⱘⶹⳂᷛߑ᭄f˖XėDŽ㒭ᅮmϾ䆁㒗ḋ՟ⱘ䲚ড়ˈ↣Ͼḋ՟ⱘ
Ⳃᷛؐ㹿ᶤ䱣ᴎాໄᑆᡄˈℸ䱣ᴎాໄ᳡ҢℷᗕߚᏗDŽ㊒⹂ഄ䆆ˈ↣Ͼ䆁㒗ḋ՟ᰃᑣيLJxi,
diLjˈ݊Ёdi=f(xi)+eiDŽ䖭䞠f(xi)ᰃⳂᷛߑ᭄ⱘ᮴ాໄؐˈeiᰃϔҷ㸼ాໄⱘ䱣ᴎব䞣DŽ؛ᅮeiⱘ
ؐᰃ⣀ゟᢑপⱘˈᑊϨᅗӀⱘߚᏗ᳡Ң䳊ഛؐⱘℷᗕߚᏗDŽᄺд఼ⱘӏࡵᰃ᠔᳝؛䆒᳝Ⳍ
ㄝⱘܜ偠ὖ⥛ࠡᦤϟˈ䕧ߎᵕৃ㛑؛䆒˄ेMAP؛䆒˅ˈ DŽ
㱑✊៥Ӏⱘߚᵤᑨ⫼Ѣӏᛣᅲ᭄ؐߑ᭄ᄺдˈ✊㗠ৃҹ⫼ϔϾㅔऩⱘ՟ᄤᴹᦣ䗄䖭ϔ䯂
乬ˈेᄺд㒓ᗻߑ᭄DŽ 6-2 ᠔⼎Ўϔ㒓ᗻⳂᷛߑ᭄f˄ҹᅲ㒓㸼⼎˅ˈҹঞ䆹Ⳃᷛߑ᭄ⱘ᳝
ాໄ䆁㒗ḋ՟䲚DŽ㰮㒓ᇍᑨ᳔᳝ᇣᑇᮍ䆁㒗䇃Ꮒⱘ؛䆒hMLˈгेᵕԐ✊؛䆒DŽ⊼ᛣˈ݊
ЁᵕԐ✊؛䆒ϡϔᅮㄝѢℷ⹂؛䆒fˈЎᅗᰃҢ᳝䰤ⱘᏺాໄ᭄Ё䆎ᕫߎⱘDŽ
原书页码: 164
6-2 ᄺдϔᅲؐߑ᭄DŽ
Ⳃᷛߑ᭄fᇍᑨᅲ㒓DŽ؛ᅮ䆁㒗ḋ՟LJxi, diLjЎⳳᅲⳂᷛؐࡴϞϔ䳊ഛؐⱘℷᗕߚᏗాໄeiDŽ㰮
㒓ҷ㸼Փ䇃ᏂᑇᮍП᳔ᇣⱘ㒓ᗻߑ᭄DŽℸˈᅗህᰃ䖭 5 Ͼ䆁㒗ḋ՟ϟⱘᵕԐ✊؛䆒hMLDŽ
䖭䞠ⱘ䇃Ꮒᑇᮍ᳔ᇣⱘ؛䆒ेЎᵕԐ✊؛䆒ˈЎ䇈ᯢ䖭ϔ⚍ˈ佪ܜᖿ䗳ഄಲ乒ϔϟ
㒳䅵⧚䆎ЁⱘϸϾᴀὖᗉ˖ὖ⥛ᆚᑺℷᗕߚᏗDŽ佪ˈܜЎ䅼䆎ڣe䖭ḋⱘ䖲㓁ব䞣Ϟⱘ
ὖ⥛ˈ៥Ӏᓩܹὖ⥛ᆚᑺ˄probability density˅DŽㅔऩⱘ㾷䞞ᰃˈ៥Ӏ䳔㽕䱣ᴎব䞣᠔᳝ৃ㛑
ؐⱘὖ⥛Ў 1DŽ⬅Ѣব䞣ᰃ䖲㓁ⱘˈℸϡ㛑Ў䱣ᴎব䞣ⱘ᮴䰤⾡ৃ㛑ⱘؐ䌟ќϔϾ᳝䰤
ὖ⥛DŽ䖭䞠䳔㽕⫼ὖ⥛ᆚᑺᴹҷ᳓ˈҹՓe䖭ḋⱘ䖲㓁ব䞣᠔᳝ؐϞⱘὖ⥛ᆚᑺⱘ⿃ߚЎ
1DŽϔ㠀ഄˈ⫼ᇣݭᄫ↡pᴹҷ㸼ὖ⥛ᆚᑺߑ᭄ˈҹऎߚ᳝䰤ὖ⥛P˄ᅗ᳝ᯊজ⿄Ўὖ⥛䋼䞣
˄probability mass˅˅DŽὖ⥛ᆚᑺp(x0)ᰃᔧ¦䍟䖥Ѣ 0 ᯊˈxপؐ[x0, x0+¦)ऎ䯈ⱘݙὖ⥛Ϣ
1/¦Ь⿃ⱘᵕ䰤DŽ
ὖ⥛ᆚᑺߑ᭄˖
1
p ( x 0 ) { lim P( x0 d x x 0 H )
H o0 H
݊ˈ䖭䞠ᮁᅮ䱣ᴎాໄব䞣 e ⬅ℷᗕߚᏗ⫳៤DŽℷᗕߚᏗᰃϔᑇ⒥ⱘ䩳ᔶߚᏗˈᅗৃ
⬅݊ഛؐᷛޚᏂ³ᅠܼࠏ⬏DŽ㾕㸼 5-4 Ёⱘ㊒⹂ᅮНDŽ
᳝њҹϞⱘϸϾὖᗉˈݡᴹ䅼䆎៥Ӏⱘ䯂乬䞠ЎҔМ᳔ᇣ䇃Ꮒᑇᮍ؛䆒ᅲ䰙Ϟህᰃᵕ
Ԑ✊؛䆒DŽ䆕ᯢⱘ䖛ܜՓ⫼ࠡ䴶ⱘᓣ 6-3 ⱘᅮНᴹᇐᵕৃ㛑؛䆒ˈԚՓ⫼ᇣ ⱘݭp
ҷ㸼ὖ⥛ᆚᑺ˖
བࠡ᠔䗄ˈ؛ᅮ᳝ϔᅮⱘ䆁㒗ᅲ՟䲚ড়LJx1…xmLjˈℸা㗗㰥ⳌᑨⱘⳂᷛؐᑣ߫D=
LJd1…dmLjDŽ䖭䞠di=f(xi)+eiDŽ؛ᅮ䆁㒗ḋ՟ᰃⳌѦ⣀ゟⱘˈ㒭ᅮhᯊˈৃᇚP(D|h)ݭ៤p(di|h)
ⱘ⿃˖
m
hML arg max p (d i | h)
hH i 1
བᵰ䇃Ꮒei᳡Ң䳊ഛؐⶹᮍᏂ³2ⱘℷᗕߚᏗˈ↣Ͼdiгᖙ乏᳡ҢℷᗕߚᏗˈ݊ᮍᏂ
Ў³2ˈ㗠ϨҹⳳᅲⱘⳂᷛؐf(xi)ЎЁᖗ˄㗠ϡᰃ 0˅DŽℸˈp(di)ⱘৃ㹿ݭЎᮍᏂ³2ˈഛؐ
=f(xi)ⱘℷᗕߚᏗDŽ⦄Փ⫼㸼 5-4 ЁⱘℷᗕߚᏗ݀ᓣᑊᇚⳌᑨⱘ³2ҷܹˈᦣߎݭ䗄p(di|h)
ⱘℷᗕߚᏗDŽ⬅Ѣὖ⥛diⱘ㸼䖒ᓣᰃhЎⳂᷛߑ᭄fⱘℷ⹂ᦣ䗄ᴵӊϟⱘˈ᠔ҹ䖬㽕᳓ᤶ
=f(xi)=h(xi)DŽᕫࠄDŽ
m 1
1 ( di P )2
hML arg max e 2V 2
hH i 1 2SV 2
m 1
1 ( d i h ( xi )) 2
arg max e 2V 2
hH i 1 2SV 2
⦄Փ⫼ϔϾᵕԐ✊䅵ㅫЁᐌ⫼ⱘ䕀ᤶ˖ϡᰃ⫼Ϟ䴶䖭Ͼᴖⱘ㸼䖒ᓣপ᳔ؐˈ㗠
ᰃՓ⫼݊ᇍ᭄প᳔ˈ䖭ḋ䕗ᆍᯧDŽॳᰃ lnp ᰃ p ⱘऩ䇗ߑ᭄DŽℸՓ lnp ᳔гህՓ p
᳔˖
m
1 1
hML arg max ¦ ln (d i h( xi )) 2
hH i 1 2SV 2 2V 2
ℸ㸼䖒ᓣЁϔ乍Ўϔ⣀ゟѢ h ⱘᐌ᭄ˈৃ㹿ᗑ⬹ˈℸᕫࠄ˖
m
1
hML arg max ¦ (d i h( xi )) 2
hH i 1 2V 2
ՓϔϾ䋳ⱘ䞣᳔ㄝᬜѢՓⳌᑨⱘℷⱘ䞣᳔ᇣ˖
m
1
hML arg min ¦ (d i h( xi )) 2
hH i 1 2V 2
᳔ৢˈৃҹݡϔᗑ⬹ᥝϢ h ᮴݇ⱘᐌ᭄˖
m
hML arg min ¦ (d i h( xi )) 2 (6.6)
hH i 1
⊼ᛣϞ䴶ⱘᇐࣙњ䗝ᢽ؛䆒ՓԐ✊ⱘᇍ᭄ؐ˄lnp(D|h)˅Ў᳔ˈҹ⹂ᅮ᳔ৃ㛑ⱘ
؛䆒DŽབࠡ᠔䗄ˈ䖭ᇐ㟈њϢՓ p(D|h)䖭ϾԐ✊ᗻ᳔࣪Ⳍৠⱘ㒧ᵰDŽ䖭ϔ⫼ᇍ᭄Ԑ✊ᗻᴹ
䅵ㅫⱘᮍ⊩䆌䋱ᮃߚᵤЁ䛑⫼ࠄњˈЎᅗ↨Ⳉ䅵ㅫԐ✊ᗻ䳔㽕ⱘ᭄ᄺ䖤ㅫ䞣ᇣᕜ
DŽᔧ✊ˈབࠡ᠔䗄ˈᵕԐ✊؛䆒г䆌ϡᰃ MAP ؛䆒ˈԚབᵰ᠔᳝؛䆒᳝Ⳍㄝⱘܜ偠ὖ
⥛ˈϸ㗙ⳌৠDŽ
ЎҔМ⫼ℷᗕߚᏗᴹᦣ䗄ాໄᰃড়⧚ⱘ˛ϔϾᖙ乏ᡓ䅸ⱘॳᰃЎњ᭄ᄺ䅵ㅫⱘㅔ⋕
ᗻDŽϔॳᰃˈ䖭ϔᑇ⒥ⱘ䩳ᔶߚᏗᇍ䆌⠽⧚㋏㒳ⱘాໄ䛑ᰃ㡃དⱘ䖥ԐDŽᅲ䰙Ϟˈ
5 ゴ䅼䆎ⱘЁᖗᵕ䰤ᅮᕟᰒ⼎ˈ䎇ⱘ⣀ゟৠߚᏗ䱣ᴎব䞣ⱘ᳡ҢϔℷᗕߚᏗˈ㗠ϡ䆎
⣀ゟব䞣ᴀ䑿ⱘߚᏗᰃҔМDŽ䖭䇈ᯢ⬅䆌⣀ゟৠߚᏗⱘ㋴ⱘ᠔⫳៤ⱘాໄᇚ៤Ўℷᗕ
ߚᏗDŽᔧ✊ˈ⦄ᅲЁϡৠⱘߚ䞣ᇍాໄⱘ䋵⤂г䆌ϡᰃৠߚᏗⱘˈ䖭ḋ䆹ᅮ⧚ᇚϡ㛑䆕ᯢ
៥Ӏⱘ䗝ᢽDŽ
Փ䇃Ꮒᑇᮍ᳔ᇣ࣪ⱘᮍ⊩㒣ᐌ㹿⫼Ѣ⼲㒣㔥㒰ǃ᳆㒓ᢳড়ঞ݊Ҫᅲߑ᭄䘐䖥ⱘ䆌ㅫ⊩
ЁDŽ 4 ゴ䅼䆎њẃᑺϟ䰡ᮍ⊩ˈᅗ⼲㒣㔥㒰Ё᧰㋶᳔ᇣ䇃Ꮒᑇᮍⱘ؛䆒DŽ
㒧ᴳ䖭䞠݇ѢᵕԐ✊؛䆒᳔ᇣᑇᮍ䇃Ꮒ؛䆒ⱘ݇㋏ⱘ䅼䆎Пࠡˈᖙ乏䅸䆚ࠄ䆹䯂
乬ḚᶊЁⱘᶤѯ䰤ࠊDŽϞ䴶ⱘߚᵤা㗗㰥њ䆁㒗ḋ՟ⱘⳂᷛؐЁⱘాໄˈ㗠≵᳝㗗㰥ᅲ՟ሲ
ᗻЁⱘాໄDŽ՟བˈབᵰᄺд䯂乬ᰃѢᶤҎⱘᑈ啘催ᑺˈ乘⌟Ҫⱘ䞡䞣ˈ䙷МϞ䴶ⱘߚ
ᵤ㽕∖ˈ䞡䞣ⱘ⌟䞣Ёৃҹ᳝ాໄˈ㗠ᑈ啘催ᑺⱘ⌟䞣ᖙ乏ᰃ㊒⹂ⱘDŽབᵰᇚ䖭ѯㅔ࣪؛
ᅮএᥝˈߚᵤ䖛ᇚकߚᴖDŽ
6.5 ⭞ӄ人⎁Ᾰ⦽Ⲻᶷཝղ❬ٽ䇴
ࠡϔゴⱘ䯂乬ḚᶊЁˈ៥Ӏ⹂ᅮњᵕԐ✊؛䆒ᰃՓ݊䆁㒗ḋ՟Ϟⱘ䇃Ꮒᑇᮍ᳔
ᇣⱘ؛䆒DŽᴀ㡖ᇚᇐϔϾ㉏Ԑⱘˈ߭ޚᅗ䩜ᇍ⼲㒣㔥㒰ᄺд䖭ḋⱘ䯂乬˖ेᄺд乘⌟ὖ⥛DŽ
㗗㰥䯂乬ⱘḚᶊЎᄺдϔϾϡ⹂ᅮᗻ˄ὖ⥛ⱘ˅ߑ᭄ f˖Xė{0, 1}ˈᅗ᳝ϸϾ⾏ᬷⱘؐ
䕧ߎDŽ՟བˈᅲ՟ぎ䯈 X ҷ㸼᳝ᶤѯ⮛⢊ⱘ⮙ҎˈⳂᷛߑ᭄ f(x)⮙Ҏ㛑ᄬ⌏ϟᴹᯊЎ 1ˈ
৺߭Ў 0DŽ㗙䇈ˈX ҷ㸼׳䋻⬇䇋㗙ˈ㸼⼎Ў݊䖛এⱘֵ⫼ग़ˈབᵰҪ㛑៤ࡳഄᔦ䖬ϟ
ϔ׳䌋ˈf(x)Ў 1ˈ৺߭Ў 0DŽ䖭ϸ⾡ᚙމϟ䛑㽕 f ᳝ϡ⹂ᅮᗻDŽ՟བˈϔ㕸᳝Ⳍৠ⮛⢊ⱘ
⮙ҎЎ 92%ৃҹᄬ⌏ˈ8%ϡ㛑DŽ䖭⾡ϡৃ乘⌟ᗻᴹ⑤Ѣ㛑㾖ᆳࠄⱘ⮛⢊⡍ᕕˈ㗙ᰃ⮒
⮙䕀࣪Ё⹂ᅲᄬⱘϡ⹂ᅮᗻᴎࠊDŽ᮴䆎䯂乬ⱘᴹ⑤ᰃҔМˈ㒧ᵰ䛑ᰃ㽕∖Ⳃᷛߑ᭄ⱘ䕧ߎ
Ў䕧ܹⱘὖ⥛ߑ᭄DŽ
᳝њ䖭ḋⱘ䯂乬ᦣ䗄ˈ៥ӀᏠᳯᄺдᕫࠄⱘ⼲㒣㔥㒰˄݊Ҫᅲߑ᭄䘐䖥఼˅ⱘ䕧ߎᰃ
f(x)=1 ⱘὖ⥛DŽᤶ㿔Пˈ䳔㽕ᡒࠄⳂᷛߑ᭄ f´=Xė[0, 1]ˈՓ f´=P(f(x)=1˅
DŽϞ䴶ⱘ⮙Ҏᄬ
⌏乘⌟ⱘ՟ᄤЁˈབᵰ x Ўᄬ⌏⥛ᰃ 92%ⱘ⮙ҎПϔˈ䙷М f´(x)=0.92ˈὖ⥛ߑ᭄ f(x)ᇚ᳝
92%ⱘᴎӮㄝѢ 1ˈ࠽ԭⱘ 8%ⱘᴎӮㄝѢ 0DŽ
ℸᚙމϟЎᇏᡒᵕԐ✊؛䆒ˈᑨՓ⫼ᗢḋⱘӬ࣪˛߭ޚЎಲㄨ䆹䯂乬佪ܜ䳔㽕㦋ᕫ
P(D|h)ⱘ㸼⼎DŽ䖭䞠؛ᅮ䆁㒗᭄DⱘᔶᓣЎD={LJx1ˈd1LjĂLJxmˈdmLj}ˈ݊ЁdiЎ㾖ᆳࠄ
ⱘf(xi)ⱘ 0 1 ؐDŽ
ಲᖚࠡϔ㡖ЁⱘᵕԐ✊ঞ᳔ᇣ䇃Ꮒᑇᮍߚᵤˈ݊Ёㅔऩഄ؛ᅮᅲ՟LJx1ˈĂxmLjᰃ
ᅮⱘDŽ䖭ḋህৃҹা⫼Ⳃᷛؐdiᴹࠏ⬏᭄DŽ㱑✊䖭䞠гৃҹ䖭ḋⱘㅔऩ؛ᅮˈԚ៥Ӏ䖭
䞠ৃҹ䙓ܡ䖭ϔ؛ᅮҹ䇈ᯢ䖭ᇍ᳔ৢⱘ䕧ߎ≵᳝ᕅડDŽᇚxidi䛑ⳟ䱣ᴎব䞣ˈᑊ؛ᅮ↣
Ͼ䆁㒗ḋ՟䛑ᰃ⣀ゟᢑপⱘˈৃᡞP(D|h)ݭ˖
m
P ( D | h) P( x , d
i 1
i i | h) ˄6.7˅
䖯ϔℹഄˈৃҹ؛ᅮ䘛ࠄ↣ϔ⡍ᅮᅲ՟xiⱘὖ⥛⣀ゟѢ؛䆒hDŽ՟བˈ䆁㒗᭄䲚Ёࣙ
ϔ⡍ᅮ⮙Ҏxiⱘὖ⥛⣀ゟѢ݇Ѣᄬ⌏⥛ⱘ؛䆒˄㱑✊⮙Ҏⱘᄬ⌏Ϣ৺di⹂ᅲᔎ⚜ձ䌪Ѣh˅
DŽ
ᔧx⣀ゟѢhᯊˈৃᇚϞᓣ䞡˄ݭᑨ⫼㸼 6-1 ⱘЬ⊩㾘߭˅Ў˖
m m
P ( D | h) P ( x i , d i | h)
i 1
P(d
i 1
i | h, xi ) P( xi ) ˄6.8˅
P (d i | h, xi ) h( xi ) d i (1 h( xi ))1 di ˄6.10˅
1 d i
ᆍᯧ偠䆕ˈㄝᓣ 6.9 6.10 ᰃㄝӋⱘDŽ⊼ᛣᔧdi=1 ᯊˈᓣ 6-10 ЁѠ乍 (1 h( xi ))
ㄝѢ 1DŽℸP(di=1|h, xi˅=h(xi)ˈᅗϢᓣ 6.9 ㄝӋDŽৠḋৃߚᵤdi=0 ᯊⱘᚙᔶDŽ
m
P ( D | h) h( x )
i 1
i
di
(1 h( xi ))1 d i P ( xi ) ˄6.11˅
⦄ߎݭᵕԐ✊؛䆒ⱘ㸼䖒ᓣ˖
m
hML arg max h( xi ) d i (1 h( xi ))1 d i P ( xi )
hH i 1
᳔ৢϔ乍Ў⣀ゟѢ h ⱘᐌ䞣ˈৃএᥝ˖
m
hML arg max h( xi ) di (1 h( xi ))1 di (6.12)
hH i 1
Ϣࠡ䴶ⱘᚙⳌމৠˈབᵰ⫼Ԑ✊ᗻⱘᇍ᭄䅵ㅫӮ↨䕗ᆍᯧˈᕫࠄ˖
m
hML arg max ¦ d i ln h( xi ) (1 d i ) ln(1 h( xi )) ˄6.13˅
hH i 1
ᓣ 6.13 ᦣ䗄њ៥Ӏⱘ䯂乬Ёᖙ乏㹿᳔࣪ⱘ䞣DŽℸ㒧ᵰৃϢࠡ䴶ⱘՓ䇃Ꮒᑇᮍ᳔ᇣ
࣪ⱘߚᵤⳌ㉏↨DŽ⊼ᛣᓣ 6.13 Ϣ➉ߑ᭄ⱘϔ㠀ᓣ-ipilogpi˄ 3 ゴ䅼䆎䖛˅ⱘⳌԐᗻDŽ
ℷЎℸⳌԐᗻˈҹϞ䞣ⱘ䋳᳝ؐᯊ㹿⿄ЎѸঝ➉˄cross entropy˅DŽ
6.5.1 ൞⾔㔅㖇㔒ѣụᓜᩒ㍘ԛ䗴ࡦղ❬ᙝᴶཝौ
wG (h, D) m
wG (h, D) wh( xi )
ww jk
¦
i 1 wh( xi ) ww jk
m
w (d i ln h( xi ) (1 d i ) ln(1 h( xi ))) wh( xi )
¦
i 1 wh( xi ) ww jk
m
d i h( x i ) wh( xi )
¦ h( x )(1 h( x ))
i 1 ww jk
˄6.14˅
i i
wh( xi )
V c( xi ) xijk h( xi )(1 h( xi )) xijk
wZ jk
wG (h, D) m
ww jk
¦ (d
i 1
i h( xi )) xijk
Ў䳔㽕Փ⫼ P(D|h)᳔࣪㗠ϡᰃ᳔ᇣ࣪ˈ᠔ҹ៥Ӏᠻ㸠ẃᑺϞछ᧰㋶㗠ϡᰃẃᑺϟ䰡
᧰㋶DŽ᧰㋶ⱘ↣ϔ䗁ҷЁˈᴗؐ䞣ᣝẃᑺⱘᮍ䇗ᭈˈՓ⫼ᴗؐᮄ㾘߭˖
w jk m w jk 'w jk
݊Ё˖
m
'w jk K ¦ (d i h( xi )) xijk ˄6.15˅
i 1
݊Ё¨ᰃϔᇣⱘℷᐌ䞣ˈ㸼⼎ẃᑺϞछ᧰㋶ⱘℹ䖯ᇣDŽ
ᇚ䖭ϔᴗؐᮄ㾘߭ϢডӴ᪁ㅫ⊩˄݊⫼䗨ᰃՓ乘⌟㾖ᆳⱘ㔥㒰䕧ߎⱘ䇃Ꮒᑇᮍ
᳔ᇣ࣪˅Ё⫼ࠄⱘᴗؐᮄ㾘߭Ⳍ↨䕗ˈৃҹᕫࠄ᳝䍷ⱘ㒧䆎DŽ⫼Ѣ䕧ߎऩܗᴗؐⱘডӴ
᪁ᮄ㾘߭˄㾕 4 ゴ˅
ˈՓ⫼䖭䞠ⱘ䆄োৃ䞡ᮄ㸼⼎Ў˖
w jk m w jk 'w jk
݊Ё
m
'w jk K ¦ h( xi )(1 h( xi ))(d i h( xi )) xijk
i 1
ὖᣀϔϟˈ䖭ϸϾᴗؐᮄ㾘߭ϸ⾡ϡৠⱘ䯂乬㚠᱃ϟᬊᬯࠄᵕԐ✊؛䆒DŽՓ䇃Ꮒ
ᑇᮍ᳔ᇣ࣪ⱘ㾘߭ᇏᡒࠄᵕԐ✊؛䆒Ѣⱘࠡᦤᰃˈ䆁㒗᭄ৃҹ⬅Ⳃᷛߑ᭄ؐࡴϞℷᗕ
ߚᏗాໄᴹᢳDŽՓѸঝ➉᳔ᇣ࣪ⱘ㾘߭ᇏᡒᵕԐ✊؛䆒Ѣⱘࠡᦤᰃˈ㾖ᆳࠄⱘᏗᇨؐ
Ў䕧ܹᅲ՟ⱘὖ⥛ߑ᭄DŽ
6.6 ᴶቅᨅ䘦䮵ᓜࡏ
ಲᖚϔϟ 3 ゴ݇ѢĀ༹ഢൊࠗߔāⱘ䅼䆎ˈ䖭ᰃϔϾᕜᐌ⫼ⱘᔦ㒇أ㕂ˈᅗৃ㹿ὖᣀ
Ў˖ĀЎ㾖ᆳࠄⱘ᭄䗝ᢽ᳔ⷁⱘ㾷䞞āDŽᴀゴ៥Ӏ㽕䅼䆎ᇍ༹ഢൊࠗߔⱘ䭓ᳳѝ䆎Ёⱘ
Ͼ䆎⚍DŽ䖭䞠ᇍℸ㒭ߎϔϾ䋱ᮃⱘߚᵤˈᑊ䅼䆎ϔ㋻ᆚⳌ݇ⱘ⿄ˈ߭ޚЎ᳔ᇣᦣ䗄䭓ᑺޚ
߭˄Minimum Description Length, MDL˅DŽ
ᦤߎ᳔ᇣᦣ䗄䭓ᑺⱘⳂⱘᰃЎњḍֵᙃ䆎Ёⱘᴀὖᗉᴹ㾷䞞hMAPⱘᅮНDŽݡ㗗㰥
Ꮖᕜ❳ᙝⱘhMAPᅮН˖
ৃ㹿ㄝӋഄ㸼⼎ЎՓҹ 2 Ўᑩⱘᇍ᳔᭄࣪˖
Փℸ᳔ⱘ䋳᳔ؐᇣ࣪˖
ϟ䴶ᇚՓ⫼ҹϞ㓪ⷕ⧚䆎ⱘ㒧䆎ᴹ㾷䞞ㄝᓣ 6.16˖
x -log2P(h)ᰃ؛䆒ぎ䯈Hⱘ᳔Ӭ㓪ⷕϟhⱘᦣ䗄䭓ᑺDŽᤶ㿔Пˈ䖭ᰃ؛䆒hՓ⫼݊
᳔Ӭ㸼⼎ᯊⱘᇣDŽҹ䖭䞠ⱘ䆄োˈLCH(h)= -log2P(h)ˈ݊ЁCHЎ؛䆒ぎ䯈Hⱘ
᳔Ӭ㓪ⷕDŽ
x -log2P(D|h)ᰃ㒭ᅮ؛䆒hᯊ䆁㒗᭄Dⱘᦣ䗄䭓ᑺ˄ℸ᳔Ӭ㓪ⷕϟ˅DŽҹ䖭䞠
ⱘ䆄ো㸼⼎ˈLCD|h(D|h)= -log2P(D|h)ˈ݊Ё˟D|hᰃ؛ᅮথ䗕㗙䗕㗙䛑ⶹ䘧؛
䆒hᯊᦣ䗄᭄Dⱘ᳔Ӭ㓪ⷕDŽ
x ℸৃᡞᓣ 6.16 䞡ˈݭҹᰒ⼎ߎhMAPᰃՓ؛䆒ᦣ䗄䭓ᑺ㒭ᅮ؛䆒ϟ᭄ᦣ䗄
䭓ᑺП᳔ᇣ࣪ⱘ؛䆒hDŽ
hMAP arg min LCH (h) LCD|h ( D | h)
h
݊ЁCHCD|hߚ߿ЎHⱘ᳔Ӭ㓪ⷕ㒭ᅮhᯊDⱘ᳔Ӭ㓪ⷕˈ᳔ᇣᦣ䗄䭓ᑺ
˄Minimum Description Length, MDL˅߭ޚᓎ䆂ˈᑨ䗝ᢽՓ䖭ϸϾᦣ䗄䭓ᑺⱘ
᳔ᇣ࣪ⱘ؛䆒DŽᔧ✊Ўᑨ⫼ℸˈ߭ޚᅲ䏉Ёᖙ乏䗝ᢽ䗖ড়Ѣᄺдӏࡵⱘ⡍ᅮ
㓪ⷕ㸼⼎DŽ؛ᅮՓ⫼ҷⷕC1C2ᴹ㸼⼎؛䆒㒭ᅮ؛䆒ϟⱘ᭄ˈৃᇚMDL
߭ޚ䰜䗄Ў˖
᳔ᇣᦣ䗄䭓ᑺ˖߭ޚ䗝ᢽhMDLՓ
Ϟ䴶ⱘߚᵤᰒ⼎ˈབᵰ䗝ᢽC1Ў؛䆒ⱘ᳔Ӭ㓪ⷕCHˈᑊϨ䗝ᢽC2Ў᳔Ӭ㓪ⷕCD|hˈ䙷М
hMDL=hMAPDŽ
В՟䇈ᯢˈ؛ᅮᇚMDL߭ޚᑨ⫼ࠄއㄪᷥᄺдⱘ䯂乬ᔧЁDŽᗢḋ䗝ᢽ؛䆒᭄ⱘ㸼
⼎C1C2˛ᇍѢC1ˈৃҹᕜ㞾✊ഄ䗝ᢽᶤ⾡ᯢ⹂ⱘއㄪᷥ㓪ⷕᮍ⊩ˈ݊Ёᦣ䗄䭓ᑺ䱣ⴔᷥЁ
㡖⚍䖍ⱘ䭓㗠ࡴDŽབԩ䗝ᢽ㒭ᅮϔއㄪᷥᯊ؛䆒ⱘ᭄㓪ⷕC2ਸ਼˛ЎՓ䅼䆎ㅔऩ࣪ˈ
؛ᅮᅲ՟ᑣ߫LJx1…xmLjᰃᬊ㗙থ䗕㗙䛑ⶹ䘧ⱘˈ䙷МৃҹাӴ䕧ߚ㉏㒧ᵰLJf(x1)…f(xm)LjDŽ
˄⊼ᛣӴ䗕ᅲ՟ⱘᓔ䫔⣀ゟѢℷ⹂ⱘ؛䆒ˈℸᅗϡӮᕅડࠄhMDLⱘ䗝ᢽDŽ˅⦄ˈབᵰ䆁
㒗ߚ㉏LJf(x1)…f(xm)LjϢ؛䆒ⱘ乘䅵Ⳍㄝˈ䙷Мህ≵ᖙ㽕Ӵ䕧᳝݇䖭ѯḋ՟ⱘӏԩֵᙃ˄
ᬊ㗙ৃ݊ᬊࠄ؛䆒ৢ䅵ㅫ䖭ѯؐ˅DŽℸℸᚙމϟˈ㒭ᅮ؛䆒ⱘߚ㉏ᚙމᯊⱘᦣ䗄䭓ᑺ
Ў 0DŽབᵰᶤѯḋ՟㹿h䇃ߚ㉏ˈ䙷Мᇍ↣ϔ䇃ߚ㉏䳔㽕Ӵ䗕ϔϾ⍜ᙃҹ⹂ᅮાϾḋ՟㹿䇃
ߚ㉏њ˄ৃ⫼㟇log2mԡӴ䗕˅ˈᑊӴ䗕݊ℷ⹂ߚ㉏ؐ˄ৃ⫼㟇log2kԡˈ݊ЁkЎৃ㛑ߚ
㉏ؐⱘ᭄Ⳃ˅ DŽ㓪ⷕC1C2ϟhMDL䖭ϔ؛䆒ህᰃՓ䖭ѯᦣ䗄䭓ᑺ᳔ᇣⱘ؛䆒DŽ
ℸˈMDL ᦤ߭ޚկњϔ⾡ᮍ⊩ҹ؛䆒ⱘᴖᗻ؛䆒ѻ⫳䫭䇃ⱘ᭄䞣П䯈䖯㸠ᡬ
Ёˈᅗ᳝ৃ㛑䗝ᢽϔϾѻ⫳ᇥ䞣䫭䇃䕗ⷁⱘ؛䆒˗㗠ϡᰃ㛑ᅠ㕢ഄߚ㉏䆁㒗᭄ⱘ䭓ⱘ؛䆒DŽ
ⳟࠄ䖭ϔ⚍ˈህ᳝њϔ⾡໘⧚᭄䖛ᑺᢳড়ⱘᮍ⊩DŽ
Ң᳔ᇣᦣ䗄䭓ᑺⱘॳ߭ⱘߚᵤЁৃᕫࠄҔМ㒧䆎˛ᰃ৺䇈ᯢ᠔᳝ᚙމϟⷁ؛䆒䛑᳔
ད˛㒧䆎ᰃ৺ᅮⱘDŽᏆ㒣䆕ᯢⱘাᰃˈᔧ䗝ᅮ؛䆒㸼⼎ҹՓ؛䆒hⱘᇣЎ-log2P(h)ˈᑊϨ
䗝ᢽ՟ᚙⱘމ㸼⼎ҹՓ㒭ᅮhϟDⱘ㓪ⷕ䭓ᑺㄝѢ-log2P(D|h)ᯊˈMDL߭ޚѻ⫳MAP؛䆒DŽ
✊㗠Ў䇈ᯢҹϞϸ㗙ৃҹབℸ㸼⼎ˈᖙ乏ⶹ䘧᠔᳝ⱘܜ偠ὖ⥛P(h)ˈҹঞP(D|h)DŽ≵᳝⧚⬅
ⳌֵMDL؛䆒ᇍѢӏᛣ㓪ⷕC1C2䛑ᰃ᳔དⱘDŽߎѢᅲ䰙ⱘ㗗㰥ˈᆍᯧⱘࡲ⊩ᰃ⬅䆒䅵
㗙ᣛᅮϔϾ㸼⼎ˈҹᤩ㦋᳝݇؛䆒ὖ⥛ⱘⶹ䆚ˈ㗠ϡᰃᅠᭈഄᣛᅮ↣Ͼ؛䆒ⱘὖ⥛DŽᄺᴃ⬠
ᇍMDLᑨ⫼ࠄᅲ䰙䯂乬ⱘѝ䆎ˈЏ㽕Ў䗝ᢽC1C2㓪ⷕᦤկᶤ⾡ᔶᓣⱘ䆎䆕DŽ
6.7 䍓ਬᯥᴶՎ࠼㊱ಞ
䖘Ҟ៥ӀᏆ䅼䆎њ䯂乬Ā㒭ᅮ䆁㒗᭄ˈ᳔ৃ㛑ⱘ؛䆒ᰃҔМ˛āᅲ䰙Ϟˈ䆹䯂乬䗮ᐌ
Ϣϔ᳝ᛣНⱘ䯂乬㋻ᆚⳌ݇˖Ā㒭ᅮ䆁㒗᭄ˈᇍᮄᅲ՟ⱘ᳔ৃ㛑ߚ㉏ᰃҔМ˛ā㱑✊
ৃⳟߎѠϾ䯂乬ৃㅔऩഄ⬅ᑨ⫼ MAP ؛䆒ࠄᮄᅲ՟ᴹᕫࠄˈᅲ䰙Ϟ䖬ৃ㛑དⱘㅫ⊩DŽ
ЎњⳈ㾖ѯˈ㗗㰥ϔࣙϝϾ؛䆒h1ˈh2ˈh3ⱘ؛䆒ぎ䯈DŽ؛ᅮᏆⶹ䆁㒗᭄ᯊϝϾ
؛䆒ⱘৢ偠ὖ⥛ߚ߿Ў 0.4ˈ0.3ˈ0.3DŽℸˈh1ЎMAP؛䆒DŽ㢹ϔᮄᅲ՟x㹿h1ߚ㉏Ўℷˈ
Ԛ㹿h2h3ߚ㉏ЎডDŽ䅵ㅫ᠔᳝؛䆒ˈxЎℷ՟ⱘὖ⥛Ў 0.4˄ेϢh1Ⳍ㘨㋏ⱘὖ⥛˅ˈ㗠Ўড
՟ⱘὖ⥛ᰃ 0.6DŽ䖭ᯊ᳔ৃ㛑ⱘߚ㉏˄ড՟ ˅ϢMAP؛䆒⫳៤ⱘߚ㉏ϡৠDŽ
ϔ㠀ⱘ䇈ˈᮄᅲ՟ⱘ᳔ৃ㛑ߚ㉏ৃ䗮䖛ড়ᑊ᠔᳝؛䆒ⱘ乘⌟ᕫࠄˈ݊ᴗ䞡ЎᅗӀⱘৢ偠
ὖ⥛DŽབᵰᮄⱘḋ՟ⱘৃ㛑ⱘߚ㉏ৃপᶤ䲚ড়VЁⱘӏϔؐvjˈ䙷Мὖ⥛P(vj|D)Ўᮄᅲ՟ℷ
⹂ߚ㉏Ўvjⱘὖ⥛ˈ݊ؐЎ˖
P (v j | D ) ¦ P (v
hi H
j | hi ) P (hi | D)
ᮄᅲ՟ⱘ᳔Ӭߚ㉏ЎP(vj|D)Ў᳔ᯊⱘvjؐDŽ
䋱ᮃ᳔Ӭߚ㉏఼
⫼Ϟ䴶ⱘ՟ᄤ䇈ᯢˈᮄᅲ՟ⱘৃ㛑ߚ㉏䲚ড়Ў V={,}ˈ㗠
ℸ
¦ P ( | h ) P ( h
hi H
i i | D) 0.4
¦ P (4 | h ) P ( h
hi H
i i | D) 0.6
ᑊϨ
՟བˈᏗᇨὖᗉᄺд䯂乬ЁˈՓ⫼ࠡ䴶ゴ㡖ⱘবൟぎ䯈ᮍ⊩ˈᇍϔᮄᅲ՟ⱘ䋱ᮃ᳔
Ӭߚ㉏ᰃবൟぎ䯈ⱘ᠔᳝៤ਬЁ䖯㸠ࡴᴗ䗝В㦋ᕫⱘˈ↣Ͼ䗝؛䆒ⱘᴗ䞡Ў݊ৢ偠ὖ
⥛DŽ
䋱ᮃ᳔Ӭߚ㉏఼ⱘϔϾᵕ᳝䍷ⱘሲᗻᰃˈᅗ᠔ৃ㉏ߚⱘخҹᇍᑨѢ H Ёϡᄬⱘ؛
䆒DŽ䆒ᛇՓ⫼ᓣ 6.18 ᴹߚ㉏ X Ё↣Ͼᅲ՟DŽᣝℸᅮНⱘⱘᅲ՟ᷛ⊼ϡᖙᇍᑨѢ H Ёⱘӏϔ
ऩϾ؛䆒 h ⱘᇍᅲ՟ⱘᷛ⊼DŽ⧚㾷䆹ੑ乬ⱘϔ⾡ᮍ⊩ᰃᇚ䋱ᮃߚ㉏఼ⳟ៤ᰃϡৠѢ؛䆒ぎ
䯈 H ⱘϔぎ䯈 H´ˈ݊Ϟᑨ⫼䋱ᮃ݀ᓣDŽ⹂ߛഄ䆆ˈH´᳝ᬜഄࣙњϔ㒘؛䆒ˈᅗ㛑
H ЁϾ؛䆒ⱘ㒓ᗻ㒘ড়᠔ⱘ乘㿔Ё䖯㸠↨䕗DŽ
6.8 Gibbs ㇍⌋
㱑✊䋱ᮃ᳔Ӭߚ㉏఼㛑Ң㒭ᅮ䆁㒗᭄Ё㦋ᕫ᳔དⱘᗻ㛑ˈᑨ⫼ℸㅫ⊩ⱘᓔ䫔ৃ㛑ᕜ
DŽॳѢᅗ㽕䅵ㅫ H Ё↣Ͼ؛䆒ⱘৢ偠ὖ⥛ˈ✊ৢড়ᑊ↣Ͼ؛䆒ⱘ乘⌟ˈҹߚ㉏ᮄᅲ
՟DŽ
ᔧ᳝ϔᕙߚ㉏ᮄᅲ՟ᯊˈGibbs ㅫ⊩ㅔऩഄᣝ✻ᔧࠡⱘৢ偠ὖ⥛ߚᏗˈՓ⫼ϔ䱣ᴎᢑপ
ⱘ؛䆒DŽҸҎৗⱘᰃˈৃ䆕ᯢϔᅮᴵӊϟ Gibbs ㅫ⊩ⱘ䇃ߚ㉏⥛ⱘᳳᳯ᳔ؐЎ䋱ᮃ
᳔Ӭߚ㉏఼ⱘϸ˄סHaussher et al. 1994˅DŽ㊒⹂ഄ䆆ˈᳳᳯؐᰃ䱣ᴎᢑপⱘⳂᷛὖᗉϞ
ߎˈᢑপ䖛ᣝ✻ᄺд఼؛ᅮⱘܜ偠ὖ⥛DŽℸᴵӊϟˈGibbs ㅫ⊩ⱘ䫭䇃⥛ᳳᳯ᳔ؐᏂ
Ў䋱ᮃߚ㉏఼ⱘϸסDŽ
䆹㒧䆎ᇍࠡ䗄ⱘὖᗉᄺд䯂乬᳝ϔ᳝䍷ⱘਃ⼎DŽेབᵰᄺд఼؛ᅮ H Ϟ᳝ഛࣔⱘܜ偠
ὖ⥛ˈ㗠ϨབᵰⳂᷛὖᗉᅲ䰙Ϟгᣝ䆹ߚᏗᢑপˈ䙷Мᔧࠡবൟぎ䯈Ё䱣ᴎᢑপⱘ؛䆒ᇍϟ
ϔᅲ՟ߚ㉏ⱘᳳᳯ䇃Ꮒ᳔Ў䋱ᮃߚ㉏఼ⱘϸסDŽ䖭䞠জ᳝њϔϾ՟ᄤ䇈ᯢ䋱ᮃߚᵤৃ
ҹᇍϔ䴲䋱ᮃㅫ⊩ⱘᗻ㛑䖯㸠䆘ԄDŽ
6.9 ᵪ㍖䍓ਬᯥ࠼㊱ಞ
䋱ᮃᄺдᮍ⊩Ёᅲ⫼ᗻᕜ催ⱘϔ⾡Ўᴈ㋴䋱ᮃᄺд఼ˈᐌ㹿⿄Ўᴈ㋴䋱ᮃߚ㉏఼
˄naive Bayes classifier˅
DŽᶤѯ乚ඳ݊ݙᗻ㛑ৃϢ⼲㒣㔥㒰އㄪᷥᄺдⳌᔧDŽᴀ㡖ҟ㒡
ᴈ㋴䋱ᮃߚ㉏఼ˈϟϔ㡖ᇚ݊ᑨ⫼Ѣᅲ䰙ⱘ䯂乬ˈे㞾✊䇁㿔᭛ᴀ᭛ḷⱘߚ㉏䯂乬DŽ
ᴈ㋴䋱ᮃߚ㉏఼ᑨ⫼ⱘᄺдӏࡵЁˈ↣Ͼᅲ՟xৃ⬅ሲᗻؐⱘড়পᦣ䗄ˈ㗠Ⳃᷛߑ᭄
f(x)Ңᶤ᳝䰤䲚ড়VЁপؐDŽᄺд఼㹿ᦤկϔ㋏߫݇ѢⳂᷛߑ᭄ⱘ䆁㒗ḋ՟ˈҹঞᮄᅲ՟˄ᦣ
䗄Ўሲᗻؐⱘܗ㒘˅<a1,a2…an>ˈ✊ৢ㽕∖乘⌟ᮄᅲ՟ⱘⳂᷛؐ˄ߚ㉏˅DŽ
䋱ᮃᮍ⊩ⱘᮄᅲ՟ߚ㉏Ⳃᷛᰃ㒭ᅮᦣ䗄ᅲ՟ⱘሲᗻؐ<a1,a2…an>ϟˈᕫࠄ᳔ৃ㛑ⱘ
ⳂᷛؐVMAPDŽ
ৃՓ⫼䋱ᮃ݀ᓣᇚℸ㸼䖒ᓣ䞡ݭЎ
P(a1 , a 2 ...a n | v j ) P(v j )
v MAP arg max
v j V P(a1 , a 2 ...a n )
ᴈ㋴䋱ᮃߚ㉏఼ѢϔϾㅔऩⱘ؛ᅮ˖㒭ᅮⳂᷛؐᯊሲᗻؐП䯈ⳌѦᴵӊ⣀ゟDŽᤶ
㿔Пˈ䆹؛ᅮ䇈ᯢ㒭ᅮᅲ՟ⱘⳂᷛؐᚙމϟˈ㾖ᆳࠄ㘨ড়ⱘa1, a2…anⱘὖ⥛ℷདᰃᇍ↣Ͼऩ
⣀ሲᗻⱘὖ⥛Ь⿃˖
P (a1 , a 2 ...a n | v j ) P (a
i i | vj)
ᴈ㋴䋱ᮃߚ㉏఼˖
݊ЁvNB㸼⼎ᴈ㋴䋱ᮃߚ㉏఼䕧ߎⱘⳂᷛؐDŽ⊼ᛣᴈ㋴䋱ᮃߚ㉏఼Ёˈ乏Ң䆁㒗
᭄ЁԄ䅵ⱘϡৠP(ai|vj)乍ⱘ᭄䞣াᰃϡৠⱘሲᗻ᭄ؐ䞣ЬҹϡৠⳂ᭄ᷛؐ䞣üü䖭↨㽕
Ԅ䅵P(a1,a2…an|vj)乍᠔䳔ⱘ䞣ᇣᕫDŽ
ὖᣀഄ䆆ˈᴈ㋴䋱ᮃᄺдᮍ⊩䳔㽕Ԅ䅵ϡৠⱘP(vj)P(ai|vj)乍ˈѢᅗӀ䆁㒗᭄
Ϟⱘ乥⥛DŽ䖭ѯԄ䅵ᇍᑨњᕙᄺдⱘ؛䆒DŽ✊ৢ䆹؛䆒Փ⫼ᓣ 6.20 Ёⱘ㾘߭ᴹߚ㉏ᮄᅲ՟DŽ
া㽕᠔䳔ⱘᴵӊ⣀ゟᗻ㛑㹿⒵䎇ˈᴈ㋴䋱ᮃߚ㉏vNBㄝѢMAPߚ㉏DŽ
ᴈ㋴䋱ᮃᄺдᮍ⊩݊ҪᏆҟ㒡ⱘᄺдᮍ⊩П䯈᳝ϔ᳝䍷ⱘᏂ߿˖≵᳝ᯢ⹂ⱘ᧰㋶؛
䆒ぎ䯈ⱘ䖛˄䖭䞠ˈৃ㛑؛䆒ⱘぎ䯈Ўৃ㹿䌟ќϡৠⱘP(vj)P(ai|vj)乍ⱘৃ㛑ؐDŽⳌডˈ
؛䆒ⱘᔶ៤ϡ䳔㽕᧰㋶ˈাᰃㅔऩഄ䅵ㅫ䆁㒗ḋ՟Ёϡৠ᭄㒘ড়ⱘߎ⦄乥⥛˅DŽ
6.9.1 ⽰ׁ
⦄ᇚᴈ㋴䋱ᮃߚ㉏఼ᑨ⫼ࠄࠡ䴶އㄪᷥЁ䅼䆎䖛ⱘὖᗉᄺд䯂乬˖ᣝ✻ᶤҎᰃ৺㽕ᠧ
㔥⧗ᴹߦߚ⇨DŽ 3 ゴⱘ㸼 3-2 ᦤկњⳂᷛὖᗉ PlayTennis ⱘ 14 Ͼ䆁㒗ḋ՟ˈ݊Ё↣ϔ
⬅ሲᗻ Outlook, Temprature, Humidity Wind ᴹᦣ䗄DŽ䖭䞠៥ӀՓ⫼ℸ㸼Ёⱘ᭄㒧ড়
ᴈ㋴䋱ᮃߚ㉏఼ᴹߚ㉏ϟ䴶ⱘᮄᅲ՟˖
⊼ᛣ᳔ৢϔϾ㸼䖒ᓣЁaiᏆ㒣⫼ᮄᅲ՟ⱘ⡍ᅮሲᗻؐᅲ՟࣪њDŽЎ䅵ㅫvNBˈ⦄䳔㽕
10 Ͼὖ⥛ˈᅗӀ䛑ৃҹ䆁㒗᭄ЁԄ䅵ߎDŽ佪ܜϡৠⳂᷛؐⱘὖ⥛ৃҹѢ䖭 14 Ͼ䆁㒗ḋ
՟ⱘ乥⥛ᕜᆍᯧഄԄ䅵ߎ˖
P(PlayTennis=yes)=9/14=0.64
P(PlayTennis=no)=5/14=0.36
ⳌԐഄˈৃҹԄ䅵ߎᴵӊὖ⥛ˈ՟བᇍѢ Wind=Strong ᳝˖
P(Wind=strong|PlayTennis=yes)=3/9=0.33
P(Wind=strong|PlayTennis=no)=3/5=0.60
P(yes)P(sunny|yes)P(cool|yes)P(high|yes)P(strong|yes)=0.0053
P(no)P(sunny|no)P(cool|no)P(high|no)P(strong|no)=0.0206
䖭ḋˈѢҢ䆁㒗᭄Ёᄺдࠄⱘὖ⥛Ԅ䅵ˈᴈ㋴䋱ᮃߚ㉏఼ᇚℸᅲ՟䌟ҹⳂᷛؐ
PlayTennis= no DŽ䖯ϔℹˈ䗮䖛ᇚϞ䗄ⱘ䞣ᔦϔ࣪ˈৃ䅵ㅫ㒭ᅮ㾖ᆳؐϟⳂᷛؐЎ no ⱘ
ᴵӊὖ⥛DŽᇍѢℸ՟ˈὖ⥛Ў 0.0206/(0.0206+0.0053)=0.795DŽ
6.9.1.1 զ䇗Ᾰ⦽
㟇ℸˈ៥Ӏ䗮䖛ܼ䚼џӊ⸔Ϟ㾖ᆳᶤџӊߎ⦄ⱘ↨՟ᴹԄ䅵ὖ⥛DŽ՟བˈϞ՟Ёˈ
Ԅ䅵P(Wind=Strong|PlayTennis=no)Փ⫼ⱘᰃ↨ؐnc/nˈ݊Ёn=5ˈЎ᠔᳝PlayTennis= no ⱘ䆁
㒗ḋ՟᭄Ⳃˈ㗠nc=3 ᰃ݊ЁWind=Strong ⱘ᭄ⳂDŽ
ᰒ✊᭄ᚙމϟˈ㾖ᆳࠄⱘ↨՟ᰃᇍὖ⥛ⱘϔϾ㡃དԄ䅵ˈԚᔧncᕜᇣᯊԄ䅵䛑䕗ᏂDŽ
䲒ᑺѢˈ䆒ᛇP(Wind=Strong|PlayTennis= no)ⱘؐЎ 0.08ˈ㗠ḋᴀЁা᳝ 5 Ͼḋ՟ⱘ
PlayTennis=noDŽ䙷МᇍѢnc᳔ৃ㛑ⱘؐা᳝ 0DŽ䖭ѻ⫳њϸϾ䲒乬ˈ佪ˈܜnc/nѻ⫳њϔϾ
᳝ⱘأ䖛ԢԄ䅵˄underestimate˅ὖ⥛DŽ݊ˈᔧℸὖ⥛Ԅ䅵Ў 0 ᯊˈབᵰᇚᴹⱘᶹ䆶ࣙ
Wind=Strongˈℸὖ⥛乍Ӯ䋱ᮃߚ㉏఼ऴ᳝㒳⊏ഄԡDŽॳѢˈ⬅ᓣ 6.20 䅵ㅫⱘ䞣䳔
㽕ᇚ᠔᳝݊Ҫⱘὖ⥛乍Ьҹℸ 0 ؐDŽ
Ў䙓ܡ䖭ѯ䲒乬ˈ䖭䞠䞛⫼ϔ⾡Ԅ䅵ὖ⥛ⱘ䋱ᮃᮍ⊩ˈՓ⫼བϟᅮНⱘ m-Ԅ䅵˖
ὖ⥛ⱘ m-Ԅ䅵
nc mp
˄6.22˅
nm
䖭䞠ˈncnབࠡ䴶ᅮНˈpᰃᇚ㽕⹂ᅮⱘὖ⥛ⱘܜ偠Ԅ䅵ˈ㗠mᰃϔ⿄Ўㄝᬜḋᴀᇣ
ⱘᐌ䞣ˈᅗ⹂ᅮњᇍѢ㾖ᆳࠄⱘ᭄བԩ㸵䞣pⱘ⫼DŽ㔎ᇥ݊Ҫֵᙃᯊ䗝ᢽpⱘϔ⾡ൟ
ⱘᮍ⊩ᰃ؛ᅮഛࣔⱘܜ偠ὖ⥛ˈгህᰃˈབᵰᶤሲᗻ᳝kϾৃ㛑ؐˈ䙷М䆒㕂p=1/kDŽ՟བˈ
ˈ⊼ᛣࠄሲᗻWind᳝ϸϾৃ㛑ؐˈℸഛࣔⱘܜ偠ὖ
ЎԄ䅵˄Wind=Strong|PlayTennis= no˅
⥛Ўp=0.5DŽ⊼ᛣབᵰmЎ 0ˈm-Ԅ䅵ㄝᬜѢㅔऩⱘ↨՟nc/nDŽབᵰnm䛑䴲 0ˈ䙷М㾖ᆳࠄ
ⱘ↨՟nc/nܜ偠ὖ⥛pৃᣝ✻ᴗ䞡mড়ᑊDŽm㹿⿄Ўㄝᬜḋᴀᇣⱘॳᰃˈᓣ 6.22 ৃ㹿㾷
䞞ЎᇚnϾᅲ䰙ⱘ㾖ᆳᠽˈࡴϞmϾᣝpߚᏗⱘ㰮ᢳḋᴀDŽ
6.10 ⽰ׁφᆜҖ࠼㊱ᮽᵢ
Ўⓨ⼎䋱ᮃᄺдᮍ⊩ᅲ䏉Ϟⱘ䞡㽕ᗻˈ㗗㰥ϔϾᄺд䯂乬ˈ݊Ёⱘᅲ՟䛑Ў᭛ᴀ᭛
ḷDŽ՟བˈ㽕ᄺдⳂᷛὖᗉ˖Ā៥ᛳ݈䍷ⱘ⬉ᄤᮄ䯏〓āĀ䅼䆎ᴎ఼ᄺдⱘϛ㓈㔥义ā
DŽ
䖭ϸ⾡ᚙމϟˈབᵰ䅵ㅫᴎৃҹ㊒⹂ഄᄺдࠄⳂᷛὖᗉˈህৃҢ䞣㒓᭛ᴀ᭛ḷЁ㞾ࡼ䖛
Ⓒߎ᳔Ⳍ݇ⱘ᭛ḷᰒ⼎㒭䇏㗙DŽ
䖭䞠ᦣ䗄њϔϾѢᴈ㋴䋱ᮃߚ㉏఼ⱘ᭛ᴀߚ㉏ⱘ䗮⫼ㅫ⊩DŽ᳝䍷ⱘᰃˈ䖭ḋⱘὖ⥛
ᮍ⊩ᰃⳂࠡ᠔ⶹ᭛ᴀ᭛ḷߚ㉏ㅫ⊩Ёⱘ᳔᳝ᬜⱘϔ㉏DŽ䖭ḋⱘ㋏㒳՟ᄤ⬅ Lewis(1991)ˈ
Lang(1995) Joachims(1996)ᦤߎDŽ
ᇚ㽕ሩ⼎ⱘᴈ㋴䋱ᮃㅫ⊩䙉ᕾҹϟⱘ䯂乬㚠᱃DŽ㗗㰥ᅲ՟ぎ䯈 X ࣙњ᠔᳝ⱘ᭛ᴀ
᭛ḷ˄ेӏᛣ䭓ᑺⱘ᠔᳝ৃ㛑ⱘऩ䆡ᷛ⚍ヺোІ˅DŽ㒭ᅮᶤⶹⳂᷛߑ᭄ f(x) ⱘϔ㒘䆁㒗
ḋ՟ˈf(x)ⱘপؐᴹ㞾Ѣᶤ᳝䰤䲚ড় VDŽℸӏࡵᰃҢ䆁㒗ḋ՟Ёᄺдˈҹ乘⌟ৢ㓁᭛ᴀ᭛ḷ
ⱘⳂᷛؐDŽЎ⼎՟ˈ䖭䞠㗗㰥ⱘⳂᷛߑ᭄ᰃˈᇚ᭛ḷߚ㉏ЎᇍᶤҎᰃ৺ᛳ݈䍷ˈՓ⫼Ⳃᷛ
ؐ like dislike ҷ㸼䖭ϸ㉏DŽ
ᑨ⫼ᴈ㋴䋱ᮃߚ㉏఼ᯊࣙⱘϸϾЏ㽕䆒䅵䯂乬ᰃˈ佪ܜ㽕އᅮᗢḋᇚӏᛣ᭛ḷ㸼
⼎ЎሲᗻؐⱘᔶᓣˈѠ㽕އᅮབԩԄ䅵ᴈ㋴䋱ᮃߚ㉏఼᠔䳔ⱘὖ⥛DŽ
䖭䞠㸼⼎ӏᛣ᭛ᴀ᭛ḷⱘ䗨ᕘߎ༛ഄㅔऩDŽ㒭ᅮϔ᭛ᴀ᭛ḷˈ˄䖭䞠ܜ㗗㰥㣅᭛᭛ḷ˅ˈ
ৃᇍ↣Ͼऩ䆡ⱘԡ㕂ᅮНϔϾሲᗻˈ䆹ሲᗻⱘؐЎℸԡ㕂Ϟᡒࠄⱘ㣅᭛ऩ䆡DŽ䆹᭛ᴀ᭛ḷ
བϟ՟᠔⼎˖
This is an example document for the naive Bayes classifier. This document contains only one
paragraph, or two sentences.
བᵰ᭛ᴀ᭛ḷ䖭ḋ㸼⼎ˈ⦄ህৃҹᑨ⫼ᴈ㋴䋱ᮃߚ㉏఼њDŽЎњᯢ⹂䍋㾕ˈ؛ᅮ៥
Ӏ᳝ 700 Ͼ䆁㒗᭛ḷˈᑊϨᏆ⬅ҎᎹᇚ݊ߚ㉏Ў dislikeˈ㗠 300 Ͼ᭛ḷ㹿ߚ㉏Ў likeDŽ
⦄᳝њϔϾᮄ᭛ḷ㽕ߚ㉏DŽҡЎᯢ⹂䍋㾕ˈ䆹᭛ḷህᰃϞ䴶ⱘϸহ㣅᭛՟ᄤDŽℸᚙމϟˈ
ৃᑨ⫼ᓣ 6.20 䅵ㅫᴈ㋴䋱ᮃߚ㉏఼བ˖
19
v NB arg max P (v j ) P(ai | v j )
v j {like , dislike} i 1
arg max P(v j ) P(a1 " this"| v j ) P(a 2 " is"| v j )...P(a19 " sentence"| v j )
v j {like , dislike}
ὖᣀഄ䆆ˈᴈ㋴䋱ᮃߚ㉏vNBᰃՓ䆹᭛ḷЁⱘऩ䆡ℸ໘㹿㾖ᆳࠄⱘὖ⥛᳔ⱘϔϾ
19
ߚ㉏ˈᅗ䙉ᕾ䗮ᐌⱘᴈ㋴䋱ᮃ⣀ゟᗻ؛ᅮDŽ⣀ゟᗻ؛ᅮ P ( a1 ,...a19 | v j ) 1
P (a i | v j )
䇈ᯢℸ䆒ᅮϟϔϾԡ㕂Ϟߎ⦄ᶤऩ䆡ⱘὖ⥛⣀ゟѢϔϾԡ㕂ⱘऩ䆡DŽ䖭ϔ؛ᅮ᳝
ѯᯊᑊϡডⳳᅲᚙމDŽ՟བˈᶤ໘㾖ᆳࠄऩ䆡learning ⱘὖ⥛ӮЎᅗࠡϔԡ㕂ऩ䆡
ᰃmachine㗠DŽ㱑✊ℸ⣀ゟᗻ؛ᅮᕜϡ㊒⹂ˈԚ䖭䞠߿᮴䗝ᢽˈᖙ乏ℸ؛ᅮüü≵᳝
䖭Ͼ؛ᅮˈ㽕䅵ㅫⱘὖ⥛乍ᇚᵕЎᑲDŽᑌ䖤ⱘᰃˈᅲ䏉Ёᴈ㋴䋱ᮃᄺд఼䆌᭛ᴀ
ߚ㉏䯂乬Ёᗻ㛑䴲ᐌདˈेՓℸ⣀ゟᗻ؛ᅮϡℷ⹂DŽ Domingos Pazzani(1996)ᇍ䖭ϔᑌ䖤
ⱘ⦄䈵њϔϾ᳝䍷ⱘߚᵤDŽ
ЎՓ⫼Ϟᓣ䅵ㅫvNBˈ䳔㽕Ԅ䅵ὖ⥛乍P(vi)P(ai=wk|vi)DŽ䖭䞠ᓩܹwkҷ㸼㣅᭛䆡Ёⱘ
kϾऩ䆡DŽࠡϔ乍ৃѢ↣ϔ㉏䆁㒗᭄Ёⱘ↨՟ᕜᆍᯧഄᕫࠄ˄ℸ՟ЁP(like)=0.3 Ϩ
P(dislike)= 0.7˅DŽབҹᕔ䙷ḋˈԄ䅵㉏߿ⱘᴵӊὖ⥛˄བP(a1)=“This”| P(dislike)˅㽕ೄ䲒ⱘ
ˈЎᖙ乏ᇍ↣Ͼ᭛ᴀԡ㕂ǃ㣅᭛ऩ䆡Ⳃᷛؐⱘ㒘ড়䅵ㅫℸὖ⥛乍DŽ䴲ᐌϡᑌˈ㣅᭛
䆡∛Ёࣙ㑺 5 ϛϾϡৠऩ䆡ˈ✊ৢᴀ՟Ё᳝ 2 Ͼৃ㛑ⱘⳂᷛؐ 19 Ͼ᭛ᴀԡ㕂ˈ᠔ҹᖙ
乏Ң䆁㒗᭄ЁԄ䅵 2×19×50000Ĭ200 ϛϾ䖭ḋⱘὖ⥛乍DŽ
ᑌ䖤ⱘᰃˈৃҹݡᓩܹϔড়⧚ⱘ؛ᅮҹޣᇥ䳔㽕Ԅ䅵ⱘὖ⥛᭄䞣DŽ⹂ߛഄ䆆ˈৃ؛ᅮ䘛
ࠄϔ⡍ᅮऩ䆡wkⱘὖ⥛⣀ゟѢऩ䆡᠔ԡ㕂DŽᔶᓣ࣪ⱘ㸼䗄ᰃˈ㒭ᅮⳂᷛߚ㉏ⱘᚙމϟˈ
؛ᅮሲᗻᰃ⣀ゟৠߚᏗⱘˈेᇍ᠔᳝ⱘi, j, k, mˈP(ai=wk|vj)=P(am=wk|vj)DŽℸˈЎԄ䅵ᭈ
Ͼὖ⥛䲚ড়P(a1=wk|vj), P(a2=wk|vj)ˈৃ䗮䖛ϔϾԡ㕂᮴݇ⱘὖ⥛P(wk|vj)ˈ㗠ϡ㗗㰥ऩ䆡ⱘԡ
㕂DŽ݊ᬜᵰᰃˈ⦄া䳔㽕 2×50000 Ͼϡৠⱘὖ⥛乍P(wk|vj)DŽ㱑✊䖭ҡ✊ᰃϔϾ䕗ⱘ᭄
ؐˈԚैᰃৃㅵ⧚ⱘDŽ⊼ᛣࠄབᵰ䆁㒗᭄᳝䰤ˈℸ؛ᅮⱘϔϾЏ㽕Ӭ⚍ѢˈᅗՓৃ⫼
ѢԄ䅵↣Ͼ᠔䳔ὖ⥛ⱘḋ՟᭄ࡴњˈℸࡴњԄ䅵ⱘৃ䴴ᑺDŽ
nk 1
n Vocabulary
݊ЁnЎ᠔᳝ⳂᷛؐЎvjⱘ䆁㒗ḋ՟Ёऩ䆡ԡ㕂ⱘᘏ᭄ˈnkᰃnϾऩ䆡ԡ㕂Ёᡒࠄwkⱘ
᭄ˈ㗠|Vocabulary|Ў䆁㒗᭄Ёⱘϡৠऩ䆡˄ҹঞ݊Ҫ䆄ো˅ⱘᘏ᭄DŽ
ὖᣀഄ䇈ˈ᳔㒜ⱘㅫ⊩Փ⫼ⱘᴈ㋴䋱ᮃߚ㉏఼؛ᅮऩ䆡ߎ⦄ⱘὖ⥛Ϣᅗ᭛ᴀЁⱘԡ
㕂᮴݇DŽ᳔㒜ⱘㅫ⊩ᰒ⼎㸼 6-2 ЁDŽ⊼ᛣ䆹ㅫ⊩䴲ᐌㅔऩDŽᄺд䖛Ёˈ䖛
Learn-naive-Bayes-textߚᵤ᠔᳝䆁㒗᭛ḷˈҢЁᢑপߎ᠔᳝ߎ⦄ⱘऩ䆡ⱘ䆄ো˗✊ৢϡৠ
Ⳃᷛ㉏Ё䅵ㅫ݊乥⥛ҹ㦋ᕫᖙ㽕ⱘὖ⥛Ԅ䅵DŽҹৢˈ㢹㒭ᅮϔϾᕙߚ㉏ᮄᅲ՟ˈ䖛
Classify-naive-Bayes-text Փ⫼ℸὖ⥛Ԅ䅵ᴹᣝ✻ᓣ 6.20 䅵ㅫVNBDŽ⊼ᛣᮄ᭛ḷЁߎ⦄Ԛϡ
䆁㒗䲚ⱘ᭛ḷЁⱘӏԩऩ䆡ᇚ㹿ㅔऩഄᗑ⬹DŽ䆹ㅫ⊩ⱘҷⷕҹঞ䆁㒗᭄䲚ˈৃϛ㓈㔥
ⱘhttp://www.cs.cmu.edu/tom/book.htmlЁᡒࠄDŽ
Learn_naive_Bayes_text(Examples, V)
ExamplesЎϔ㒘᭛ᴀ᭛ḷҹঞᅗӀⱘⳂᷛؐDŽVЎ᠔᳝ৃ㛑Ⳃᷛؐⱘ䲚ড়DŽℸߑ᭄⫼ᰃᄺдὖ⥛乍P(wk|vj)ˈ
ᅗᦣ䗄њҢ㉏߿vjЁⱘϔϾ᭛ḷЁ䱣ᴎᢑপⱘϔϾऩ䆡Ў㣅᭛ऩ䆡wkⱘὖ⥛DŽ䆹ߑ᭄гᄺд㉏߿ⱘܜ偠ὖ⥛
P(vj)DŽ
1.ᬊ䲚 Examples Ё᠔᳝ⱘऩ䆡ǃᷛ⚍ヺোҹঞ݊Ҫ䆄ো
Vocabularyĕ Examples Ёӏᛣ᭛ᴀ᭛ḷЁߎ⦄ⱘ᠔᳝ऩ䆡ঞ䆄োⱘ䲚ড়
2.䅵ㅫ᠔䳔㽕ⱘὖ⥛乍P(vj) P(wk|vj)
ᇍVЁ↣ϾⳂᷛؐvj
docsjĕExamplesЁⳂᷛؐЎvjⱘ᭛ḷᄤ䲚
P(vj) ĕ docs j
Examples
TextjĕᇚdocsjЁ᠔᳝៤ਬ䖲䍋ᴹᓎゟⱘऩϾ᭛ḷ
nĕTextjЁϡৠऩ䆡ԡ㕂ⱘᘏ᭄
ᇍVocabularyЁ↣Ͼऩ䆡wk
nkĕऩ䆡wkߎ⦄TextjЁⱘ᭄
P(wk|vj) ĕ nk 1
n Vocabulary
Classify_naive_Bayes_text(Doc)
ᇍ᭛ḷDoc䖨ಲ݊Ԅ䅵ⱘⳂᷛؐDŽaiҷ㸼DocЁⱘiϾԡ㕂Ϟߎ⦄ⱘऩ䆡DŽ
positionsĕ Doc Ёࣙⱘ㛑 Vocabulary Ёᡒࠄⱘ䆄োⱘ᠔᳝ऩ䆡ԡ㕂
䖨ಲ v
NB arg max P (v j )
v j V
P (a
i positions
i | vj)
㸼 6-2 ⫼Ѣᄺдߚ㉏᭛ᴀⱘᴈ㋴䋱ᮃㅫ⊩
䰸䗮ᐌⱘᴈ㋴䋱ᮃ؛ᅮˈㅫ⊩䖬؛ᅮऩ䆡ߎ⦄ⱘὖ⥛⣀ゟѢ݊᭛ᴀЁⱘԡ㕂DŽ
6.10.1 ᇔ僂㔉᷒
݊Ҫᑨ⫼㉏Ԑⱘ㒳䅵ᄺдㅫ⊩䖯㸠᭛ᴀߚ㉏ⱘᅲ偠г㦋ᕫњৠḋདⱘ㒧ᵰDŽ՟བˈLang
˄1995˅ᦣ䗄њᴈ㋴䋱ᮃㅫ⊩ⱘϔব⾡ˈᡞᅗᑨ⫼ࠄᄺдⳂᷛὖᗉĀ៥ᛳ݈䍷ⱘᮄ䯏㒘
᭛ゴāDŽҪᦣ䗄њ NewsWeeder ㋏㒳üüᰃϔϾ䅽⫼᠋䯙䇏ᮄ䯏㒘᭛ゴᑊЎ݊䆘ߚⱘ㋏㒳DŽ
✊ৢ NewsWeeder Փ⫼䖭ѯ䆘ߚⱘ᭛ゴЎ䆁㒗ḋ՟ˈᴹ乘⌟ৢ㓁ⱘ᭛ゴાѯᰃ⫼᠋ᛳ݈䍷
ⱘˈݡᇚ݊䗕㒭⫼᠋䯙䇏DŽLang (1995)ਞњҪⱘᅲ偠ˈ݊Ё⫼ NewsWeeder Ёᄺࠄⱘ⫼᠋
݈䍷䜡㕂᭛ӊˈ↣⫼᠋㤤ߚ᳔ؐ催ⱘᮄ䯏᭛ゴDŽ䗮䖛⫼᠋ሩ⼎ࠡ 10%ⱘ㞾ࡼ䆘ߚ
᭛ゴˈᅗᓎゟⱘ᭛ゴᑣ߫Ё⫼᠋ᛳ݈䍷ⱘ↨⥛↨䗮ᐌᚙމϟ催ߎ 3-4 סDŽ՟བˈ㢹ϔϾ⫼᠋
ᇍ䗮ᐌⱘ᭛ゴ᳝ 16%ᛳ݈䍷ˈ݊ᇍѢ NewsWeeder 㤤ⱘ᭛ゴ᳝ 59%ᛳ݈䍷DŽ
݊Ҫ⾡䴲䋱ᮃⱘ㒳䅵᭛ᴀᄺдㅫ⊩гᕜᐌ㾕ˈ݊Ё䆌ѢֵᙃẔ㋶乚ඳ
˄Information Retrieval˅Ёⱘ᳔ܜথᯢⱘⳌԐᗻᑺ䞣˄㾕 Rocchio 1971˗Salton 1991˅DŽ
ⱘ᭛ᴀᄺдㅫ⊩㾕 Hearst & Hirsh˄1996˅DŽ
comp.graphics misc.forsale soc.religion.christian sci.space
comp.os.ms-windows.misc rec.autos talk.politics.guns sci.crypt
comp.sys.ibm.pc.hardware rec.motocycles talk.politics.mideast sci.electronics
comp.sys.mac.hardware rec.sport.baseball talk.politics.misc sci.med
comp.windows.x rec.sport.hockey talk.religion.misc
alt.atheism
6.11 䍓ਬᯥ㖤ؗ㖇
བࠡϸ㡖᠔䅼䆎ⱘˈᴈ㋴䋱ᮃߚ㉏఼؛ᅮњሲᗻa1Ăanⱘؐ㒭ᅮⳂᷛؐvϟᰃᴵӊ
⣀ゟⱘDŽ䖭ϔ؛ᅮᰒ㨫ഄޣᇣњⳂᷛߑ᭄ᄺдⱘ䅵ㅫᴖᑺDŽᔧℸᴵӊ៤ゟᯊˈᴈ㋴䋱ᮃ
ߚ㉏఼ৃᕫࠄ᳔Ӭ䋱ᮃߚ㉏DŽ✊㗠䆌ᚙᔶϟˈ䖭ϔᴵӊ⣀ゟ؛ᅮᯢᰒ䖛ѢϹḐњDŽ
䋱ᮃ㕂ֵ㔥ᦣ䗄ⱘᰃϔ㒘ব䞣᠔䙉Ңⱘὖ⥛ߚᏗˈᅗ䗮䖛ϔ㒘ᴵӊὖ⥛ᴹᣛᅮϔ㒘ᴵ
ӊ⣀ゟᗻ؛ᅮDŽᴈ㋴䋱ᮃߚ㉏఼؛ᅮ᠔᳝ব䞣㒭ᅮⳂᷛব䞣ؐᯊЎᴵӊ⣀ゟⱘˈϢℸϡ
ৠˈ䋱ᮃ㕂ֵ㔥Ёৃ㸼䗄ᑨ⫼ࠄব䞣ⱘϔϾᄤ䲚Ϟⱘᴵӊ⣀ゟᗻ؛ᅮDŽℸˈ䋱ᮃ㕂ֵ
㔥ᦤկњϔ⾡Ё䯈ⱘᮍ⊩ˈᅗ↨ᴈ㋴䋱ᮃߚ㉏఼Ёᴵӊ⣀ゟᗻⱘܼሔ؛ᅮⱘ䰤ࠊᇥˈজ
↨᠔᳝ব䞣Ё䅵ㅫᴵӊձ䌪ৃ㸠DŽ䋱ᮃ㕂ֵ㔥ᰃⳂࠡⷨおЁϔϾ䴲ᐌ⌏䎗ⱘ⛺⚍ˈ㗠
Ϩ᳝⾡ᮍ⊩㹿ᦤߎҹᄺдᅗ⫼ᅗ䖯㸠⧚DŽᴀ㡖ҟ㒡䋱ᮃ㕂ֵ㔥ⱘ݇䬂ὖᗉ㸼⼎DŽ
䆺 㒚 ⱘ 䅼 䆎 㾕 Pearl(1988) ˈ Rusell & Norvig(1995) ˈ Herkerman et al. ˄ 1995 ˅ ҹ ঞ
Jensen(1996)DŽ
ϔ㠀ᴹ䇈ˈ䋱ᮃ㕂ֵ㔥ᦣ䗄њϔ㒘ব䞣Ϟⱘὖ⥛ߚᏗDŽ㗗㰥ϔӏᛣⱘ䱣ᴎব䞣䲚ড়
Y1ĂYnˈ݊Ё↣ϾYiৃপⱘؐ䲚ড়ЎV(Yi)DŽᅮНব䞣䲚ড়Yⱘ㘨ড়ぎ䯈(joint space)ЎঝЬV(Y1)
hV(Y2)ĂV(Yn)DŽᤶ㿔Пˈ㘨ড়ぎ䯈Ёⱘ↣ϔ乍ᇍᑨব䞣ܗ㒘ⱘϔϾৃ㛑ⱘ䌟ؐ<Y1…Yn>DŽ
ℸ㘨ড়ぎ䯈Ϟⱘὖ⥛ߚᏗ⿄Ў㘨ড়ὖ⥛ߚᏗ(joint probability distribution)DŽ㘨ড়ὖ⥛ߚᏗᣛ
ᅮњܗ㒘<Y1…Yn>ⱘ↣Ͼৃ㛑ⱘব䞣㑺ᴳⱘὖ⥛DŽ䋱ᮃ㕂ֵ㔥߭ᇍϔ㒘ব䞣ᦣ䗄њ㘨ড়ὖ
⥛ߚᏗDŽ
6.11.1 ᶗԬ⤢ᙝ
(xi , y j , z k ) P ( X xi | Y yj,Z zk ) P( X xi | Z zk )
݊Ё xi V ( X ) ˈ y j V (Y ) ˈ z k V ( Z ) DŽ䗮ᐌᇚϞᓣㅔݭЎP(X|Y,Z)=P(X|Z)DŽ䖭ϔ
݇Ѣᴵӊ⣀ゟᗻⱘᅮНৃ㹿ᠽሩࠄব䞣䲚ড়DŽᔧϟ߫ᴵӊ៤ゟᯊˈ⿄ব䞣䲚ড়X1…Xl㒭ᅮব
䞣䲚ড়Z1…Znᯊᴵӊ⣀ゟѢব䞣䲚ড়Y1…Ym˖
⊼ᛣℸᅮНϢᴈ㋴䋱ᮃߚ㉏఼ЁՓ⫼ⱘᴵӊ⣀ゟᗻП䯈ⱘ݇㋏DŽᴈ㋴䋱ᮃߚ㉏఼؛
ᅮ㒭ᅮⳂᷛؐVᯊˈᅲ՟ሲᗻA1ᴵӊ⣀ゟѢᅲ՟ሲᗻA2DŽ䖭Փᕫᴈ㋴䋱ᮃߚ㉏఼ৃҹᣝ✻
ϟᓣ䅵ㅫ 6.20 ᓣЁⱘP(A1,A2|V)˖
P(A1,A2|V)=P(A1|A2,V)P(A2|V) (6.23)
=P(A1|V)P(A2|V) (6.24)
原书页码: 186
6-3 ϔϾ䋱ᮃ㕂ֵ㔥DŽ
Ꮊ䖍ⱘ㔥㒰㸼⼎њϔ㒘ᴵӊ⣀ゟᗻ؛ᅮDŽ⹂ߛഄ䇈ˈ↣Ͼ㡖⚍㒭ᅮ݊⠊㒧⚍ᯊˈᴵӊ⣀ゟ
Ѣ݊䴲ৢҷ㒧⚍DŽ↣Ͼ㒧⚍݇㘨ϔϾᴵӊὖ⥛㸼ˈᅗᣛᅮњ䆹ব䞣㒭ᅮ݊⠊㒧⚍ᯊⱘᴵӊߚᏗDŽ
ে䖍߫ߎњ Campfire 㒧⚍ⱘᴵӊὖ⥛㸼ˈ݊Ё Campfire, Storm BusTourGroup ߚ߿㓽ݭЎ CˈSˈ
BDŽ
6.11.2 㺞⽰
n
P ( y1 ,... y n ) P( y
i 1
i | Parents (Yi ))
݊ЁParents(Yi)㸼⼎㔥㒰ЁYiⱘゟेࠡ偅ⱘ䲚ড়DŽ⊼ᛣ P(yi|Parents(yi))ⱘؐㄝѢϢ㒧⚍
Yi݇㘨ⱘᴵӊὖ⥛㸼ЁⱘؐDŽ
P(Campfire=True|Storm=True, BusTourGroup=True)=0.4
䋱ᮃ㕂ֵ㔥ⱘϔϾᓩҎⱘ⡍ᗻѢˈᅗᦤկњϔ⾡ᮍ֓ⱘ䗨ᕘҹ㸼⼎ᵰⶹ䆚ˈ↨
˄䮾⬉˅ᇐ㟈 Thunder˄ᠧ䳋˅DŽҹᴵӊ⣀ゟᗻⱘᴃ䇁ˈ
བ Lighting ৃᇚ݊㸼䗄Ў㒭ᅮ Lighting
ⱘؐᚙމϟˈThunder ᴵӊ⣀ゟѢ㔥㒰Ё݊Ҫব䞣DŽ⊼ᛣℸᴵӊ⣀ゟᗻ؛ᅮᰃ⬅ 6-3 ⱘ䋱
ᮃ㔥ⱘᓻᣛᅮⱘDŽ
6.11.3 ᧞⨼
ৃҹ⫼䋱ᮃ㔥㒭ᅮ݊Ҫব䞣ⱘ㾖ᆳؐᯊ⧚ߎᶤѯⳂᷛব䞣˄བ ForestFire˅ⱘؐDŽ
ᔧ✊ˈ⬅Ѣ᠔໘⧚ⱘᰃ䱣ᴎব䞣ˈ᠔ҹϔ㠀ϡӮ䌟ќⳂᷛব䞣ϔϾ⹂ߛⱘؐDŽⳳℷ䳔㽕⧚
ⱘᰃⳂᷛব䞣ⱘὖ⥛ߚᏗˈᅗᣛᅮњ㒭Ϣ݊Ҫব䞣ⱘ㾖ᆳؐᴵӊϟˈⳂᷛব䞣প↣ϔৃ㛑
ؐⱘὖ⥛DŽ㔥㒰Ё᠔᳝݊Ҫব䞣䛑⹂ߛⶹ䘧њҹৢˈ䖭ϔ⧚ℹ偸ᰃᕜㅔऩⱘDŽ䗮ᐌ
ⱘᚙމϟ,៥ӀᏠᳯⶹ䘧ϔ䚼ߚব䞣ⱘؐ˄↨བ Thunder BusTourGroup Ўҙ᳝ৃ⫼ⱘ㾖
ᆳؐ˅ᯊ㦋ᕫᶤব䞣ⱘὖ⥛ߚᏗ˄བ ForestFire˅DŽϔ㠀ഄˈ䋱ᮃ㔥㒰ৃ⫼Ѣⶹ䘧ᶤѯব
䞣ⱘؐߚᏗᯊ䅵ㅫ㔥㒰Ёϔ䚼ߚব䞣ⱘὖ⥛ߚᏗDŽ
ϔ㠀ᚙމϟᇍӏᛣ䋱ᮃ㔥㒰ⱘὖ⥛ⱘ⹂ߛ⧚Ꮖ㒣ⶹ䘧ᰃϔϾ NP 䲒乬˄Cooper
1990˅DŽᏆᦤߎњ⾡ᮍ⊩䋱ᮃ㔥㒰Ё䖯㸠ϡ⹂ᅮᗻ⧚ˈࣙᣀ⹂ߛⱘ⧚ҹঞ⡎⡆㊒
ᑺᤶপᬜ⥛ⱘ䖥Ԑ⧚ᮍ⊩DŽ՟བˈMonte Carlo ᮍ⊩ᦤկњϔ⾡䖥Ԑⱘᮍ⊩ˈ䗮䖛ᇍ㾖
ᆳࠄব䞣䖯㸠䱣ᴎ䞛ḋ˄ Pradham Dagum 1996˅
DŽ⧚䆎ϞˈेՓᰃ䋱ᮃ㔥㒰Ёⱘ䖥Ԑ⧚
гৃᰃ NP 䲒乬˄Dagnm Luby1993˅DŽᑌ䖤ⱘᰃˈᅲ䏉Ё䆌ᚙމϟ䖥Ԑⱘᮍ⊩㹿䆕ᯢ
ᰃ᳝ᬜⱘˈᇍѢ䋱ᮃ㔥㒰⧚ᮍ⊩ⱘ䅼䆎⬅ Russell & Norvig˄1995˅ Jensen˄1996˅
ߎDŽ
6.11.4 ᆜҖ䍓ਬᯥ㖤ؗ㖇
ᰃ৺ৃҹ䆒䅵ߎ᳝ᬜⱘㅫ⊩ҹҢ䆁㒗᭄Ёᄺࠄ䋱ᮃ㕂ֵ㔥˛䖭ᰃⳂࠡⷨおЁⱘϔ
Ͼ⛺⚍ⱘ䯂乬DŽᇍѢ䖭ϔ䯂乬᳝⾡ৃҹ㗗㰥ⱘḚᶊDŽ佪ܜ㔥㒰㒧ᵘৃҹ乘ܜ㒭ߎˈৃ⬅
䆁㒗᭄ЁᕫDŽѠˈ᠔᳝ⱘ㔥㒰ব䞣ৃҹⳈҢ↣Ͼ䆁㒗ḋ՟Ё㾖ᆳࠄˈᶤѯব䞣ϡ
㛑㾖ᆳࠄDŽ
㔥㒰㒧ᵘⱘ乘ܜᏆⶹˈᑊϨব䞣ৃҹҢ䆁㒗ḋ՟Ёᅠܼ㦋ᕫᯊˈ䗮䖛ᄺдᕫࠄᴵӊὖ
⥛㸼ህ↨䕗ㅔऩњDŽা䳔㽕䈵ᴈ㋴䋱ᮃߚ㉏఼Ё䙷ḋԄ䅵㸼Ёⱘᴵӊὖ⥛乍DŽ
㢹㔥㒰㒧ᵘᏆⶹˈԚা᳝ϔ䚼ߚব䞣ؐ㛑᭄Ё㾖ᆳࠄˈᄺд䯂乬ህೄ䲒ᕫњDŽ䖭
ϔ䯂乬ᶤ⾡ᑺϞ㉏ԐѢҎᎹ⼲㒣㔥㒰Ёᄺд䱤㮣ऩⱘܗᴗؐˈ݊Ё䕧ܹ䕧ߎ㒧⚍ؐ
⬅䆁㒗ḋ՟㒭ߎˈԚ䱤㮣ऩؐⱘܗᣛᅮDŽᅲ䰙ϞˈRusstll et al.˄1995˅ᦤߎњϔϾㅔऩⱘ
ẃᑺϞछ䖛ҹᄺдᴵӊὖ⥛㸼Ёⱘ乍DŽ䖭ϔẃᑺϞछ䖛᧰㋶ϔϾ؛䆒ぎ䯈ˈᅗᇍᑨѢᴵ
ӊὖ⥛㸼Ё᠔᳝ৃ㛑ⱘ乍DŽẃᑺϞछЁ᳔࣪ⱘⳂᷛߑ᭄ᰃ㒭ᅮ؛䆒 h ϟ㾖ᆳࠄ䆁㒗᭄
D ⱘὖ⥛ P(D|h)DŽᣝ✻ᅮНˈᅗᇍᑨѢᇍ㸼乍᧰㋶ᵕԐ✊؛䆒DŽ
6.11.5 䍓ਬᯥ㖇Ⲻụᓜрॽ䇣㓹
w ln P( D | h) P(Yi y ij ,U i u ik | d )
wwijk
¦
d D wijk
˄6.25˅
w ln Ph ( D) w
ln Ph (d )
wwijk wwijk dD
w ln Ph (d )
¦
d D wwijk
1 wPh (d )
¦ P (d )
d D wwijk
h
w ln Ph ( D) 1 w
wwijk
¦ P (d ) ww ¦ P (d | y
d D
h ij ' , u ik ' ) Ph ( y ij ' , u ik ' )
h ijk j ', k '
1 w
¦ P (d ) ww ¦ P (d | y
d D
h ij ' , u ik ' ) Ph ( y ij ' | u ik ' ) Ph (u ik ' )
h ijk j ', k '
᳔ৢϔℹᴹ㞾Ѣὖ⥛ⱘЬ⊩݀ᓣˈ㾕㸼 6-1DŽ⦄㗗㰥Ϟ䴶᳔ৢϔᓣ᳔ে䖍ⱘࡴ乍DŽ
㒭ᅮњwijk įPh(yij|uik)ˈℸࡴЁᚳϔ w ϡㄝѢ 0 ⱘ乍ᰃ݊Ёj´=ji´=iⱘ乍ˈℸ˖
wwijk
w ln Ph ( D) 1 w
wwijk
¦ P (d ) ww
d D
Ph (d | yij , uik ) Ph ( yij | uik ) Ph (uik )
h ijk
1 w
¦ P (d ) ww
dD
Ph (d | yij , uik ) wijk Ph (uik )
h ijk
1
¦ P (d ) P (d | y , u
d D
h ij ik ) Ph (uik )
h
ᑨ⫼䋱ᮃ݀ᓣᴹ䞡ݭPh(d|yij,uik)ৃᕫ
Ph ( yij , uik | d )
¦
dD Ph ( yij | uik )
Ph ( yij , uik | d )
¦
d D wijk
˄6.26˅
Ph ( y ij , u ik | d )
wijk m wijk K ¦
d D wijk
݊Ё¨ᰃϔᇣⱘᐌ䞣ˈ⿄Ўᄺд⥛DŽ݊ˈݡᇚᴗؐwijkᔦϔ࣪ˈҹֱ䆕Ϟ䴶ⱘ䰤ࠊᕫ
ࠄ⒵䎇DŽབRussell᠔ᦣ䗄ⱘ䙷ḋˈ䖭ϔ䖛ᇚᬊᬯࠄ䋱ᮃ㔥㒰Ёⱘᴵӊὖ⥛ⱘϔϾሔ䚼ⱘ
ᵕԐ✊؛䆒DŽ
བ݊ҪѢẃᑺⱘᮍ⊩Ё䙷ḋˈ䆹ㅫ⊩াֱ䆕ᇏᡒࠄሔ䚼᳔Ӭ㾷DŽ᳓ҷẃᑺϞछⱘϔ
Ͼㅫ⊩ᰃ EM ㅫ⊩ˈᅗ 6.12 㡖Ё䅼䆎ˈᅗгাᡒሔ䚼ᵕৃ㛑ᗻⱘ㾷DŽ
6.11.6 ᆜҖ䍓ਬᯥ㖇Ⲻ㔉ᶺ
6.12 EM ㇍⌋
䆌ᅲ䰙ⱘᄺд䯂乬ḚᶊЁˈⳌ݇ᅲ՟⡍ᕕЁা᳝ϔ䚼ߚৃ㾖ᆳࠄDŽ՟བˈ䆁㒗
Փ⫼ 6-3 Ёⱘ䋱ᮃ㕂ֵ㔥ᯊˈৃ㛑㔥㒰ব䞣 Storm, Lighting, Thunder, ForestFire, Campfire
BusTourGroup Ёা᳝݊ϔϾᄤ䲚㛑᭄Ё㾖ᆳࠄDŽᏆ᳝䆌ᮍ⊩㹿ᦤߎ⫼ᴹ໘⧚ᄬ
㾖ᆳࠄব䞣ᯊⱘ䯂乬DŽབ 3 ゴⳟࠄⱘˈ㢹ᶤѯব䞣᳝ᯊ㛑㾖ᆳࠄˈ᳝ᯊϡ㛑ˈ䙷Мৃ
ҹ⫼㾖ᆳࠄⱘᅲ՟এ乘⌟㾖ᆳࠄⱘDŽᴀ㡖Ёᦣ䗄 EM ㅫ⊩˄ Dempster et al. 1977˅ˈ䖭
ᰃᄬ䱤ব䞣ᯊᑓ⊯Փ⫼ⱘϔ⾡ᄺдᮍ⊩DŽEM ㅫ⊩ৃ⫼Ѣব䞣ⱘؐҢᴹ≵᳝㹿Ⳉ㾖ᆳ
ࠄⱘᚙᔶˈা㽕䖭ѯব䞣᠔䙉ᕾⱘὖ⥛ߚᏗⱘϔ㠀ᔶᓣᏆⶹDŽEM ㅫ⊩Ꮖ㹿⫼Ѣ䆁㒗䋱ᮃ
㕂ֵ㔥˄㾕 Heckerman 1995˅ҹঞ 8.4 㡖䅼䆎ⱘᕘߑ᭄˄radial basis function˅㔥㒰DŽ
EM ㅫ⊩䖬ᰃ䆌䴲ⲥⴷ㘮㉏ㅫ⊩ⱘ⸔˄བ Cheeseman et al. 1988˅ˈ㗠Ϩᅗᰃ⫼Ѣᄺд䚼
ߚৃ㾖ᆳ偀ᇨৃൟ˄Partially Observable Markov Model˅ⱘᑓ⊯Փ⫼ⱘ Baum-Welch ࠡ
ৢㅫ⊩ⱘ⸔˄Rabiner 1989˅DŽ
6.12.1 զ䇗 k Ѡ 儎ᯥ࠼ᐹⲺൽٲ
ҟ㒡EMㅫ⊩᳔ᮍ֓ⱘᮍ⊩ᰃ䗮䖛ϔϾ՟ᄤDŽ㗗㰥᭄Dᰃϔᅲ՟䲚ড়ˈᅗ⬅kϾϡৠℷ
ᗕߚᏗⱘ⏋ড়᠔ᕫߚᏗ᠔⫳៤DŽ䆹䯂乬Ḛᶊ 6-4 Ё⼎ߎˈ݊Ёk=2 㗠Ϩᅲ՟Ў⊓ⴔx䕈ᰒ
⼎ⱘ⚍DŽ↣Ͼᅲ՟Փ⫼ϔϾϸℹ偸䖛ᔶ៤DŽ佪ܜњ䱣ᴎ䗝ᢽkϾℷᗕߚᏗ݊ЁПϔDŽ݊
䱣ᴎব䞣xiᣝ✻ℸ䗝ᢽⱘߚᏗ⫳៤DŽ䖭ϔ䖛ϡᮁ䞡ˈ⫳៤ϔ㒘᭄⚍བ᠔⼎DŽЎՓ䅼
䆎ㅔऩ࣪ˈ៥Ӏ㗗㰥ϔϾㅔऩᚙᔶˈेऩϾℷᗕߚᏗⱘ䗝ᢽѢ㒳ϔⱘὖ⥛䖯㸠䗝ᢽˈᑊϨ
kϾℷᗕߚᏗ᳝ⳌৠⱘᮍᏂ³2ˈϨ³2ᏆⶹDŽᄺдӏࡵᰃ䕧ߎϔϾ؛䆒h=<1…k>ˈᅗᦣ䗄
њkϾߚᏗЁ↣ϔϾߚᏗⱘഛؐDŽ៥ӀᏠᳯᇍ䖭ѯഛؐᡒࠄϔϾᵕԐ✊؛䆒ˈेϔϾՓ
P(D|h)᳔࣪ⱘ؛䆒hDŽ
原书页码: 192
6-4 ⬅ϸϾ᳝ⳌㄝᮍᏂ³2ⱘℷᗕߚᏗⱘ⏋ড়⫳៤ⱘᅲ՟䲚DŽ
m
P ML arg min ¦ ( xi P ) 2 ˄6.27˅
P i 1
ℸᚙމϟˈ䇃Ꮒᑇᮍᰃ⬅ḋᴀഛ᳔ؐᇣ࣪ⱘ˖
1 m
P ML ¦ xi
mi1
˄6.28˅
✊㗠ˈ䖭䞠៥Ӏⱘ䯂乬⍝ঞࠄkϾϡৠℷᗕߚᏗⱘ⏋ড়ˈ㗠Ϩ៥Ӏϡ㛑ⶹ䘧ાϾᅲ՟
ᰃાϾߚᏗѻ⫳ⱘDŽℸ䖭ᰃϔϾ⍝ঞ䱤㮣ব䞣ⱘൟ՟ᄤDŽ 6-4 ⱘ՟ᄤЁˈৃᡞ↣Ͼ
ᅲ՟ⱘᅠᭈᦣ䗄ⳟᰃϝܗ㒘<xi, zi1, zi2>ˈ݊ЁxiᰃiϾᅲ՟ⱘ㾖⌟ؐˈzi1zi2㸼⼎ϸϾℷ
ᗕߚᏗЁાϾ㹿⫼Ѣѻ⫳ؐxiDŽ⹂ߛഄ䆆ˈzijxi⬅jϾℷᗕߚᏗѻ⫳ᯊؐЎ 1ˈ৺߭Ў 0DŽ
䖭䞠xiᰃᅲ՟ⱘᦣ䗄ЁᏆ㾖ᆳࠄⱘব䞣ˈzi1zi2ᰃ䱤㮣ব䞣DŽབᵰzi1zi2ⱘؐৃⶹˈህৃҹ
⫼ᓣ 6.27 ᴹ㾷އഛؐ12DŽЎᅗӀⶹˈℸ៥Ӏা㛑⫼EMㅫ⊩DŽ
EMㅫ⊩ᑨ⫼Ѣ៥Ӏⱘkഛؐ䯂乬ˈⳂⱘᰃ᧰㋶ϔϾᵕԐ✊؛䆒ˈᮍ⊩ᰃḍᔧࠡ؛䆒
<1…k>ϡᮁഄݡԄ䅵䱤㮣ব䞣zijⱘᳳᳯؐDŽ✊ৢ⫼䖭ѯ䱤㮣ব䞣ⱘᳳᳯؐ䞡ᮄ䅵ㅫᵕ
Ԑ✊؛䆒DŽ䖭䞠佪ᦣܜ䗄䖭ϔᅲ՟࣪ⱘEMㅫ⊩ˈҹৢᇚ㒭ߎEMㅫ⊩ⱘϔ㠀ᔶᓣDŽ
ℹ偸 1˖䅵ㅫ↣Ͼ䱤㮣ব䞣zijⱘᳳᳯؐE[zij]ˈ؛ᅮᔧࠡ؛䆒h=<1, 2>៤ゟDŽ
ℹ偸 2˖䅵ㅫϔϾᮄⱘᵕԐ✊؛䆒h´=<1´, 2´>ˈ؛ᅮ⬅↣Ͼ䱤㮣ব䞣zij᠔পⱘؐ
Ў 1 ℹЁᕫࠄⱘᳳᳯؐE[zij]ˈ✊ৢᇚ؛䆒h=<1, 2>᳓ᤶЎᮄⱘ؛䆒h´=<1´, 2´>ˈ
✊ৢᕾ⦃DŽ
p( x xi | P Pj)
E[ zij ]
¦
2
n 1
p( x xi | P Pn )
1
( xi P j ) 2
2V 2
e
1
( xi P n ) 2
¦
2
2V 2
n 1
e
ℸϔℹৃ⬅ᇚᔧࠡؐ<1, 2>ᏆⶹⱘxiҷܹࠄϞᓣЁᅲ⦄DŽ
¦
m
E[ zij ]xi
Pj m i 1
¦
m
i 1
E[ zij ]
Ϟ䴶Ԅ䅵kϾℷᗕߚᏗഛؐⱘㅫ⊩ᦣ䗄њEMᮍ⊩ⱘ㽕⚍˖ेᔧࠡⱘ؛䆒⫼ѢԄ䅵ⶹব
䞣ˈ㗠䖭ѯব䞣ⱘᳳᳯؐݡ㹿⫼Ѣᬍ䖯؛䆒DŽৃҹ䆕ᯢˈℸㅫ⊩ϔᕾ⦃ЁˈEMㅫ⊩
㛑ՓԐ✊ᗻP(D|h)ࡴˈ䰸䴲ᅗᏆ䖒ࠄሔ䚼ⱘ᳔DŽℸ䆹ㅫ⊩ᬊᬯࠄᇍѢ<1, 2>ⱘϔ
Ͼሔ䚼ᵕৃ㛑ᗻ؛䆒DŽ
6.12.2 EM ㇍⌋Ⲻж㡢㺞䘦
Ϟ䴶ⱘEMㅫ⊩䩜ᇍⱘᰃԄ䅵⏋ড়ℷᗕߚᏗഛؐⱘ䯂乬DŽϔ㠀ഄˈEMㅫ⊩ৃ⫼Ѣ䆌
䯂乬Ḛᶊˈ݊Ё䳔㽕Ԅ䅵ϔ㒘ᦣ䗄ޚὖ⥛ߚᏗⱘখ᭄©ˈা㒭ᅮњ⬅ℸߚᏗѻ⫳ⱘܼ䚼᭄
Ё㛑㾖ᆳࠄⱘϔ䚼ߚDŽϞ䴶ⱘѠഛؐ䯂乬Ёˈᛳ݈䍷ⱘখ᭄Ў©=<1, 2>ˈ㗠ܼ䚼
᭄Ўϝܗ㒘<xi, zi1, zi2>ˈ㗠া᳝xiৃ㾖ᆳࠄˈϔ㠀ഄҸX=<x1, …, xm>ҷ㸼ৠḋⱘᅲ՟Ё
㾖ᆳࠄⱘ᭄ˈᑊҸY=XĤZҷ㸼ܼԧ᭄DŽ⊼ᛣࠄ㾖ᆳࠄⱘZৃ㹿ⳟϔ䱣ᴎব䞣ˈᅗ
ⱘὖ⥛ߚᏗձ䌪Ѣⶹখ᭄©Ꮖⶹ᭄XDŽ㉏ԐഄˈYᰃϔ䱣ᴎব䞣ˈЎᅗᰃ⬅䱣ᴎব
䞣ZᴹᅮНⱘDŽᴀ㡖ⱘৢ㓁䚼ߚˈᇚᦣ䗄EMㅫ⊩ⱘϔ㠀ᔶᓣDŽՓ⫼hᴹҷ㸼খ᭄©ⱘ؛䆒
ؐˈ㗠h´ҷ㸼EMㅫ⊩ⱘ↣䗁ҷЁׂᬍⱘ؛䆒DŽ
EM ㅫ⊩䗮䖛᧰ᇏՓ E[lnP(Y|h´)]᳔ⱘ h´ᴹᇏᡒᵕԐ✊؛䆒 h´DŽℸᳳᳯؐᰃ Y ᠔
䙉ᕾⱘὖ⥛ߚᏗϞ䅵ㅫˈℸߚᏗ⬅ⶹখ᭄©⹂ᅮDŽ㗗㰥ℸ㸼䖒ᓣおコᛣੇњҔМDŽ佪ܜ
P(Y|h´)ᰃ㒭ᅮ؛䆒 h´ϟܼ䚼᭄ Y ⱘԐ✊ᗻDŽ݊ড়⧚ᗻѢ៥Ӏ㽕ᇏᡒϔϾ h´Փ䆹䞣ⱘᶤ
ߑ᳔᭄ؐ࣪DŽ݊Փ䆹䞣ⱘᇍ᭄ lnP(Y|h´)᳔࣪гՓ P(Y|h´)᳔࣪ˈབᏆ㒣ҟ㒡䖛ⱘ䙷ḋDŽ
ϝˈᓩܹᳳᳯؐ E[lnP(Y|h´)]ᰃЎܼ䚼᭄ Y ᴀ䑿гᰃϔ䱣ᴎব䞣DŽᏆⶹܼ䚼᭄ Y ᰃ
㾖ᆳࠄⱘ X 㾖ᆳࠄⱘ Z ⱘড়ᑊˈ៥Ӏᖙ乏㾖ᆳࠄⱘ Z ⱘৃ㛑ؐϞপᑇഛˈᑊҹⳌ
ᑨⱘὖ⥛ЎᴗؐDŽᤶ㿔Пˈ㽕䱣ᴎব䞣 Y 䙉ᕾⱘὖ⥛ߚᏗϞপᳳᳯؐ E[lnP(Y|h´)]DŽ䆹ߚ
Ꮧ⬅ᅠܼᏆⶹⱘ X ؐࡴϞ Z ᳡ҢⱘߚᏗᴹ⹂ᅮDŽ
Y 䙉Ңⱘὖ⥛ߚᏗᰃҔМ˛ϔ㠀ᴹ䇈ϡ㛑ⶹ䘧ℸߚᏗˈЎᅗᰃ⬅ᕙԄ䅵ⱘ©খ᭄⹂ᅮ
ⱘDŽ✊㗠ˈEM ㅫ⊩Փ⫼݊ᔧࠡⱘ؛䆒 h ҷ᳓ᅲ䰙খ᭄©ˈҹԄ䅵 Y ⱘߚᏗDŽ⦄ᅮНϔߑ᭄
Q(h´|h)ˈᅗᇚ E[lnP(Y|h´)]Ў h´ⱘϔϾߑ᭄㒭ߎˈ©=h ܼ䚼᭄ Y ⱘ㾖ᆳࠄⱘ䚼ߚ X
ⱘ؛ᅮПϟDŽ
6.12.3 k-ൽٲ㇍⌋Ⲻ᧞ሲ
㽕ᑨ⫼EMㅫ⊩ˈᖙ乏ᇐߎৃ⫼Ѣk-ഛؐ䯂乬ⱘ㸼䖒ᓣQ(h´|h)DŽ佪ܜᇐߎlnp(Y|h´)
ⱘ㸼䖒ᓣDŽ⊼ᛣᇍ↣Ͼᅲ՟yi=<xi, zi1, …, zik>ⱘὖ⥛p(yi|h´)ৃ㹿ݭ˖
1
¦ j 1 z ij ( xi P ' j ) 2
k
1
2V 2
p( yi | h' ) p( xi , zi1 ,..., zik | h' ) e
2SV 2
m
ln P(Y | h' ) ln p ( yi | h' )
i 1
¦ ln p( y | h' )
i 1
i
§m
1 1 k ·
¦ ¨
¨
i 1©
ln ¦
2SV 2 2V j 1
2
z ij ( xi P ' j ) 2
¸
¸
¹
᳔ৢˈᖙ乏Y᠔䙉Ңⱘὖ⥛ߚᏗˈгህᰃYⱘ㾖ᆳࠄ䚼ߚzij䙉Ңⱘὖ⥛ߚᏗϞˈ䅵ㅫ
ℸlnP(Y|h´)ⱘഛؐDŽ⊼ᛣϞ䴶lnP(Y|h´)ⱘ㸼䖒ᓣЎ䖭ѯzijⱘ㒓ᗻߑ᭄DŽϔ㠀ⱘˈᇍZⱘӏᛣ㒓
ᗻߑ᭄f(z)ᴹ䇈ˈϟ䴶ⱘㄝᓣ៤ゟ˖
E[f(z)]=f(E[z])
ḍℸㄝᓣˈৃᕫ˖
ªm § 1 1 k ·º
E[ln P (Y | h' )] E «¦ ¨¨ ln 2 ¦ zij ( xi P ' j ) 2 ¸¸»
«¬ i 1 © 2SV 2 2V j 1 ¹¼»
§m
1 1 k ·
¦ ¨
¨
i 1©
ln ¦
2SV 2 2V j 1
2
E[ zij ]( xi P ' j ) 2 ¸¸
¹
ὖᣀഄ䇈ˈk-ഛؐ䯂乬Ёߑ᭄ Q(h´|h)Ў
m § 1 1 k ·
Q ( h'| h) ¦ ¨¨ ln 2SV 2
2V 2 ¦ E[ z ij ]( xi P ' j ) 2 ¸¸
i 1 © j 1 ¹
݊Ёh´=<1´, …, k´>ˈ㗠E[zij]Ѣᔧࠡ؛䆒h㾖ᆳࠄⱘ᭄X䅵ㅫᕫߎDŽབࠡ᠔䅼
䆎˖
1
( xi P j ) 2
2V 2
e
E[ zij ] 1
(6.29)
( xi P n ) 2
¦
k
2V 2
n 1
e
m § ·
1 1 k
arg max Q(h'| h) arg max ¦ ¨¨ ln ¦ E[ z ]( x P ' ) 2
¸
¸
2SV 2 2V j 1
2 ij i j
h' h' i 1© ¹
m k
arg min ¦¦ E[ zij ]( xi P ' j ) 2 ˄6.30˅
h' i 1 j 1
ℸˈ䖭䞠ⱘᵕԐ✊؛䆒Փᑇᮍ䇃Ꮒⱘࡴᴗ᳔ᇣ࣪њˈ݊Ё↣Ͼᅲ՟xiᇍ䇃Ꮒⱘ䋵
⤂j´ᴗ䞡ЎE[zij]DŽ⬅ㄝᓣ 6.30 㒭ߎⱘ䞣ᰃ䗮䖛ᇚ↣Ͼj´䆒Ўࡴᴗḋᴀഛؐᴹ᳔ᇣ࣪DŽ
¦
m
E[ zij ]xi
Pj m i 1
˄6.31˅
¦
m
i 1
E[ zij ]
6.13 ቅ㔉ૂ㺛ݻ䈱⢟
ᴀゴⱘ㽕⚍ࣙᣀ˖
ὖ⥛ᄺдᮍ⊩߽⫼˄ᑊϨ㽕∖˅݇Ѣϡৠ؛䆒ⱘܜ偠ὖ⥛ҹঞ㒭ᅮ؛䆒ᯊ㾖ᆳࠄ
ϡৠ᭄ⱘὖ⥛ⱘⶹ䆚DŽ䋱ᮃᮍ⊩߭ᦤկњὖ⥛ᄺдᮍ⊩ⱘ⸔DŽ䋱ᮃᮍ⊩䖬
ৃѢ䖭ѯܜ偠᭄㾖ᆳ؛ᅮˈ䌟ќ↣Ͼ䗝؛䆒ϔϾৢ偠ὖ⥛DŽ
䋱ᮃᮍ⊩ৃ⫼Ѣ⹂ᅮ㒭ᅮ᭄ᯊ᳔ৃ㛑ⱘ؛䆒üüᵕৢ偠ὖ⥛˄MAP˅؛
䆒DŽᅗ↨݊Ҫⱘ؛䆒ৃ㛑៤Ў᳔Ӭ؛䆒DŽ
䋱ᮃ᳔Ӭߚ㉏఼ᇚ᠔᳝؛䆒ⱘ乘⌟㒧ড়䍋ᴹˈᑊҹ݊ৢ偠ὖ⥛Ўᴗ䞡ˈҹ䅵ㅫᇍ
ᮄᅲ՟ⱘ᳔ৃ㛑ߚ㉏DŽ
ᴈ㋴䋱ᮃߚ㉏఼ᰃ䆌ᅲ䰙ᑨ⫼䯂乬Ёᕜ᳝⫼ⱘϔ⾡䋱ᮃᄺдᮍ⊩DŽᅗ㹿⿄
Ўᴈ㋴ⱘ˄naive˅ᰃЎ݊ⱘㅔ࣪؛ᅮ˖ሲᗻؐ㒭ᅮᅲ՟ⱘߚ㉏ᯊᴵӊ⣀ゟDŽ
ᔧ䆹؛ᅮ៤ゟᯊˈᴈ㋴䋱ᮃߚ㉏఼ৃ䕧ߎ MAP ߚ㉏DŽेՓℸ؛ᅮϡ៤ゟˈᄺ
дߚ㉏᭛ᴀⱘᚙމϟˈᴈ㋴䋱ᮃߚ㉏䗮ᐌгᰃᕜ᳝ᬜⱘDŽ䋱ᮃ㕂ֵ㔥ᇍѢሲᗻ
ⱘᄤ䲚Ϟⱘϔ㒘ᴵӊ⣀ゟᗻ؛ᅮᦤկњᔎⱘ㸼䖒㛑DŽ
䋱ᮃ⧚Ḛᶊৃᇍ݊ҪϡⳈᑨ⫼䋱ᮃ݀ᓣⱘᄺдᮍ⊩ⱘߚᵤᦤկ⧚䆎⸔DŽ
՟བˈ⡍ᅮᴵӊϟᄺдϔϾᇍᑨѢᵕԐ✊؛䆒ⱘᅲؐⳂᷛߑ᭄ᯊˈᅗৃՓ䇃Ꮒ
ᑇᮍ᳔ᇣ࣪DŽ
᳔ᇣᦣ䗄䭓ᑺ߭ޚᓎ䆂䗝প䖭ḋⱘ؛䆒ˈᅗՓ؛䆒ⱘᦣ䗄䭓ᑺ㒭ᅮ؛䆒ϟ᭄ⱘ
ᦣ䗄䭓ᑺⱘ᳔ᇣ࣪DŽ䋱ᮃ݀ᓣֵᙃ䆎Ёⱘᴀ㒧䆎ৃᦤկℸⱘ߭ޚḍDŽ
䆌ᅲ䰙ⱘᄺд䯂乬ЁˈᶤѯⳌ݇ⱘᅲ՟ব䞣ᰃϡৃ㾖ᆳࠄⱘDŽEM ㅫ⊩ᦤկњ
ϔϾᕜ䗮⫼ⱘᮍ⊩ˈᔧᄬ䱤㮣ব䞣ᯊ䖯㸠ᄺдDŽ䆹ㅫ⊩ᓔྟѢϔϾӏᛣⱘ߱ྟ؛
䆒DŽ✊ৢ䗁ҷഄ䅵ㅫ䱤㮣ব䞣ⱘᳳᳯؐ˄؛ᅮᔧࠡ؛䆒ᰃℷ⹂ⱘ˅ˈݡ䞡ᮄ䅵ㅫᵕ
Ԑ✊؛䆒˄؛ᅮ䱤㮣ব䞣ㄝѢ 1 ℹЁᕫࠄⱘᳳᳯؐ˅DŽ䖭ϔ䖛ᬊᬯࠄϔϾሔ
䚼ⱘᵕԐ✊؛䆒ˈҹঞ䱤㮣ব䞣ⱘԄ䅵ؐDŽ
Cestnik(1990)䅼䆎њՓ⫼ m-Ԅ䅵ᴹԄ䅵ὖ⥛DŽ
6.5 㗗㰥ᇚ᳔ᇣᦣ䗄䭓ᑺ߭ޚᑨ⫼ࠄϔϾ؛䆒ぎ䯈Hˈᅗࣙ㟇nϾᏗᇨሲᗻⱘড়প
˄བ˖SunnyġWarm˅DŽ؛ᅮ↣Ͼ؛䆒ⱘ㓪ⷕЎㅔऩഄᇚ؛䆒Ёߎ⦄ⱘሲᗻ߫Вߎᴹˈ݊Ё
Ўњ㓪ⷕӏᛣϔϾnᏗᇨሲᗻ᠔䳔ԡ᭄Ўlog2nDŽ䆒ᛇ㒭ᅮ؛䆒ϟḋ՟㓪ⷕᮍᓣЎ˖㢹ḋ՟Ϣ
؛䆒ϔ㟈㓪ⷕ䳔 0 ԡˈ৺߭⫼log2mԡ˄㸼⼎mϾḋ՟Ёાѯ㹿䇃ߚ㉏њüüℷ⹂ⱘߚ㉏ৃ
⬅䆹؛䆒乘⌟ⱘؐⱘ৺ᅮᕫࠄ˅DŽ
(a)ߎݭ㽕㹿᳔ᇣ࣪ⱘ䞣ⱘ㸼䖒ᓣˈᣝ✻᳔ᇣᦣ䗄䭓ᑺ߭ޚDŽ
ᵜㄐ⨶䇪ൠ⭫Ҷ㤕ᒢ㊫රⲴᵪಘᆖҐ䰞仈ѝⲴഠ䳮ˈ઼㤕ᒢ㊫රⲴᵪಘᆖҐ㇇⌅Ⲵ㜭
࣋DŽ䈕⨶䇪㠤࣋ҾഎㆄྲлⲴ䰞仈˖Ā൘ӰѸṧⲴᶑԦлᡀ࣏ⲴᆖҐᱟਟ㜭Ⲵ˛āԕ৺Ā൘
ӰѸᶑԦла⢩ᇊⲴᆖҐ㇇⌅ਟ؍䇱ᡀ࣏䘀㹼˛āѪҶ࠶᷀ᆖҐ㇇⌅ˈ䘉䟼㘳㲁ҶєṶᷦDŽ
൘ਟ㜭䘁լ↓⺞˄PAC˅ṶᷦлˈᡁԜ⺞ᇊҶ㤕ᒢٷ䇮㊫࡛ˈࡔᯝᆳԜ㜭Ӿཊ亩ᔿᮠ䟿Ⲵ
䇝㓳ṧֻѝᆖҐᗇࡠ˗ᡁԜ䘈ᇊѹҶањሩٷ䇮オ䰤Ⲵ㠚❦ᓖ䟿ˈ⭡ᆳਟԕ⭼ᇊᖂ㓣ᆖҐᡰ
䴰Ⲵ䇝㓳ṧֻᮠⴞDŽ൘ࠪ䭉⭼䲀˄Mistake bound˅ṶᷦлˈᡁԜ㘳ḕҶањᆖҐಘ൘⺞ᇊ↓
⺞ٷ䇮ࡽਟ㜭ӗ⭏Ⲵ䇝㓳䭉䈟ᮠ䟿DŽ
7.1 ԁ㔃
൘⹄ウᵪಘᆖҐ䗷〻ѝˈᖸ㠚❦ൠᜣ⸕䚃ᆖҐಘ˄ᵪಘⲴᡆ䶎ᵪಘⲴ˅ᓄ䚥ᗚӰѸṧⲴ
㿴ࡉDŽᱟਟ㜭⤜・ҾᆖҐ㇇⌅⺞ᇊᆖҐ䰞仈ѝപᴹⲴ䳮ᓖ˛㜭⸕䚃Ѫ؍䇱ᡀ࣏ⲴᆖҐᴹ
ཊቁ䇝㓳ᱟᗵ㾱Ⲵᡆݵ䏣Ⲵ˛ྲ᷌ᆖҐಘ㻛ݱ䇨ੁᯭᮉ㘵ᨀࠪḕ䈒ˈ㘼нᱟ㿲ሏ䇝㓳䳶Ⲵ䲿
ᵪṧᵜˈՊሩᡰ䴰ṧֻᮠⴞᴹᘾṧⲴᖡ૽˛㜭⭫ࠪᆖҐಘ൘ᆖࡠⴞḷ࠭ᮠࡽՊᴹཊቁ⅑
ࠪ䭉˛㜭⭫ࠪа㊫ᆖҐ䰞仈ѝപᴹⲴ䇑㇇༽ᵲᓖ˛
㲭❦ሩᡰᴹ䘉Ӌ䰞仈Ⲵа㡜എㆄ䘈ᵚ⸕ˈնᱟнᆼᮤⲴᆖҐ䇑㇇⨶䇪ᐢ㓿ᔰࠪ⧠DŽᵜ
ㄐ䱀䘠Ҷ䈕⨶䇪ѝⲴаӋޣ䭞㔃䇪ˈᒦᨀҶ൘⢩ᇊ䰞仈лаӋ䰞仈ⲴㆄṸDŽ䘉䟼ᡁԜ⵰䟽
䇘䇪ਚ㔉ᇊⴞḷ࠭ᮠⲴ䇝㓳ṧ઼ֻى䘹ٷ䇮オ䰤ⲴᶑԦлˈሩ䈕ᵚ⸕Ⲵⴞḷ࠭ᮠⲴᖂ㓣ᆖҐ
䰞仈DŽ൘䘉ṧⲴṶᷦлˈѫ㾱㾱䀓ߣⲴ䰞仈ྲ˖䴰㾱ཊቁ䇝㓳ṧֻ䏣ԕᡀ࣏ൠᆖҐࡠⴞḷ
࠭ᮠˈԕ৺ᆖҐಘ൘䗮ࡠⴞḷࡽՊᴹཊቁ⅑ࠪ䭉DŽྲਾ䶒ሶⴻࡠˈᴹਟ㜭ሩ䘉Ӌ䰞仈ᨀࠪᇊ
䟿Ⲵкл⭼ˈ䘉สҾᆖҐ䰞仈ⲴྲлᙗDŽ
x ᆖҐಘᡰ㘳㲁Ⲵٷ䇮オ䰤Ⲵབྷሿ઼༽ᵲᓖ
x ⴞḷᾲᘥ享䘁լࡠᘾṧⲴ㋮ᓖ
x ᆖҐಘ䗃ࠪᡀ࣏Ⲵٷ䇮Ⲵਟ㜭ᙗ
x 䇝㓳ṧֻᨀ㔉ᆖҐಘⲴᯩᔿ
ᵜㄐⲴབྷ䜘࠶ሶнՊ⵰䟽Ҿঅ⤜ⲴᆖҐ㇇⌅ˈ㘼ᱟ൘䖳ᇭᒯⲴᆖҐ㇇⌅㊫࡛ѝ⭫ᡰ㘳
㲁Ⲵٷ䇮オ䰤ˈԕ৺䇝㓳ṧֻⲴᨀᯩᔿㅹDŽᡁԜⲴⴞḷᱟѪҶഎㆄԕлⲴ䰞仈˖
x ṧᵜ༽ᵲᓖ˄Sample complexity˅DŽᆖҐಘ㾱᭦ᮋࡠᡀ࣏ٷ䇮˄ԕ䖳儈Ⲵᾲ⦷˅ˈ
䴰㾱ཊቁ䇝㓳ṧֻ˛
x 䇑㇇༽ᵲᓖ(Computational complexity)DŽᆖҐಘ㾱᭦ᮋࡠᡀ࣏ٷ䇮˄ԕ䖳儈Ⲵᾲ
⦷˅䴰㾱ཊབྷⲴ䇑㇇䟿˛
x ࠪ䭉⭼䲀˄Mistake bound˅DŽ൘ᡀ࣏᭦ᮋࡠањٷ䇮ࡽˈᆖҐಘሩ䇝㓳ṧֻⲴ
䈟࠶㊫ᴹཊቁ⅑˛
⌘ѪҶ䀓ߣ䘉Ӌ䰞仈䴰㾱䇨ཊ⢩↺ⲴᶑԦ䇮ᇊDŽֻྲˈᴹ䇨ཊᯩ⌅ᶕᤷᇊሩҾᆖҐಘ
ӰѸᱟĀᡀ࣏ⲴāDŽаਟ㜭Ⲵࡔᯝᯩ⌅ᱟ˖ᆖҐಘᱟ䗃ࠪㅹҾⴞḷᾲᘥⲴٷ䇮DŽਖа
ᯩ⌅ᱟਚ㾱≲䗃ࠪⲴٷ䇮оⴞḷᾲᘥ൘ཊᮠᰦ䰤㿱а㠤ˈᡆᱟᆖҐಘ䙊ᑨՊ䗃ࠪ䘉ṧⲴ
ٷ䇮DŽլൠˈ䘈ᗵ享ᤷᇊᆖҐಘᱟྲօ㧧ᗇ䇝㓳ṧֻⲴDŽਟԕᤷᇊ䇝㓳ṧֻ⭡ањᯭᮉ㘵
㔉ࠪˈᡆ⭡ᆖҐಘ㠚ᐡᇎ傼ᶕ㧧ᗇˈᡆ᤹➗Ḁ䗷〻䲿ᵪൠ⭏ᡀ㘼нਇᆖҐಘⲴ᧗ࡦDŽਟԕ亴
ᯉˈሩк䘠䰞仈Ⲵഎㆄ䎆ҾᡁԜᡰ㘳㲁Ⲵ⢩ᇊṶᷦᡆᆖҐ⁑රDŽ
7.2 ਥ㜳ᆜҖ䘇ղ↙⺤ٽ䇴
7.2.1 䰤从Ṽᷬ
൘↔ṶᷦлˈᡁԜᝏޤ䏓Ⲵᱟ⭫н਼ᆖҐಘ L Ⲵᙗ㜭ˈ䘉ӋᆖҐಘ֯⭘н਼ٷ䇮オ
䰤 HˈᒦᆖҐн਼㊫࡛Ⲵ C ѝⲴⴞḷᾲᘥDŽ⭡ҾᡁԜ㾱≲ L 䏣ཏа㡜ˈԕӾ C ѝᆖࡠԫօ
ⴞḷᾲᘥˈᡰԕн䇪䇝㓳ṧֻⲴ࠶ᐳྲօˈᡁԜ㓿ᑨՊሩ C ѝᡰᴹਟ㜭Ⲵⴞḷᾲᘥ઼ᡰᴹ
ਟ㜭Ⲵᇎֻ࠶ᐳ D 䘋㹼ᴰᐞᛵߥⲴ࠶᷀DŽ
7.2.2 ٽ䇴Ⲻ䭏䈥⦽
插图——原书页码:205
ᴰਾˈ⌘hሩᓄҾcⲴ䭉䈟⦷н㜭ⴤ᧕⭡ᆖҐಘ㿲ሏࡠDŽLਚ㜭㿲ሏࡠ൘䇝㓳ṧֻкh
Ⲵᙗ㜭ˈᆳҏਚ㜭൘↔สк䘹ᤙަٷ䇮䗃ࠪDŽᡁԜሶ֯⭘ᵟ䈝䇝㓳䭉䈟⦷(training error)
ᶕᤷԓ䇝㓳ṧֻѝ㻛h䈟࠶㊫Ⲵṧֻᡰঐ∄ֻˈԕ४࠶к䶒ᇊѹⲴⵏᇎ䭉䈟⦷DŽ䘉䟼ޣҾᆖ
Ґ༽ᵲᓖⲴ࠶᷀ཊᮠത㔅⵰䘉ṧⲴ䰞仈˖Ā hⲴ㿲ሏࡠⲴ䇝㓳䭉䈟⦷ሩⵏᇎ䭉䈟⦷errorD(h)
ӗ⭏н↓⺞ՠ䇑Ⲵਟ㜭ᙗᴹཊབྷ˛ā
⌘↔䰞仈оㅜ 5 ㄐ㘳㲁Ⲵ䰞仈ѻ䰤Ⲵᇶ࠷㚄㌫DŽഎᗶ൘ㅜ 5 ㄐѝᇊѹҶ h ޣҾṧֻ䳶
ਸ S Ⲵṧᵜ䭉䈟⦷ (sample error)ˈѪṧֻ䳶ਸ S ѝ㻛 h 䈟࠶㊫Ⲵṧֻᡰঐ∄ֻDŽк䶒ᇊѹ
Ⲵ䇝㓳䭉䈟⦷ቡᱟᖃ S Ѫ䇝㓳ṧֻ䳶ਸᰦⲴṧᵜ䭉䈟⦷DŽ൘ㅜ 5 ㄐѝˈᡁԜ൘ᮠᦞṧᵜ S
⤜・Ҿ h ᣭਆⲴࡽᨀлˈ⺞ᇊṧᵜ䭉䈟⦷ሩՠ䇑ⵏᇎ䭉䈟⦷ӗ⭏䈟ሬⲴᾲ⦷DŽ❦㘼ᖃ S ᱟ䇝
㓳ᮠᦞ䳶ਸᰦˈᆖࡠⲴٷ䇮䶎ᑨ䎆Ҿ SDŽഐ↔ˈᵜㄐሶ㔉ࠪ䘉а䟽㾱Ⲵ⢩↺ᛵᖒлⲴ࠶᷀DŽ
ᡁԜⲴⴞḷᱟ⭫ࠪ䘉ṧⲴⴞḷᾲᘥˈᆳԜ㜭ཏӾਸ⨶ᮠ䟿Ⲵ䲿ᵪᣭਆ䇝㓳ṧֻѝ䙊䗷
ਸ⨶Ⲵ䇑㇇䟿ਟ䶐ൠᆖҐࡠDŽ
ሩҾਟᆖҐᙗᘾṧ䘋㹼㺘䘠˛аਟ㜭Ⲵ䘹ᤙᱟ᧿䘠ѪҶᆖҐࡠањ֯errorD(h)=0 Ⲵ
ٷ䇮hˈᡰ䴰Ⲵ䇝㓳ṧֻᮠDŽнᒨⲴᱟˈ䘉ṧⲴ䘹ᤙᱟнਟ㹼Ⲵˈഐᴹєњ˖俆ˈݸ䲔䶎
ሩXѝ⇿њਟ㜭Ⲵᇎֻ䜭ᨀ䇝㓳ṧֻ˄ањнᇎ䱵Ⲵٷᇊ˅ˈࡉՊᴹཊњٷ䇮о䇝㓳ṧ
ֻа㠤ˈ㘼фᆖҐಘᰐ⌅؍䇱䘹ᤙࡠⴞḷᾲᘥDŽަ⅑ˈ⭡Ҿ䇝㓳ṧֻᱟ䲿ᵪᣭਆⲴˈᙫᴹа
њ䶎 0 Ⲵᾲ⦷֯ᗇᆖҐಘ䶒ѤⲴ䇝㓳ṧֻᴹ䈟ሬᙗDŽ˄ֻྲˈ㲭❦ᡁԜ㓿ᑨਟ㿱ࡠн਼䓛儈
Ⲵ━䴚㘵ˈն൘Ḁаཙѝᙫᆈ൘䘉ṧⲴᵪՊˈᡰᴹ䇝㓳ṧֻ䜭ࡊྭᱟ 2 ㊣儈DŽ˅
Ѫ䀓ߣ䘉єњഠ䳮ˈᡁԜ⭘єᯩ⌅ᕡॆҶሩᆖҐಘⲴ㾱≲DŽ俆ˈݸᡁԜн㾱≲ᆖҐಘ
䗃ࠪ䴦䭉䈟⦷ٷ䇮ˈ㘼ਚ㾱≲ަ䭉䈟⦷㻛䲀ᇊ൘Ḁᑨᮠ¦Ⲵ㤳തˈ¦ਟѪԫሿDŽㅜҼˈ
н㾱≲ᆖҐಘሩᡰᴹⲴ䲿ᵪᣭਆṧֻᒿࡇ䜭㜭ᡀ࣏ˈਚ㾱≲ަཡ䍕Ⲵᾲ⦷㻛䲀ᇊ൘Ḁњᑨ
ᮠ¥Ⲵ㤳തˈ¥ҏਟਆԫሿDŽㆰ㘼䀰ѻˈᡁԜਚ㾱≲ᆖҐಘਟ㜭ᆖҐࡠањ䘁լ↓⺞Ⲵ
ٷ䇮ˈഐ↔ᗇࡠҶ䈕ᵟ䈝Āਟ㜭䘁լ↓⺞ᆖҐāˈᡆ PAC ᆖҐDŽ
㘳㲁Ḁаⴞḷᾲᘥ㊫࡛C઼֯⭘ٷ䇮オ䰤HⲴᆖҐಘLDŽ䶎ᖒᔿൠˈሩCѝԫⴞḷᾲᘥ
cˈ㤕൘㿲ሏࡠਸ⨶ᮠⴞⲴ䇝㓳ṧֻᒦᢗ㹼Ҷਸ⨶Ⲵ䇑㇇䟿ਾˈLԕᾲ⦷(1- ¥ )䗃ࠪањ
errorD(h)<¦Ⲵٷ䇮hˈࡉᡁԜ〠ᾲᘥ㊫࡛Cᱟ֯⭘HⲴLਟPACᆖҐⲴDŽᴤ㋮⺞Ⲵᇊѹྲл˖
定义: 㘳㲁аᾲᘥ㊫࡛Cᇊѹ൘䮯ᓖѪnⲴᇎֻ䳶ਸXкˈᆖҐಘL֯⭘ٷ䇮オ䰤HDŽ
ᖃሩᡰᴹcęCˈXкⲴ࠶ᐳDˈ¦┑䏣 0<¦<1/2ˈԕ৺¥┑䏣 0<¥<1/2ˈᆖҐಘL
ሶԕ㠣ቁ 1-¥Ⲵᾲ⦷䗃ࠪаٷ䇮hęHˈ֯errorD(h)ݦˈ䘉ᰦ〠Cᱟ֯⭘HⲴLਟPAC
ᆖҐⲴDŽᡰ֯⭘Ⲵᰦ䰤Ѫ 1/¦ˈ1/¥ˈnԕ৺size(c)Ⲵཊ亩ᔿ࠭ᮠDŽ
7.3 ᴿ䲆ٽ䇴グ䰪Ⲻṭᵢགྷᵸᓜ
ྲкᡰ䘠ˈPAC ਟᆖҐᙗᖸབྷ〻ᓖк⭡ᡰ䴰Ⲵ䇝㓳ṧֻᮠ⺞ᇊDŽ䲿⵰䰞仈㿴⁑Ⲵ໎䮯
ᡰᑖᶕⲴᡰ䴰䇝㓳ṧֻⲴ໎䮯〠Ѫ䈕ᆖҐ䰞仈Ⲵṧᵜ༽ᵲᓖ(sample complexity)ˈᆳᱟ䙊ᑨ
ᴰᝏޤ䏓Ⲵ⢩ᙗDŽഐ൘Ҿˈ൘ཊᮠᇎ䱵䰞仈ѝˈᴰ䲀ࡦᆖҐಘᡀ࣏Ⲵഐ㍐ᱟᴹ䲀Ⲵਟ⭘䇝
㓳ᮠᦞDŽ
䘉䟼ሶṧᵜ༽ᵲᓖⲴ䇘䇪䲀ᇊҾа㊫䶎ᑨᒯ⌋ⲴᆖҐಘˈ〠Ѫа㠤ᆖҐಘ(consistent
learner)DŽањᆖҐಘᱟа㠤Ⲵ(consistent)ˈᖃᆳਚ㾱൘ਟ㜭ᰦ䜭䗃ࠪ㜭ᆼ㖾ᤏਸ䇝㓳ᮠᦞⲴ
ٷ䇮DŽ⭡ҾᡁԜ䙊ᑨ䜭ᴤௌ⅒㜭о䇝㓳ᮠᦞᤏਸ〻ᓖᴤ儈Ⲵٷ䇮ˈഐ↔㾱≲ᆖҐ㇇⌅Ⲵа㠤
ᙗᱟਸ⨶ⲴDŽ⌘ࡽ൘ㄐ㢲䇘䇪ⲴᖸཊᆖҐಘˈवᤜㅜ 2 ㄐѝⲴᡰᴹᆖҐ㇇⌅ˈ䜭ᱟа㠤ᆖ
ҐಘDŽ
ᱟ㜭⤜・Ҿа⢩ᇊⲴ㇇⌅ˈ᧘ሬࠪԫа㠤ᆖҐಘᡰ䴰䇝㓳ṧֻᮠⲴ⭼䲀˛എㆄᱟ㛟
ᇊⲴDŽѪ䘋㹼䈕᧘ሬˈ䴰㾱എ亮алㅜ 2 ㄐᇊѹⲴਈරオ䰤DŽ൘䛓䟼ਈරオ䰤VSH, D㻛ᇊѹ
Ѫ㜭↓⺞࠶㊫䇝㓳ṧֻDⲴᡰᴹٷ䇮hęHⲴ䳶ਸ˖
ਈරオ䰤Ⲵ䟽㾱ѹ൘Ҿˈ⇿ња㠤ᆖҐಘ䜭䗃ࠪаҾਈරオ䰤Ⲵٷ䇮ˈ㘼н䇪ᴹᘾ
ṧⲴᇎֻオ䰤Xǃٷ䇮オ䰤Hᡆ䇝㓳ᮠᦞDDŽഐᖸㆰঅˈ⭡ਈරオ䰤ⲴᇊѹˈVSH, Dवਜ਼H
ѝᡰᴹⲴа㠤ٷ䇮DŽഐ↔ˈѪ⭼ᇊԫа㠤ᆖҐಘᡰ䴰Ⲵṧֻᮠ䟿ˈਚ䴰㾱⭼ᇊѪ؍䇱ਈර
オ䰤ѝ⋑ᴹнਟ᧕ਇٷ䇮ᡰ䴰Ⲵṧֻᮠ䟿DŽл䶒Ⲵᇊѹ㋮⺞ൠ᧿䘠Ҷ䘉аᶑԦ˄㿱Haussler
1988˅˖
定义: 㘳㲁аٷ䇮オ䰤Hˈⴞḷᾲᘥcˈᇎֻ࠶ᐳDԕ৺cⲴа㓴䇝㓳ṧֻDDŽᖃVSHˈ
Dѝ⇿њٷ䇮hޣҾc઼D䭉䈟⦷ሿҾ¦ᰦˈਈරオ䰤㻛〠ѪޣҾc઼Dᱟ¦-䈖ቭⲴ˄¦
-exhausted˅DŽ
插图——原书页码:208
മ 7-2 ֯ਈරオ䰤䈖ቭॆ
ਈරオ䰤VSHˈDѪٷ䇮hęHⲴᆀ䳶ˈަѝⲴٷ䇮䜭ᴹ䴦䇝㓳䭉䈟⦷˄൘മѝ㺘⽪Ѫr=0˅DŽᖃ
❦ⵏᇎ䭉䈟⦷errorD(h)˄മѝ㺘⽪Ѫerror˅ਟ㜭䶎 0ˈণ֯䈕ٷ䇮൘ᡰᴹ䇝㓳ᮠᦞѝ䭉䈟Ѫ 0DŽᖃ
ਈරオ䰤ѝᡰᴹٷ䇮h䜭┑䏣errorD(h)<¦ᰦˈਈරオ䰤ᱟ¦-䈖ቭⲴDŽ
H e Hm
䇱᰾˖Ԕh1ˈh2ĂĂhkѪHѝޣҾcⲴⵏᇎ䭉䈟⦷བྷҾ¦Ⲵᡰᴹٷ䇮DŽᖃфӵᖃkњٷ䇮ѝ㠣ቁᴹ
ањᚠྭоᡰᴹmњ⤜・䲿ᵪᣭਆṧֻа㠤ᰦˈн㜭֯ਈරオ䰤¦-䈖ቭॆDŽԫаٷ䇮ⵏᇎ䭉䈟⦷བྷҾ
¦ˈфоањ䲿ᵪᣭਆṧֻа㠤Ⲵਟ㜭ᙗᴰཊѪ(1-¦)DŽഐ↔ˈ䈕ٷ䇮оmњ⤜・ᣭਆṧֻа㠤Ⲵᾲ⦷
ᴰཊѪ(1-¦)mDŽ⭡Ҿᐢ⸕ᴹkњٷ䇮䭉䈟⦷བྷҾ¦ˈ䛓Ѹ㠣ቁᴹањоᡰᴹmњ䇝㓳ṧֻ䜭на㠤Ⲵᾲ
⦷ᴰཊѪ
k (1 H ) m
k (1 H ) m d H 1 H d H e Hm
m
ᇊ⨶ᗇ䇱DŽ
ਟԕ⭘䘉а㔃䇪ᶕ⺞ᇊѪҶ߿ቁ↔Āᵚࢄ䲔āᾲ⦷ࡠаᐼᵋⲴ〻ᓖ¥ᡰ䴰Ⲵ䇝㓳ṧֻᮠDŽ
⭡˖
H e Hm d G ˄7.1˅
Ӿѝ䀓ࠪ m ਟᗇ˖
1
mt (ln H ln(1 / G )) ˄7.2˅
H
⌘к䶒Ⲵ⭼䲀ᴹਟ㜭ᱟ䗷儈Ⲵՠ䇑DŽֻྲˈ㲭❦ᵚ㜭䈖ቭॆਈරオ䰤Ⲵᾲ⦷ᗵ享൘४
䰤[0, 1]ˈ❦㘼↔ᇊ⨶㔉ࠪⲴ䗩⭼䲿⵰|H|ሩᮠ໎䮯DŽሩҾ䏣ཏབྷⲴٷ䇮オ䰤ˈ䈕䗩⭼ᖸᇩ
᱃䎵䗷 1DŽഐ↔ˈᔿ 7.2 ѝⲴнㅹᔿ㔉ࠪⲴ䗩⭼ਟ㜭䗷儈ՠ䇑Ҷᡰ䴰䇝㓳ṧֻⲴᮠ䟿DŽ↔䗩
⭼Ⲵ㜶ᕡᙗѫ㾱ᶕⓀҾ|H|亩ˈᆳӗ⭏Ҿ䇱᰾䗷〻ѝ൘ᡰᴹਟ㜭ٷ䇮к䇑㇇䛓Ӌнਟ᧕ਇⲴ
ٷ䇮Ⲵᾲ⦷઼DŽᇎ䱵кˈ൘䇨ཊᛵߥлਟԕᴹаᴤ㍗ࠁⲴ䗩⭼ˈԕ৺㜭ཏ㾶ⴆབྷⲴٷ䇮オ䰤
Ⲵ䗩⭼DŽ䘉ᱟㅜ 7.4 㢲Ⲵѫ仈DŽ
7.3.1 уਥ⸛ᆜҖૂуж㠪ٽ䇴
Hoeffding䗩⭼㺘᰾ˈᖃ䇝㓳䭉䈟⦷errorD(H)൘वਜ਼mњ䲿ᵪᣭਆṧֻⲴ䳶ਸDк⍻䟿ᰦˈ
䛓Ѹ˖
ᆳ㔉ࠪҶањᾲ⦷䗩⭼ˈ䈤᰾ԫ䘹ᤙⲴٷ䇮䇝㓳䭉䈟⦷н㜭ԓ㺘ⵏᇎᛵߥDŽѪ؍䇱 L
ራࡠⲴᴰ֣Ⲵٷ䇮Ⲵ䭉䈟⦷ᴹԕкⲴ䗩⭼ˈᡁԜᗵ享㘳㲁䘉|H|њٷ䇮ѝԫањᴹ䖳བྷ䭉
䈟⦷Ⲵᾲ⦷˖
ྲ᷌ሶ↔ᾲ⦷〠Ѫ¥ˈᒦф䰞˖ཊቁњ䇝㓳ṧֻ m 䏣ԕ֯¥㔤ᤱ൘аᤷᇊⲴ٬˛
ਟᗇлᔿ˖
1
mt (ln H ln(1 / G )) ˄7.3˅
2H 2
⧠൘ᡁԜᴹҶањ䇝㓳ṧֻᮠⴞⲴ䗩⭼ˈԕ㺘⽪䈕ᮠⴞѪཊቁᰦ䏣ԕਟ㜭䘁լᆖҐࡠ
ⴞḷᾲᘥDŽ❦ਾቡਟ⭘ᆳᶕ⺞ᇊḀӋ⢩ᇊᾲᘥ㊫Ⲵṧᵜ༽ᵲᓖ઼ PAC ਟᆖҐᙗDŽ
㘳㲁ⴞḷᾲᘥ㊫ Cˈᆳ⭡ᐳቄ᮷ᆇⲴਸਆ㺘⽪DŽᐳቄ᮷ᆇ˄literal˅ᱟԫⲴᐳቄਈ䟿(ྲ
Old)ˈᡆᆳⲴᇊ(ྲOld)DŽഐ↔ˈᐳቄ᮷ᆇⲴਸਆᖒᔿਟ㜭ѪĀOldġTallāDŽC ᱟѪਟ
PAC ᆖҐⲴ˛ਟԕ䇱᰾ˈഎㆄᱟ㛟ᇊⲴDŽ䇱᰾䗷〻俆ݸᱮ⽪ԫа㠤ᆖҐಘਚ䴰㾱ཊ亩ᔿ
ᮠⴞⲴ䇝㓳ṧֻԕᆖҐࡠ C ѝԫ cˈ❦ਾᗇࡠа⢩ᇊ㇇⌅㜭ሩ⇿䇝㓳ṧֻ֯⭘ཊ亩ᔿᰦ䰤DŽ
㤕ٷ䇮オ䰤HᇊѹѪnњᐳቄ᮷ᆇⲴਸਆˈࡉٷ䇮オ䰤|H|ⲴབྷሿѪ 3nDŽഐ൘Ҿˈԫа
㔉ᇊⲴٷ䇮ѝ⇿њਈ䟿ਟᴹйਟ㜭˖वਜ਼䈕ਈ䟿Ѫ᮷ᆇ˗वਜ਼䈕ਈ䟿ⲴᇊѪ᮷ᆇ˗
ᡆнवਜ਼䈕ਈ䟿DŽ⭡Ҿᴹnњ䘉ṧⲴਈ䟿ˈᡰԕޡᴹ 3nњн਼Ⲵٷ䇮DŽ
1
mt (n ln 3 ln(1 / G )) ˄7.4˅
H
7.3.3.1 ᰖڅᆜҖಞ
਼ᾲᘥDŽᖃ❦ѪᆖҐ䘉ṧⲴᰐٿᾲᘥ㊫ˈᆖҐಘᵜ䓛ҏᗵ享֯⭘аᰐٷⲴٿ䇮オ䰤+ &DŽሶ
Q
_+_ ԓࡠޕᔿ ѝˈᗇࡠѪᆖҐሩᓄҾ;Ⲵᰐٿᾲᘥ㊫Ⲵṧᵜ༽ᵲᓖDŽ
1
mt (2 n ln 2 ln(1 / G )) ˄˅
H
ᆈ൘䘉ਟ㜭ˈণḀᾲᘥ㊫ᴹཊ亩ᔿ㓗Ⲵṧᵜ༽ᵲᓖˈնн㜭ཏ൘ཊ亩ᔿᰦ䰤㻛ᆖҐ
ࡠDŽањᴹ䏓Ⲵֻᆀᱟᾲᘥ㊫&ѪN亩᷀ਆ㤳ᔿ˄N亩'1)˅ⲴᖒᔿDŽN亩'1)㺘䗮ᔿᖒᔿѪ7Ģ
7ĢĂĂĢ7Nˈަѝ⇿а7L亩ѪQњᐳቄᙗ઼ᆳԜⲴᇊⲴਸਆDŽٷᇊ+ &ˈᖸᇩ᱃䇱᰾_+_
QN Q QN
ᴰཊѪ ˄ഐѪᴹNњ亩ˈ⇿亩ਟᴹ њਟ㜭٬˅DŽ⌘ 䗷儈ՠ䇑Ҷ_+_ˈഐѪᆳ䟽༽䇑
㇇Ҷ7L 7Mԕ৺7L∄7Mᴤа㡜ⲴᛵᖒDŽ↔к⭼ӽ❦ਟ⭘Ҿ㧧ᗇṧᵜ༽ᵲᓖⲴк⭼ˈሶަԓࡠޕ
ᔿ ѝ˖
1
mt (nk ln 3 ln(1 / G )) ˄˅
H
ޣҾN亩'1)ⲴԔӪਲ਼Ⲵһᇎ൘Ҿˈ㲭❦ᆳнᱟ3$&ਟᆖҐⲴˈতᆈ൘ањᴤབྷⲴᾲᘥ
㊫ᱟ3$&ਟᆖҐⲴDŽ䘉њᴤབྷⲴᾲᘥ㊫ᴹ⇿ṧֻⲴཊ亩ᔿ㓗ᰦ䰤༽ᵲᓖˈ਼ᰦᴹཊ亩ᔿ㓗Ⲵ
ṧᵜ༽ᵲᓖDŽ䘉аᴤབྷⲴ㊫ѪN&1)㺘䗮ᔿ˖ԫ䮯ᓖⲴਸਆᔿ7ġ7ġĂĂġ7Mˈަѝ⇿њ
7LѪᴰཊNњᐳቄਈ䟿Ⲵ᷀ਆDŽᖸᇩ᱃䇱᰾N&1)वਜ਼ҶN'1)ˈഐѪԫN亩'1)ਟԕᖸᇩ᱃
ൠ䟽߉ѪN&1)㺘䗮ᔿ˄৽ѻতн❦˅DŽ㲭❦N&1)∄N亩'1)㺘䗮࣋ᴤᕪˈնᆳᴹཊ亩ᔿ㓗ṧ
ᵜ༽ᵲᓖ઼ཊ亩ᔿ㓗ᰦ䰤༽ᵲᓖDŽഐ↔ˈᾲᘥ㊫N亩'1)ᱟ֯⭘+ N&1)Ⲵањᴹ᭸㇇⌅ਟ3$&
ᆖҐⲴDŽ㿱.HDUQV 9D]LUDQLѝᴤ䈖㓶Ⲵ䇘䇪DŽ
7.4 ᰖ䲆ٽ䇴グ䰪Ⲻṭᵢགྷᵸᓜ
7.4.1 ᮙжѠᇔׁ䳼ਾ
മ ᱮ⽪Ҷаवਜ਼ њᇎֻⲴ䳶ਸ6㻛ٷ䇮オ䰤ࡂ࠶Ⲵ㔃᷌DŽ⌘䘉 њᇎֻⲴ
ࡂ࠶ѝ⇿ањ䜭ਟ⭡Ḁٷ䇮㾶ⴆDŽ
⌘ˈྲ᷌аᇎֻ䳶ਸ⋑ᴹ㻛ٷ䇮オ䰤ᮓˈ䛓Ѹᗵ❦ᆈ൘Ḁᾲᘥ˄ࡂ࠶˅ˈᆳᇊѹ൘
ᇎֻ䳶ѻкˈնн㜭⭡ٷ䇮オ䰤㺘⽪DŽഐ↔ˈ+ Ⲵ䘉ᮓᇎֻ䳶ਸⲴ㜭࣋ᱟަ㺘⽪䘉Ӌᇎ
ֻкᇊѹⲴⴞḷᾲᘥⲴ㜭࣋Ⲵᓖ䟿DŽ
插图——原书页码:215
ሩ⇿ਟ㜭Ⲵᇎֻࡂ࠶ˈᆈ൘ањሩᓄⲴٷ䇮DŽ
7.4.2 Vapnik-Chervonenkis 㔪ᓜ
ᮓаᇎֻ䳶ਸⲴ㜭࣋оٷ䇮オ䰤Ⲵᖂ㓣ٿ㖞㍗ᇶޣDŽഎᗶㅜ ㄐѝˈањᰐٷⲴٿ
䇮オ䰤ᱟ㜭ཏ㺘⽪ᇊѹ൘ᇎֻオ䰤 ; к⇿њਟ㜭ᾲᘥ˄ࡂ࠶˅Ⲵٷ䇮オ䰤DŽㆰ⸝ൠ䇢ˈањ
ᰐٷٿ䇮オ䰤㜭ཏᮓᇎֻオ䰤DŽ䛓Ѹྲ᷌ + н㜭ᮓ ;ˈնᆳਟᮓ ; ⲴḀњབྷⲴᆀ䳶 6
Պᘾṧ˛ⴤ㿹кਟԕ䈤㻛ᮓⲴ ; Ⲵᆀ䳶䎺བྷˈ+ Ⲵ㺘⽪㜭࣋䎺ᕪDŽ+ Ⲵ 9& 㔤↓ᱟ䘉ṧа
ᓖ䟿ḷ߶DŽ
G
⌘ሩҾԫᴹ䲀Ⲵ+ˈ9&+İORJ_+_DŽѪ䇱᰾䘉а⛩ˈٷᇊ9&+ GDŽ䛓Ѹ+䴰㾱 њ
G
н਼ٷ䇮ᶕᮓGњᇎֻDŽഐ↔ İ_+_ˈᡰԕG 9&+İORJ_+_DŽ
7.4.2.1 ⽰ׁ
ѪҶ㧧ᗇVC(H)Ⲵⴤ㿹Ⲵѹˈ㘳㲁л䶒аӋٷ䇮オ䰤ⲴֻᆀDŽ俆ٷˈݸᇊᇎֻオ䰤X
Ѫᇎᮠ䳶ਸX=˄ֻྲˈ᧿䘠ӪⲴ䓛儈height˅ˈ㘼фHѪᇎᮠ䖤кⲴ४䰤Ⲵ䳶ਸDŽᦒ䀰ѻˈ
HѝⲴٷ䇮ᖒᔿѪa<x<bˈަѝaǃbѪԫᇎᮠDŽᆳⲴVC(H)ᱟཊቁ˛Ѫഎㆄ䘉а䰞仈ˈᗵ享
ࡠ㜭㻛HᮓⲴXⲴᴰབྷᆀ䳶DŽ㘳㲁а⢩ᇊⲴᆀ䳶ˈवਜ਼єњн਼ᇎֻˈྲS={3.1, 5.7}DŽ
䘉њS㜭㻛Hᮓੇ˛എㆄᱟ㛟ᇊⲴDŽֻྲˈԕлഋњٷ䇮˄1<x<2˅ˈ˄1<x<4˅ ˈ˄4<x<7˅઼
˄1<x<7˅ˈਟࡠڊ䘉а⛩DŽᆳԜ㺘⽪ҶSкⲴഋࡂ࠶ˈণнवਜ਼ԫօᇎֻǃਚवਜ਼ᇎֻѝ
Ⲵањǃԕ৺वਜ਼єњᇎֻDŽഐѪᡁԜࡠҶањབྷሿѪ 2 Ⲵ䳶ਸˈᆳਟ㻛HᮓˈᡰԕH
ⲴVC㔤㠣ቁѪ 2DŽབྷሿѪ 3 Ⲵ䳶ਸᱟਟ㻛ᮓ˛㘳㲁а䳶ਸS={x0, x1, x2}वਜ਼ 3 њԫᇎ
ֻDŽнཡа㡜ᙗˈਟٷᇊx0<x1<x2DŽᱮ❦ˈ↔䳶ਸн㜭㻛ᮓˈഐѪवਜ਼x0઼x2նнवਜ਼x1Ⲵ
ࡂ࠶ሶн㜭⭡অњⲴ䰝४䰤ᶕ㺘⽪DŽഐ↔ˈSѝ⋑ᴹབྷሿѪ 3 Ⲵᆀ䳶ਟ㻛ᮓˈഐ↔VC(H)=2DŽ
⌘䘉䟼Hᱟᰐ䲀ⲴˈնVC(H)ᴹ䲀DŽ
л䶒㘳㲁Ⲵᇎֻ䳶ਸSሩᓄxǃyᒣ䶒кⲴ⛩˄㿱മ 7-4˅
DŽԔHѪ↔ᒣ䶒ᡰᴹ㓯ᙗߣㆆ
䶒Ⲵ䳶ਸDŽᦒ䀰ѻˈHሩᓄᴹৼ䗃Ⲵޕঅњᝏ⸕ಘঅٷⲴݳ䇮オ䰤˄㿱ㅜ 4 ㄐѝሩᝏ⸕ಘⲴ
䇘䇪˅DŽHⲴVC㔤ᱟཊቁ˛ᖸᇩ᱃ਟⴻࠪ䈕ᒣ䶒ԫєњн਼⛩ਟ㻛Hᮓˈ䘉ᱟഐѪᡁ
Ԝਟԕࡠ 4 њ㓯ᙗ㺘䶒ˈᆳԜवਜ਼⋑ᴹ⛩ǃަѝа⛩ᡆє⛩DŽ3 њ⛩Ⲵ䳶ਸՊᘾѸṧ˛ਚ
㾱 3 њ⛩нޡ㓯ˈቡਟԕࡠ 23њ㓯ᙗ㺘䶒ᶕᮓᆳԜDŽᖃ❦ 3 њޡ㓯Ⲵ⛩ᰐ⌅㻛ᮓ˄о
ࡽֻѝᇎ䖤к 3 њ⛩ᰐ⌅㻛ᮓ਼ṧⲴ⨶⭡˅DŽ൘↔VC㔤ᱟཊቁ˛2 䘈ᱟ 3˛㠣ቁᓄ䈕ᱟ 3DŽ
Ѫ䇱᰾VC(H)<dˈᗵ享䇱᰾བྷሿѪdⲴ䳶ਸ䜭н㜭㻛ᮓDŽ൘↔ֻѝˈབྷሿѪ 4 Ⲵ䳶ਸ䜭н
㜭㻛ᮓˈഐ↔VC(H)=3DŽVC㔤Ⲵᇊѹ㺘⽪ˈྲ᷌㜭ࡠԫањབྷሿѪdⲴᇎֻ䳶ਸˈᆳ
ਟ㻛ᮓˈ䛓ѸVC(H)ıdDŽᴤа㡜ൠˈਟ䇱᰾ˈ൘r㔤オ䰤ѝ˄ྲᴹrњ䗃Ⲵޕᝏ⸕ಘ˅ˈ㓯
ᙗߣㆆ䶒ⲴVC㔤Ѫr+1DŽ
插图——原书页码:216
ᴰਾањֻᆀˈٷᇊXк⇿њᇎֻ⭡ᚠྭ 3 њᐳቄ᮷ᆇⲴਸਆ㺘⽪ˈ㘼фٷᇊHѝ⇿њ
ٷ䇮⭡㠣ཊ 3 њᐳቄ᮷ᆇ᧿䘠DŽVC(H)ᱟཊቁ˛ਟ䇱᰾䘉њ٬㠣ቁѪ 3DŽሶ⇿њᇎֻ㺘⽪Ѫ
а 3 սᆇѢˈሩᓄ⇿њᇎֻⲴйњ᮷ᆇl1ˈl2઼l3DŽ㘳㲁л䶒 3 њᇎֻ䳶ਸ˖
instance1˖100
instance2˖010
instance3˖001
䘉йњᇎֻⲴ䳶ਸਟ㻛HᮓˈᱟഐѪਟሩԫᡰᐼᵋⲴࡂ࠶ᔪ・аٷ䇮ˈᯩ⌅ྲл˖
ྲ᷌䈕ࡂ࠶㾱ᧂ䲔instancei ˈቡሶ᮷ᆇli ࣐ٷࡠޕ䇮ѝDŽֻྲˈ㾱वਜ਼instance2 ˈфᧂ䲔
instance1઼instance3DŽ䛓Ѹਟ֯⭘ٷ䇮l1ġl3DŽ↔䇘䇪ਟᖸᇩ᱃ൠᢙኅࡠ⢩ᖱᮠѪnⲴᛵߥDŽ
䘉ṧˈnњᐳቄ᮷ᆇਸਆⲴVC㔤㠣ቁѪnDŽᇎ䱵кҏ⺞ᇎѪnˈᇎ䱵Ⲵ䇱᰾∄䖳ഠ䳮ˈഐѪᆳ
䴰㾱䈤᰾n+1 њᇎֻⲴ䳶ਸнਟ㜭㻛ᮓDŽ
7.4.3 ṭᵢགྷᵸᓜૂ VC 㔪
ࡽ䶒㘳㲁ҶĀᴹཊቁ䲿ᵪᣭਆ䇝㓳ṧֻ䏣ԕਟ㜭䘁լ↓⺞˄PAC˅ൠᆖҐࡠ C ѝԫ
ⴞḷᾲᘥā䘉њ䰞仈˄ণᴹཊቁṧֻ䏣ԕԕ 1-¥Ⲵᾲ⦷¦-䈖ቭਈරオ䰤˛˅DŽ֯⭘ VC(H)
Ѫ H ༽ᵲᓖⲴᓖ䟿ˈቡᴹਟ㜭᧘ሬࠪ䈕䰞仈Ⲵਖа䀓ㆄˈ㊫լҾࡽ䶒ᔿ 7.2 ѝⲴ䗩⭼DŽ
ᯠሬࠪⲴ䗩⭼˄㿱 Blumer et al. 1989˅Ѫ˖
1
mt (4 log 2 (2 / G ) 8VC ( H ) log 2 (13 / H )) ˄7.7˅
H
ª1 VC (C ) 1º
max « log(1 / G ),
¬H 32H »¼
Lሶԕ㠣ቁ¥Ⲵᾲ⦷䗃ࠪаٷ䇮hˈ֯errorD(h)>¦DŽ
䈕ᇊ⨶䈤᰾ˈ㤕䇝㓳ṧֻⲴᮠⴞཚቁˈ䛓Ѹнᆈ൘ᆖҐಘ㜭ཏPACᆖҐࡠԫ䶎ᒣࠑⲴ
Cѝ⇿њⴞḷᾲᘥDŽഐ↔ˈ䈕ᇊ⨶ᨀҶᡀ࣏ⲴᆖҐᡰᗵ㾱Ⲵ䇝㓳ṧֻⲴᮠⴞⲴл⭼ˈᆳሩ
Ҿࡽ䶒к⭼㔉ࠪⲴ؍䇱ݵ䏣Ⲵᮠ䟿Ⲵк⭼ᱟа㺕ݵDŽ⌘䈕л⭼ᱟ⭡ᾲᘥ㊫CⲴ༽ᵲᓖ⺞ᇊ
Ⲵˈ㘼ࡽ䶒Ⲵк⭼⭡H⺞ᇊDŽѪӰѸ˛1
7.4.4 ⾔㔅㖇㔒Ⲻ VC 㔪
ሩҾㅜ 4 ㄐ䇘䇪ⲴӪᐕ⾎㓿㖁㔌ˈᡁԜᴹޤ䏓㘳㲁ᘾṧ䇑㇇ањӂ㚄অⲴݳ㖁㔌Ⲵ VC
㔤ˈྲ⭡৽ੁՐ䗷〻䇝㓳Ⲵࡽ侸㖁㔌DŽᵜ㢲㔉ࠪҶа㡜ᙗⲴ㔃䇪ˈԕ䇑㇇࠶ቲᰐ⧟㖁㔌Ⲵ
VC 㔤DŽ䘉а VC 㔤ਟ㻛⭘Ҿ⭼ᇊ䇝㓳ṧֻⲴᮠ䟿ˈ䈕ᮠ䗮ࡠཊབྷⲴ䏣ԕ᤹➗ᐼᵋⲴ¦઼
¥٬䘁լਟ㜭↓⺞ൠᆖҐࡠањࡽ侸㖁㔌DŽᵜ㢲൘ㅜа⅑䰵䈫ᰦਟᘭ⮕ᦹˈ㘼нཡ䘎㔝ᙗDŽ
ਟԕⴻࠪˈ䘉ṧⲴ㖁㔌ⲴVC㔤Ⲵ⭼ᇊਟԕสҾަമⲴ㔃ᶴ઼ᶴ䙐䈕മⲴสᵜঅⲴݳVC
㔤DŽѪᖒᔿॆൠ᧿䘠ˈ俆ݸᇊѹаӋᵟ䈝DŽԔnѪ㖁㔌GⲴ䗃ޕᮠⴞˈᒦфٷᇊਚᴹ 1 њ䗃
ࠪ㔃⛩DŽԔGⲴ⇿њ䜘অݳNi˄ণ⇿њ䶎䗃ޕ㢲⛩˅ᴹᴰཊr њ䗃ˈޕᒦᇎ⧠аᐳቄ࠭ᮠ
ci˖rė{0,1}ᖒᡀа࠭ᮠ㊫CDŽֻྲˈ㤕䜘㢲⛩Ѫᝏ⸕ಘˈ䛓ѸCѪᇊѹ൘rкⲴ㓯ᙗ䰸
٬࠭ᮠ㊫DŽ
1
ᨀ⽪˖ྲ᷌ᡁԜ൘л⭼ѝ⭘HԓᴯCˈᖃHCᰦՊᗇࡠmⲴањᴤ㍗ࠁⲴ⭼䲀
ᇊ⨶ 7.4 ࠶ቲᴹੁᰐ⧟㖁㔌ⲴVC㔤DŽ˄㿱Kearns & Vazirani 1994˅ԔGѪа࠶ቲᴹੁᰐ⧟മˈᴹ
nњ䗃ޕ㢲⛩઼sı2 њ䜘㢲⛩ˈ⇿њਟᴹ㠣ቁrњ䗃ޕDŽԔCѪVC㔤ѪdⲴrкⲴᾲᘥ㊫ˈሩᓄҾਟ
⭡⇿њ䜘㢲⛩᧿䘠Ⲵ࠭ᮠ䳶ਸDŽԔCGѪCⲴGਸᡀˈሩᓄҾਟ⭡G㺘⽪Ⲵ࠭ᮠ䳶ਸDŽ䛓ѸVC(CG)İ
dslog(es)ˈަѝeѪ㠚❦ሩᮠᓅDŽ
ٷᇊ㾱㘳㲁Ⲵ࠶ቲᴹੁᰐ⧟㖁㔌ѝঅњ㢲⛩䜭ᱟᝏ⸕ಘDŽഎᗶㅜ 4 ㄐѝᨀࡠⲴˈr䗃ޕ
ᝏ⸕ಘ֯⭘㓯ᙗߣㆆ䶒ᶕ㺘⽪rкⲴᐳቄ࠭ᮠDŽྲ 7.4.2.1 㢲ᤷࠪⲴ䛓ṧˈ൘rкⲴ㓯ᙗߣ
ㆆ䶒ⲴVC㔤Ѫr+1DŽഐ↔ˈঅ⤜Ⲵr䗃ޕᝏ⸕ಘVC㔤Ѫr+1DŽਟ֯⭘䘉а㔃᷌৺к䶒Ⲵᇊ⨶
ᶕ䇑㇇वਜ਼sњr 䗃ޕᝏ⸕ಘⲴ࠶ቲᰐ⧟㖁㔌ⲴVC㔤䗩⭼ˈྲл˖
⧠൘ਟԕ䇑㇇ˈѪҶ൘䈟ᐞ¦㤳തԕ㠣ቁ 1-¥Ⲵᾲ⦷ᆖҐࡠᶕ㠚CGperceptronsⲴⴞḷᾲ
ᘥˈ䏣ཏⲴ䇝㓳ṧֻᮠⴞmⲴ䗩⭼DŽሶк䶒㖁㔌VC㔤Ⲵ㺘䗮ᔿԓࡠޕᔿ 7.7ˈਟᴹ˖
1
mt (4 log(2 / G ) 8VC ( H ) log(13 / H ))
H
1
t (4 log(2 / G ) 16(r 1) s log(es) log(13 / H )) ˄7.8˅
H
ྲ↔ᝏ⸕ಘ㖁㔌ֻᆀᡰ⽪ˈк䶒Ⲵᇊ⨶Ⲵ⭘൘ҾˈᆳᨀҶања㡜ᙗᯩ⌅ˈสҾ㖁
㔌㔃ᶴ઼অњঅ ⲴݳVC 㔤⭼ᇊ࠶ቲᰐ⧟অݳ㖁㔌Ⲵ VC 㔤DŽн䗷ˈк䶒Ⲵ㔃᷌н㜭ⴤ᧕ᓄ
⭘ҾਾੁՐⲴ㖁㔌ˈഐᴹєњDŽ俆↔ˈݸ㔃᷌ᓄ⭘Ҿᝏ⸕ಘ㖁㔌ˈ㘼нᱟ sigmoid অݳ
㖁㔌ˈਾ㘵ᱟਾੁՐ㇇⌅ᓄ⭘Ⲵ㤳തDŽ❦㘼ˈ⌘ࡠ sigmoid অ ⲴݳVC 㔤㠣ቁՊоᝏ⸕
ಘঅ ⲴݳVC 㔤аṧབྷDŽഐѪ䙊䗷֯⭘䏣ཏⲴᵳ٬ˈsigmoid অݳਟԕԫ㋮ᓖ䙬䘁ᝏ⸕ಘDŽ
ഐ↔ˈк䶒Ⲵ m 䗩⭼㠣ቁՊо sigmoid অݳ㓴ᡀⲴ࠶ቲᰐ⧟㖁㔌ѝⲴаṧབྷDŽк䘠㔃䇪Ⲵㅜ
Ҽњн䏣൘Ҿˈᆳн㜭༴⨶ਾੁՐѝⲴ䇝㓳䗷〻ˈণᔰԕ㓖ㅹҾ 0 Ⲵᵳ٬ˈ❦ਾ৽༽ൠ
ᴤᯠ䈕ᵳ٬ˈⴤࡠࡠаਟ᧕ਇⲴٷ䇮DŽഐ↔ˈਾੁՐᑖᴹӔ৹傼䇱㓸→ḷ߶ˈᆳӗ⭏а
њᴤྭٿሿᵳ٬㖁㔌Ⲵᖂ㓣ٿ㖞DŽ䘉аᖂ㓣ٿ㖞ˈ䱽վҶᴹ᭸Ⲵ VC 㔤ˈᱟк䶒Ⲵ࠶᷀ᡰн
㜭⏥ⴆⲴDŽ
7.5 ᆜҖⲺ࠰䭏⮂䲆⁗ශ
䲔Ҷ PAC ᆖҐ⁑රԕཆˈ䇑㇇ᆖҐ⨶䇪䘈㘳㲁Ҷཊн਼Ⲵ䰞仈ṶᷦDŽᐢ㓿⹄ウⲴᆖ
Ґ䰞仈Ṷᷦѝн਼ѻ༴൘Ҿ䇝㓳ṧֻⲴ⭏ᡀᯩᔿ˄㻛ࣘ㿲ሏᆖҐṧֻ䘈ᱟѫࣘᨀࠪḕ䈒˅ˈ
ᮠᦞѝⲴಚ༠˄ᴹಚ༠ᮠᦞ䘈ᱟᰐᐞ䭉ᮠᦞ˅ˈᡀ࣏ᆖҐⲴᇊѹ˄ᗵ享ᆖࡠ↓⺞Ⲵⴞḷᾲᘥˈ
䘈ᱟᴹаᇊⲴਟ㜭ᙗ઼䘁լᙗ˅ˈᆖҐಘᡰٷⲴڊᇊ˄ᇎֻⲴ࠶ᐳᛵߥԕ৺ᱟ CH˅ˈ઼
䇴ՠᆖҐಘⲴᓖ䟿ḷ߶˄䇝㓳ṧֻᮠ䟿ǃࠪ䭉ᮠ䟿ǃ䇑㇇ᰦ䰤˅DŽ
ᵜ㢲ሶ㘳㲁ᵪಘᆖҐⲴࠪ䭉⭼䲀˄mistake bound˅⁑රˈަѝᆖҐಘ䇴ՠḷ߶ᱟᆳ൘᭦
ᮋࡠ↓⺞ٷ䇮ࡽᙫⲴࠪ䭉ᮠDŽྲ൘ PAC 䰞仈Ṷᷦѝаṧˈ䘉䟼ٷᇊᆖҐಘ᧕᭦ࡠа㌫ࡇⲴ
䇝㓳ṧֻDŽ❦㘼ˈ䘉䟼ᡁԜᐼᵋ⇿᧕ਇࡠањṧֻ xˈᆖҐಘᗵ享ݸ亴⍻ⴞḷ٬ c(x)ˈѻਾ
⭡ᯭᮉ㘵㔉ࠪ↓⺞Ⲵⴞḷ٬DŽ䘉䟼㘳㲁Ⲵ䰞仈ᱟ˖Ā൘ᆖҐಘᆖҐࡠⴞḷᾲᘥࡽˈᆳⲴ亴
⍻Պᴹཊቁ⅑ࠪ䭉āDŽ䘉а䰞仈൘ᇎ䱵⧟ຳлॱ࠶䟽㾱ˈަѝᆖҐ䗷〻о㌫㔏䘀㹼਼ᰦ䘋㹼ˈ
㘼нᱟ㓿䗷а⇥㓯Ⲵ䇝㓳䗷〻DŽֻྲˈྲ᷌㌫㔏㾱ᆖ⵰亴⍻ଚӋؑ⭘䍝⢙ਟ㻛ݱ䇨ˈଚ
ӋᴹⅪ䇸㹼Ѫˈᗵ享สҾ൘֯⭘ѝᩌ䳶Ⲵᮠᦞˈ❦ਾᡁԜቡ㾱൘ަ᭦ᮋࡠ↓⺞ⴞḷ࠭ᮠࡽ֯
ަࠪ䭉ⲴᮠⴞᴰሿॆDŽ䘉䟼ࠪ䭉Ⲵᙫᮠਟ㜭∄䇝㓳ṧֻⲴᙫᮠᴤ䟽㾱DŽ
䘉ࠪ䭉⭼䲀ᆖҐ䰞仈ਟԕ൘䇨ཊ⢩↺Ⲵ㛼Ჟѝ䘋㹼⹄ウDŽֻྲˈᡁԜਟԕ䇑㇇ᆖҐಘ
൘ PAC ᆖҐࡠⴞḷᾲᘥࡽࠪ䭉Ⲵ⅑ᮠDŽ൘л䶒ⲴֻᆀѝˈᡁԜਚ㘳㲁൘ᆖҐಘ⺞࠷ᆖࡠⴞ
ḷᾲᘥࡽࠪ䭉Ⲵ⅑ᮠDŽަѝ⺞࠷ᆖࡠⴞḷᾲᘥણ⵰(x)h(x)=c(x)DŽ
⅑㘳㲁ٷ䇮オ䰤Hवਜ਼㠣ཊnњᐳቄ᮷ᆇ˄l1ĂlnᡆᆳԜⲴᇊ˅ⲴਸਆⲴᛵߥ˄ֻྲ˖
RichġHandsome˅DŽഎᗶㅜ 2 ㄐѝⲴFind-S㇇⌅ˈᆳ໎䟿ᔿൠ䇑㇇о䇝㓳ṧֻа㠤Ⲵᶱབྷ⢩
↺ٷ䇮DŽሩٷ䇮オ䰤HⲴFind-S㇇⌅Ⲵањㆰ⌱ᇎ⧠ྲл˖
Find-S˖
x ሶh㻛ॆѪᴰ⢩↺ٷ䇮l1ġl1ġl2ġl2…lnġln
x ሩ⇿њ↓ֻ x
x Ӿ h ѝ〫৫ԫօн┑䏣 x Ⲵ᮷ᆇ
x 䗃ࠪٷ䇮 h
ㅜҼњֻᆀˈ㘳㲁ањ㇇⌅ˈᆳⲴᢗ㹼䗷〻ᱟ㔤ᣔањਈරオ䰤ˈᒦ൘䙷ࡠᯠṧֻᰦ㋮
ॆ䈕ਈරオ䰤DŽㅜ 2 ㄐⲴى䘹⎸䲔㇇⌅઼ࡇ㺘ਾ⎸䲔㇇⌅䜭ᱟ䘉ṧⲴ㇇⌅DŽᵜ㢲ᡁԜ᧘ሬ䘉
ṧⲴᆖҐಘ䪸ሩԫᴹ䲀ٷ䇮オ䰤 H ᴰൿᛵߥлࠪ䭉ᮠ䟿Ⲵ䗩⭼ˈᒦ⅑ٷᇊⴞḷᾲᘥ㜭
㻛⺞࠷ᆖҐࡠDŽ
Ѫ࠶᷀ᆖҐ䗷〻ѝࠪ䭉Ⲵᮠ䟿ˈᗵ享俆ݸ㋮⺞ᤷᇊᆖҐಘሩ⇿њᯠᇎֻՊࠪᘾṧⲴ亴
⍻DŽٷᇊ䈕亴⍻ᱟ൘ᖃࡽਈරオ䰤Ⲵᡰᴹٷ䇮ѝཊᮠᣅ⾘ᗇᶕDŽྲ᷌ਈරオ䰤ѝཊᮠٷ䇮
ሶᯠᇎֻࡂ࠶Ѫ↓ֻˈ䛓Ѹ䈕亴⍻⭡ᆖҐಘ䗃ࠪDŽࡉ䗃ࠪ৽ֻⲴ亴⍻DŽ
䘉ሶਈරオ䰤ᆖҐ઼⭘ཊᮠᣅ⾘ᶕ䘋㹼ਾ㔝亴⍻є㘵㔃ਸ䎧ᶕⲴ㇇⌅䙊ᑨ㻛〠Ѫ
Halving ㇇⌅DŽሩԫᴹ䲀 HˈHalving ㇇⌅൘⺞࠷ᆖҐࡠⴞḷᾲᘥࡽࠪ䭉Ⲵᴰབྷ⅑ᮠᱟཊቁ˛
⌘Ā⺞࠷āൠᆖҐࡠⴞḷᾲᘥㅹҾ䈤ࡠ䗮ањ⣦ᘱˈਈරオ䰤ѝਚवਜ਼ањٷ䇮˄ྲᖰᑨ
䛓ṧٷᇊⴞḷᾲᘥ c ൘ H ѝ˅DŽ
Ѫ᧘ሬ䈕ࠪ䭉⭼䲀ˈ⌘Halving㇇⌅ਚ൘ᖃࡽਈරオ䰤Ⲵཊᮠٷ䇮н㜭↓⺞࠶㊫ᯠṧ
ֻᰦࠪ䭉DŽ൘䘉ᛵߥлˈаն↓⺞࠶㊫㔃᷌ᨀ㔉ᆖҐಘਾˈਈරオ䰤ਟ߿ሿࡠᆳⲴᴰཊ
аॺབྷሿ˄ণਚᴹᣅቁᮠ⾘Ⲵٷ䇮㻛˅⮉؍DŽ⭡Ҿ⇿⅑ࠪ䭉ሶਈරオ䰤㠣ቁ߿ሿаॺˈ㘼ф
ࡍਈරオ䰤वਜ਼|H|њᡀઈˈᡰԕਈරオ䰤ࡠਚवਜ਼ањᡀઈࡽࠪ䭉⅑ᮠᴰབྷѪlog2|H|DŽᇎ
䱵кਟ䇱᰾䈕䗩⭼Ѫ¬log2|H|¼DŽֻྲˈ㘳㲁|H|=7 ⲴᛵߥDŽㅜањࠪ䭉ਟሶ|H|߿ሿࡠᴰཊѪ 3ˈ
ㅜҼ⅑ࠪ䭉ቡਟሶަ߿ሿࡠ 1DŽ
⌘¬log2|h|¼ѪᴰൿᛵߥлⲴ䗩⭼ˈᒦфᴹਟ㜭Halving㇇⌅нࠪԫօᐞ䭉ቡ⺞࠷ᆖҐࡠ
ⴞḷᾲᘥDŽഐѪণ֯ཊᮠ⾘㔃᷌ᱟ↓⺞Ⲵˈ㇇⌅ӽሶ〫৫䛓Ӌн↓⺞Ⲵǃቁᮠ⾘ٷ䇮DŽ㤕↔
ᛵߥ൘ᮤњ䇝㓳䗷〻ѝਁ⭏ˈ䛓Ѹਈරオ䰤ਟ൘нࠪᐞ䭉Ⲵᛵߥл߿ሿࡠঅњᡀઈDŽ
7.5.3 ᴶՎ࠰䭏⮂䲆
к䶒Ⲵ࠶᷀㔉ࠪҶєњ⢩ᇊ㇇⌅˖Find-S઼ى䘹⎸䲔㇇⌅൘ᴰൿᛵߥлⲴࠪ䭉⭼䲀DŽа
њᖸᴹ䏓Ⲵ䰞仈ᱟˈሩҾԫᾲᘥ㊫CˈٷᇊH=CˈᴰՈⲴࠪ䭉䗩⭼ᱟӰѸ˛ᴰՈࠪ䭉䗩⭼
ᱟᤷ൘ᡰᴹਟ㜭ⲴᆖҐ㇇⌅ѝˈᴰൿᛵߥлࠪ䭉䗩⭼ѝᴰሿⲴ䛓ањDŽᴤ㋮⺞ൠ䈤ˈሩԫ
ᆖҐ㇇⌅A઼ԫⴞḷᾲᘥcˈԔMA(c)ԓ㺘AѪҶ⺞࠷ᆖࡠcˈ൘ᡰᴹਟ㜭䇝㓳ṧֻᒿࡇѝࠪ
л䶒ᇊѹᾲᘥ㊫ C ⲴᴰՈࠪ䭉䗩⭼DŽ
Opt (C ) { min M A (C )
Alearning _a lg orithms
ᴤ䘋а↕ˈᆈ൘䘉ṧⲴᾲᘥ㊫֯к䶒Ⲵ 4 њ䟿ᚠྭㅹDŽ䘉ṧⲴᾲᘥ㊫ަѝѻаᱟԫ
ᴹ䲀䳶ਸⲴᑲ䳶CPDŽ൘↔ᛵߥлˈVC(CP)=|X|=log2(|CP|)ˈഐ↔ᡰᴹ䘉 4 њ䟿ㅹDŽLittlestone
˄1987˅ᨀҶަԆᾲᘥ㊫ⲴֻᆀˈަѝVC(C)ѕṬሿҾOpt(C)ˈOpt(C)ѕṬሿҾMHalving(C)DŽ
7.5.4 ࣖᵹཐᮦ㇍⌋
࣐ᵳཊᮠ㇇⌅аᔰሶ⇿њ亴⍻㇇⌅䍻ԕᵳ䟽 1ˈ❦ਾ㘳㲁䇝㓳ṧֻDŽᰐ䇪օᰦа亴⍻
㇇⌅䈟࠶㊫аᯠ䇝㓳ṧֻᰦˈᆳⲴᵳ䟽㻛҈ԕḀњ㌫ᮠ£ˈ0İ£DŽ࣐ᵳཊᮠ㇇⌅Ⲵ⺞࠷
ᇊѹ㿱㺘 DŽ⌘ྲ᷌£ ˈ䛓Ѹ࣐ᵳཊᮠ㇇⌅ㅹҾ Halving ㇇⌅DŽਖаᯩ䶒ˈྲ᷌Ѫ£
䘹ᤙަԆⲴ٬ˈ⋑ᴹањ亴⍻㇇⌅Պ㻛ᆼޘ৫䲔DŽྲ᷌а㇇⌅䈟࠶㊫ањṧֻˈᆳ൘ሶᶕՊ
ঐ䖳ቁⲴ⾘ᮠ∄ֻDŽ
㺘 7-1 ࣐ᵳཊᮠ㇇⌅
aiԓ㺘㇇⌅⊐Aѝㅜiњ亴⍻㇇⌅DŽwiԓ㺘оaiޣ㚄Ⲵᵳ٬DŽ
ሩᡰᴹiˈࡍॆwiѪ 1
ሩ⇿њ䇝㓳ṧֻ<x, c(x)>
ࡍॆq0઼q1Ѫ 0
ሩ⇿њ亴⍻㇇⌅ai
ྲ᷌ai(x)=0ˈ䛓Ѹq0mq0+wi
ྲ᷌ai(x)=1ˈ䛓Ѹq1mq1+wi
ྲ᷌q1>q0ˈ䛓Ѹ亴⍻c(x)=1
ྲ᷌q0>q1ˈ䛓Ѹ亴⍻c(x)=0
ྲ᷌q1=q0ˈ䛓Ѹሩc(x)䲿ᵪ亴⍻ 0 ᡆ 1
ሩAѝ⇿њ亴⍻㇇⌅aiˈ˖ڊ
ྲ᷌ai(x) zc(x)ˈ䛓ѸwimEwi
⧠൘䇱᰾ˈ࣐ᵳཊᮠ㇇⌅Ⲵࠪ䭉ᮠ䟿䗩⭼ਟԕ⭡ᣅ⾘⊐ѝᴰ֣亴⍻㇇⌅Ⲵࠪ䭉ᮠᶕ㺘
⽪DŽ
䇱᰾˖ሩᇊ⨶Ⲵ䇱᰾ਟ䙊䗷∄䖳ᴰ֣亴⍻㇇⌅Ⲵᴰ㓸ᵳ䟽઼ᡰᴹ㇇⌅Ⲵᵳ䟽ѻ઼DŽԔajԓ㺘Aѝ
а㇇⌅ˈᒦфᆳࠪ䭉Ⲵ⅑ᮠѪᴰՈⲴk⅑DŽоaj㚄㌫Ⲵᵳ䟽wjሶѪ(1/2)kˈഐѪᆳⲴࡍᵳ䟽Ѫ 1ˈᒦ
¦
n
൘⇿⅑ࠪ䭉ᰦ҈ԕ 1/2DŽ⧠൘㘳㲁Aѝᡰᴹnњ㇇⌅Ⲵᵳ䟽઼W=
i 1
wi DŽWࡍѪnDŽሩ࣐ᵳཊᮠ㇇
k M
§1· §3·
¨ ¸ d n¨ ¸
©2¹ ©4¹
䟽ᯠᆹᧂ亩ᗇࡠ˖
(k log 2 n)
Md d 2.4(k log 2 n)
§3·
log 2 ¨ ¸
©4¹
ᇊ⨶ᗇ䇱DŽ
ᾲᤜൠ䈤ˈк䶒Ⲵᇊ⨶䈤᰾࣐ᵳཊᮠ㇇⌅Ⲵࠪ䭉ᮠ䟿нՊབྷҾ㇇⌅⊐ѝᴰ֣㇇⌅ࠪ䭉ᮠ
䟿ˈ࣐ка䲿⵰㇇⌅⊐བྷሿሩᮠ໎䮯Ⲵ亩ˈ҈ԕаᑨᮠഐᆀDŽ
1
k log 2 log 2 n
E
2
log 2
1 E
7.6 ቅ㔉ૂ㺛ݻ䈱⢟
ᵜㄐⲴ㾱⛩वᤜ˖
x ਟ㜭䘁լ↓⺞⁑ර˄PAC˅䪸ሩⲴ㇇⌅ӾḀᾲᘥ㊫ C ѝᆖҐⴞḷᾲᘥˈ֯⭘᤹
аᵚ⸕նപᇊⲴᾲᘥ࠶ᐳѝ䲿ᵪᣭਆⲴ䇝㓳ṧֻDŽᆳ㾱≲ᆖҐಘਟ㜭˄ԕ㠣ቁ
1-¥Ⲵᾲ⦷˅ᆖҐࡠа䘁լ↓⺞˄䭉䈟⦷ሿҾ¦˅Ⲵٷ䇮ˈ㘼䇑㇇䟿઼䇝㓳ṧֻ
ᮠ䜭ਚ䲿⵰ 1/¥ˈ1/¦ˈᇎֻ䮯ᓖ઼ⴞḷᾲᘥ䮯ᓖⲴཊ亩ᔿ㓗㓯ᙗ໎䮯DŽ
x ൘ PAC ᆖҐ⁑රⲴṶᷦлˈԫօ֯⭘аᴹ䲀ٷ䇮オ䰤 H˄ަѝ CH˅Ⲵа㠤ᆖ
Ґಘˈሶԕᾲ⦷ 1-¥䗃ࠪањⴞḷᾲᘥѝ䈟ᐞ൘¦㤳തⲴٷ䇮ˈᡰ䴰䲿ᵪᣭ
ਆ䇝㓳ṧֻᮠⴞѪ mˈф m ┑䏣
1
mt (ln(1 / G ) ln H )
H
䈕ᔿ㔉ࠪҶ PAC ⁑රлᡀ࣏ⲴᆖҐᡰ䴰Ⲵ䏣ཏⲴ䇝㓳ṧֻᮠⴞⲴ䗩⭼DŽ
x PAC ᆖҐ⁑රⲴањᴹ㓖ᶏⲴٷᇊᱟˈᆖҐಘ亴⸕ݸ䚃Ḁਇ䲀Ⲵᾲᘥ㊫ Cˈᆳ
वਜ਼㾱ᆖҐⲴⴞḷᾲᘥDŽ৽ˈнਟ⸕ᆖҐ˄agnostic learning˅㘳㲁ᴤа㡜Ⲵ䰞
仈ṶᷦˈަѝᆖҐಘнٷᇊⴞḷᾲᘥᡰ൘Ⲵ㊫࡛DŽᆖҐಘਚӾ䇝㓳ᮠᦞѝ䗃ࠪ H
ѝᴹᴰሿ䈟ᐞ⦷˄ਟ㜭䶎 0˅Ⲵٷ䇮DŽ൘䘉њਇ䲀䖳ቁⲴнਟ⸕ᆖҐ⁑රѝˈᆖ
Ґಘ؍䇱ԕᾲ⦷ 1-¥Ӿ H ѝᴰਟ㜭ᴹٷ䇮ѝ䗃ࠪ䭉䈟⦷ሿҾ¦Ⲵٷ䇮ˈ㾱㿲ሏ
Ⲵ䲿ᵪᣭਆ䇝㓳ṧֻᮠⴞ m ┑䏣˖
1
mt (ln(1 / G ) ln H )
2H 2
x ᡀ࣏ⲴᆖҐᡰ䴰Ⲵ䇝㓳ֻᮠⴞᖸᕪ⛸ൠਇࡠᆖҐಘᡰ㘳㲁Ⲵٷ䇮オ䰤༽ᵲᓖⲴ
ᖡ૽DŽሩҾٷ䇮オ䰤 H ༽ᵲᓖⲴањᴹ⭘Ⲵᓖ䟿ᱟ VC 㔤ˈVC(H)DŽVC(H)ᱟਟ
㻛 H ᮓ˄ԕᡰᴹਟ㜭ᯩᔿ࠶ࢢ˅ᴰབྷᇎֻᆀ䳶ⲴབྷሿDŽ
x ൘ PAC ⁑රлԕ VC(H)㺘⽪Ⲵ䏣ԕሬ㠤ᡀ࣏ᆖҐⲴ䇝㓳ṧֻᮠⴞⲴк⭼Ѫ
1
mt (4 log 2 (2 / G ) 8VC ( H ) log 2 (13 / H ))
H
л⭼Ѫ
ª1 VC (C ) 1º
m t max « log(1 / G ),
¬H 32H »¼
x ਖаᆖҐ⁑ᔿ〠Ѫࠪ䭉⭼䲀⁑ᔿˈᆳ⭘Ҿ࠶᷀ањᆖҐಘ൘⺞࠷ᆖҐࡠⴞḷ
ᾲᘥѻࡽՊӗ⭏Ⲵ䈟࠶㊫⅑ᮠDŽֻྲˈHalving㇇⌅൘ᆖҐࡠHѝⲴԫⴞḷᾲ
ᘥࡽՊᴹ㠣ཊ¬log2|H|¼⅑ࠪ䭉DŽሩԫᾲᘥ㊫Cˈᴰൿᛵߥлᴰ֣㇇⌅ሶᴹOpt(C)
⅑ࠪ䭉ˈަѝ˖
VC(C)İOpt(C)İ log2(|C|)
x ࣐ᵳཊᮠ㇇⌅㔃ਸҶཊњ亴⍻㇇⌅Ⲵ࣐ᵳᣅ⾘ᶕ࠶㊫ᯠⲴᇎֻDŽᆳสҾ䘉Ӌ亴
⍻㇇⌅൘ṧֻᒿࡇѝⲴࠪ䭉ᶕᆖҐ⇿њ㇇⌅Ⲵᵳ٬DŽᴹ䏓Ⲵᱟˈ࣐ᵳཊᮠ㇇⌅
ӗ⭏Ⲵ䭉䈟⭼䲀ਟ⭘㇇⌅⊐ѝᴰ֣亴⍻㇇⌅Ⲵࠪ䭉ᮠᶕ䇑㇇DŽ
䇑㇇ᆖҐ⨶䇪ѝ䇨ཊᰙᵏⲴᐕ䪸ሩⲴ䰞仈ᱟˈ൘㔉ᇊањнᇊ䮯Ⲵ䇝㓳ṧֻᒿֻᰦˈ
ᆖҐಘᱟ㜭൘ᶱ䲀ᰦ⺞ᇊⴞḷᾲᘥDŽ൘ᶱ䲀⁑රлⲴ⺞ᇊᯩ⌅⭡ Gold㔉ࠪDŽޣҾ
↔亶ฏⲴањྭⲴ㔬䘠㿱AngluinDŽVapnik䈖㓶㘳ḕҶа㠤᭦ᮋ˄uniform
convergence˅Ⲵ䰞仈ˈ㘼ᇶ࠷ ⲴޣPAC ᆖҐ⁑ර⭡ ValiantᨀࠪDŽᵜㄐѝ¦䈖ቭਈ
රオ䰤Ⲵ䇘䇪สҾ HausslerⲴ䱀䘠DŽ൘ PAC ⁑රлⲴа㓴ᴹ⭘Ⲵ㔃䇪ਟ൘ Blueretal
˄˅ѝࡠDŽKearns VaziraniᨀҶ䇑㇇ᆖҐ⨶䇪ѝ䇨ཊ㔃䇪ⲴањՈ⿰Ⲵ䱀
䘠DŽ↔亶ฏаӋᰙᵏⲴ᮷ㄐवᤜ Anthsny Biggs઼ NatarajanDŽ
ⴞࡽ䇑㇇ᆖҐ⨶䇪Ⲵ⹄ウ㾶ⴆҶ䇨䇨ཊཊⲴᆖҐ⁑ර઼ᆖҐ㇇⌅DŽ䇨ཊ䘉ᯩ䶒Ⲵ⹄ウਟ
ԕ൘䇑㇇ᆖҐ⨶䇪˄COLT˅ⲴᒤᓖՊ䇞Ⲵ䇪᮷䳶ѝࡠDŽᵏ࠺ljᵪಘᆖҐNJMachineLearning
ѝаӋ⢩↺Ⲵḿⴞҏ⎹৺䘉аѫ仈DŽ
Ґ仈
㘳㲁䇝㓳ањє䗃ޕᝏ⸕ಘDŽ㔉ࠪ䇝㓳ṧֻᮠⴞⲴк⭼ˈԕ؍䇱ᆖҐࡠⲴᝏ⸕ಘᴹ
Ⲵ㖞ؑᓖˈަⵏᇎ䭉䈟⦷н䎵䗷 DŽ䘉а䗩⭼ᱟᇎ䱵˛
൘ᵜㄐѝᡁԜ᧘ሬҶ䇝㓳ṧֻᮠ䟿Ⲵ㺘䗮ᔿˈ֯䏣ԕ؍䇱⇿њٷ䇮Ⲵⵏᇎ䭉䈟⦷н
ՊᐞҾަ㿲ሏࡠⲴ䇝㓳䭉䈟⦷errorDh࣐к¦DŽ⢩࡛ൠˈᡁԜ֯⭘ҶHoeffding⭼䲀ᶕ᧘ሬ
ᔿ DŽ䈅᧘ሬ䇝㓳ṧֻᮠⴞⲴਖа㺘䗮ᔿˈ֯䏣ԕ؍䇱⇿њٷ䇮Ⲵⵏᇎ䭉䈟⦷нՊᐞҾ
¤errorDhDŽ᧘ሬⲴ䗷〻ਟ֯⭘л䶒Ⲵ䙊⭘ⲴChernoff⭼䲀DŽ
Chernoff⭼䲀˖ٷᇊxĂxmˈѪmњ⤜・⺜ᐱᣅ᧧˄Bernonlliᇎ傼˅Ⲵ䗃ࠪˈަѝ⇿
⅑ᇎ傼↓䶒Ⲵᾲ⦷ѪPr>Xi @ pˈ㘼৽䶒ᾲ⦷Pr>Xi @ pDŽᇊѹS XXĂXmѪ䘉m⅑ᇎ
傼䗃ࠪⲴ઼DŽSmⲴᵏᵋ٬ѪE>Sm@ pDŽChernoff⭼䲀᧿䘠ҶSmԕḀഐᆀ İ¤İ н਼Ҿ
pⲴᾲ⦷˖
Pr[ S / m ! (1 J ) p ] d e mpJ
2
/3
Pr[ S / m ! (1 J ) p ] d e mpJ
2
/2
aHr xyᒣ䶒кᡰᴹ⸙ᖒⲴ䳶ਸDŽণH {((a x b) (c y d )) | a, b, c, d }
bHc xyᒣ䶒ⲴശDŽ൘ശⲴ⛩㻛࠶㊫Ѫ↓ֻDŽ
cHt xyᒣ䶒Ⲵй䀂ᖒDŽ൘й䀂ᖒⲴ⛩㻛࠶㊫Ѫ↓ֻDŽ
߉ࠪҐ仈 ѝሩHrⲴања㠤ᆖҐಘDŽ䲿ᵪ⭏ᡀа㓴н਼Ⲵⴞḷᾲᘥˈሩᓄᒣ䶒
кн਼Ⲵ⸙ᖒDŽѪ⇿ањⴞḷᾲᘥ䲿ᵪ⭏ᡀṧֻˈަѝⲴᇎֻ࠶ᐳѪ⸙ᖒ!ࡠ!
Ⲵ൷र࠶ᐳDŽ൘മк⭫ࠪሩᓄ䇝㓳ṧֻᮠⴞⲴmⲴ⌋ॆ䭉䈟⦷DŽ൘਼аമкˈ⭫ࠪ¥
ᰦ¦઼mѻ䰤⨶䇪кⲴޣ㌫ᴢ㓯DŽ䈕⨶䇪ᱟоᇎ傼ㅖਸ˛
插图——原书页码:228
aԕnⲴ࠭ᮠᖒᔿ㺘⽪ࠪHrd2ѝᴹཊቁ䈝⌅н਼ⲴṁDŽ
(b)㔉ࠪPAC⁑රлᡰ䴰Ⲵṧֻᮠⴞк⭼ˈ֯ᆖҐࡠHrd2䭉䈟⦷Ѫ¦ˈ㖞ؑᓖѪ¥DŽ
(c)㘳㲁л䶒ⲴሩHrd2㊫Ⲵ࣐ᵳཊᮠ㇇⌅DŽᔰˈHrd2ѝᡰᴹٷ䇮ࡍᵳ٬䜭Ѫ DŽ⇿⅑
䙷ࡠᯠṧֻˈ㾱สҾHrd2ѝᡰᴹٷ䇮Ⲵ࣐ᵳᣅ⾘䘋㹼亴⍻DŽ❦ਾˈнᱟ⎸䲔ᦹна㠤Ⲵṁˈ
㘼ᱟሶᆳԜⲴᵳ٬ԕഐᆀ 䘋㹼ࡺ߿DŽ↔䗷〻ᴰཊՊᴹཊቁ⅑ࠪ䭉˛ԕHrd2ѝᴰ֣ṁⲴࠪ䭉
ᮠ઼nᶕ㺘⽪DŽ
Ḁപᇊնᵚ⸕Ⲵᾲ⦷࠶ᐳ DDŽⴞḷᾲᘥᐢ⸕ਟ⭡ᐳቄᙗᡆᆳԜⲴᇊⲴਸਆᶕ㺘⽪˄ྲ
已知一系列的训练样例,很多学习方法为目标函数建立起明确的一般化描述;
但与此不同,基于实例的学习方法只是简单地把训练样例存储起来。从这些实例中
泛化的工作被推迟到必须分类新的实例时。每当学习器遇到一个新的查询实例,它
分析这个新实例与以前存储的实例的关系,并据此把一个目标函数值赋给新实例。
基于实例的学习方法包括最近邻(nearest neighbor)法和局部加权回归(locally
weighted regression)法,它们都假定实例可以被表示为欧氏空间中的点。基于实
例的学习方法还包括基于案例的推理(case-based reasoning),它对实例采用更
复杂的符号表示。基于实例的学习方法有时被称为消极(lazy)学习法,因为它们
把处理工作延迟到必须分类新的实例时。这种延迟的或消极的学习方法有一个关键
的优点,即它们不是在整个实例空间上一次性地估计目标函数,而是针对每个待分
类新实例作出局部的和相异的估计。
8.1 ㆶԁ
สҾᇎֻⲴᆖҐᯩ⌅ѝˈᴰ䘁䛫⌅઼ተ䜘࣐ᵳഎᖂ⌅⭘Ҿ䙬䘁ᇎ٬ᡆᮓⴞḷ࠭ᮠˈᆳ
Ԝ൘ᾲᘥк䜭ᖸㆰ᰾DŽሩҾ䘉Ӌ㇇⌅ˈᆖҐ䗷〻ਚᱟㆰঅൠᆈۘᐢ⸕Ⲵ䇝㓳ᮠᦞDŽᖃ䙷ࡠᯠ
Ⲵḕ䈒ᇎֻᰦˈа㌫ࡇլⲴᇎֻ㻛Ӿᆈۘಘѝਆࠪˈᒦ⭘ᶕ࠶㊫ᯠⲴḕ䈒ᇎֻDŽ䘉Ӌᯩ⌅
оަԆㄐ䇘䇪Ⲵᯩ⌅∄ˈањޣ䭞ᐞᔲᱟ˖สҾᇎֻⲴᯩ⌅ਟԕѪн਼Ⲵᖵ࠶㊫ḕ䈒ᇎֻ
ᔪ・н਼Ⲵⴞḷ࠭ᮠ䙬䘁DŽһᇎкˈᖸཊᢰᵟਚᔪ・ⴞḷ࠭ᮠⲴተ䜘䙬䘁ˈሶަᓄ⭘Ҿоᯠ
ḕ䈒ᇎֻ䛫䘁Ⲵᇎֻˈ㘼Ӿнᔪ・൘ᮤњᇎֻオ䰤к䜭㺘⧠㢟ྭⲴ䙬䘁DŽᖃⴞḷ࠭ᮠᖸ༽ᵲˈ
նᆳਟ⭘нཚ༽ᵲⲴተ䜘䙬䘁᧿䘠ᰦˈ䘉ṧڊᴹᱮ㪇ⲴՈ࣯DŽ
สҾᇎֻⲴᯩ⌅ҏਟԕ֯⭘ᴤ༽ᵲⲴㅖਧ㺘⽪⌅ᶕ᧿䘠ᇎֻDŽ൘สҾṸֻⲴᆖҐѝˈᇎ
ֻণԕ䘉ᯩᔿ㺘⽪ˈ㘼фҏ᤹➗䘉ᯩᔿᶕ⺞ᇊ䛫䘁ᇎֻDŽสҾṸֻⲴ᧘⨶ᐢ㓿㻛ᓄ⭘ࡠ
ᖸཊԫ࣑ѝˈ∄ྲˈ൘䈒ਠкᆈ઼ۘ༽⭘䗷৫Ⲵ㓿傼˗ṩᦞԕࡽⲴ⌅ᖻṸԦ䘋㹼᧘⨶˗䙊
䗷༽⭘ԕࡽ≲䀓Ⲵ䰞仈Ⲵޣ䜘࠶ᶕ䀓ߣ༽ᵲⲴ䈳ᓖ䰞仈DŽ
สҾᇎֻᯩ⌅Ⲵањн䏣ᱟˈ࠶㊫ᯠᇎֻⲴᔰ䬰ਟ㜭ᖸབྷDŽ䘉ᱟഐѪࠐѾᡰᴹⲴ䇑㇇䜭
ਁ⭏൘࠶㊫ᰦˈ㘼нᱟ൘ㅜа⅑䙷ࡠ䇝㓳ṧֻᰦDŽᡰԕˈྲօᴹ᭸ൠ㍒ᕅ䇝㓳ṧֻˈԕ߿ቁ
ḕ䈒ᰦᡰ䴰䇑㇇ᱟањ䟽㾱Ⲵᇎ䐥䰞仈DŽ↔㊫ᯩ⌅ⲴㅜҼњн䏣ᱟ˄ቔަሩҾᴰ䘁䛫⌅˅ˈ
ᖃӾᆈۘಘѝỰ㍒լⲴ䇝㓳ṧֻᰦˈᆳԜа㡜㘳㲁ᇎֻⲴᡰᴹᙗDŽྲ᷌ⴞḷᾲᘥӵ䎆
ҾᖸཊᙗѝⲴࠐњᰦˈ䛓Ѹⵏ↓ᴰĀլāⲴᇎֻѻ䰤ᖸਟ㜭䐍⭊䘌DŽ
8.2 k-䘇䛱⌋
สҾᇎֻⲴᆖҐᯩ⌅ѝᴰสᵜⲴᱟk-䘁䛫㇇⌅DŽ䘉њ㇇⌅ٷᇊᡰᴹⲴᇎֻሩᓄҾn㔤⅗
∿オ䰤nѝⲴ⛩DŽањᇎֻⲴᴰ䘁䛫ᱟṩᦞḷ߶⅗∿䐍ᇊѹⲴDŽᴤ㋮⺞ൠ䇢ˈᢺԫⲴ
ᇎֻx㺘⽪Ѫл䶒Ⲵ⢩ᖱੁ䟿˖
<a1(x)ˈa2(x)ˈ}an(x)>
ަѝar(x)㺘⽪ᇎֻxⲴㅜrњᙗ٬DŽ䛓Ѹєњᇎֻxi઼xj䰤Ⲵ䐍ᇊѹѪd(xi, xj)ˈަѝ˖
n
d(xi, xj){ ¦ (a ( x ) a ( x
r 1
r i r j )) 2
൘ᴰ䘁䛫ᆖҐѝˈⴞḷ࠭ᮠ٬ਟԕѪᮓ٬ҏਟԕѪᇎ٬DŽᡁԜݸ㘳㲁ᆖҐԕлᖒᔿⲴ
ᮓⴞḷ࠭ᮠf : noVDŽަѝVᱟᴹ䲀䳶ਸ{v1, }vs}DŽ㺘 8-1 㔉ࠪҶ䙬䘁ᮓⴞḷ࠭ᮠⲴk-
䘁䛫㇇⌅DŽ↓ྲ㺘ѝᡰᤷࠪⲴˈ䘉њ㇇⌅Ⲵ䘄എ٬ fˆ (xq)Ѫሩf(xq)Ⲵՠ䇑ˈᆳቡᱟ䐍xqᴰ
䘁Ⲵkњ䇝㓳ṧֻѝᴰᲞ䙽Ⲵf٬DŽྲ᷌ᡁԜ䘹ᤙk=1ˈ䛓ѸĀ1-䘁䛫㇇⌅āቡᢺf(xi)䍻㔉 fˆ (xq)ˈ
ަѝxiᱟᴰ䶐䘁xqⲴ䇝㓳ᇎֻDŽሩҾ䖳བྷⲴk٬ˈ䘉њ㇇⌅䘄എࡽkњᴰ䶐䘁Ⲵ䇝㓳ᇎֻѝᴰ
Პ䙽Ⲵf٬DŽ
മ 8-1 മ䀓ҶаㆰঅᛵߥлⲴk-䘁䛫㇇⌅ˈ൘䘉䟼ᇎֻᱟҼ㔤オ䰤ѝⲴ⛩ˈⴞḷ࠭ᮠ
ާᴹᐳቄ٬DŽ↓৽䇝㓳ṧֻ⭘Ā+ā઼Ā-ā࠶࡛㺘⽪DŽമѝҏ⭫ࠪҶањḕ䈒⛩xqDŽ⌘൘
䘉ᑵമѝˈ1-䘁䛫㇇⌅ᢺxq࠶㊫Ѫ↓ֻˈ❦㘼 5-䘁䛫㇇⌅ᢺxq࠶㊫Ѫ৽ֻDŽ
插图——原书页码:233
മ 8-1 k-䘁䛫㇇⌅
ᐖമ⭫ࠪҶа㌫ࡇⲴ↓৽䇝㓳ṧ઼ֻањ㾱࠶㊫Ⲵḕ䈒ᇎֻxqDŽ1-䘁䛫㇇⌅ᢺxq࠶㊫Ѫ↓ֻˈ❦㘼
5-䘁䛫㇇⌅ᢺxq࠶㊫Ѫ৽ֻDŽਣമᱟሩҾањިරⲴ䇝㓳ṧֻ䳶ਸ 1-䘁䛫㇇⌅ሬ㠤Ⲵߣㆆ䶒DŽത㔅
⇿њ䇝㓳ṧֻⲴࠨཊ䗩ᖒ㺘⽪ᴰ䶐䘁䘉њ⛩Ⲵᇎֻオ䰤˄ণ䘉њオ䰤ѝⲴᇎֻՊ㻛 1-䘁䛫㇇⌅䍻Ҹ
䈕䇝㓳ṧֻᡰⲴ࠶㊫˅DŽ
k-䘁䛫⌅䳀ਜ਼㘳㲁Ⲵٷ䇮オ䰤HⲴ⢩ᙗᱟӰѸ˛⌘k-䘁䛫㇇⌅ӾᶕнᖒᡀޣҾⴞḷ
࠭ᮠfⲴ᰾⺞Ⲵа㡜ٷ䇮 fˆ DŽᆳӵ൘䴰㾱ᰦ䇑㇇⇿њᯠḕ䈒ᇎֻⲴ࠶㊫DŽ❦㘼ˈᡁԜ❦ਟ
ԕ䰞˖䳀ਜ਼Ⲵа㡜࠭ᮠᱟӰѸ˛ᡆ㘵䈤ˈྲ᷌؍ᤱ䇝㓳ṧֻнਈˈᒦ⭘XѝⲴ⇿њਟ㜭ᇎֻ
ḕ䈒㇇⌅ˈՊᗇࡠӰѸṧⲴ࠶㊫˛മ 8-1 ѝⲴਣമ⭫ࠪҶ 1-䘁䛫㇇⌅൘ᮤњᇎֻオ䰤кሬ㠤
Ⲵߣㆆ䶒ᖒ⣦DŽߣㆆ䶒ᱟത㔅⇿њ䇝㓳ṧֻⲴࠨཊ䗩ᖒⲴਸᒦDŽሩҾ⇿њ䇝㓳ṧֻˈཊ䗩ᖒ
ᤷࠪҶањḕ䈒⛩䳶ਸˈᆳⲴ࠶㊫ᆼ⭡ޘᓄ䇝㓳ṧֻߣᇊDŽ൘䘉њཊ䗩ᖒཆⲴḕ䈒⛩ᴤ᧕
䘁ަԆⲴ䇝㓳ṧֻDŽ䘉㊫රⲴമ㓿ᑨ㻛〠Ѫ䘉њ䇝㓳ṧֻ䳶ਸⲴVoronoiമ ķ (Voronoi
diagram)DŽ
ሩࡽ䶒Ⲵk-䘁䛫㇇⌅ㆰঅⲴ؞᭩ਾˈᆳቡਟ㻛⭘Ҿ䙬䘁䘎㔝٬Ⲵⴞḷ࠭ᮠDŽѪҶᇎ⧠
䘉а⛩ˈᡁԜ䇙㇇⌅䇑㇇kњᴰ᧕䘁ṧֻⲴᒣ൷٬ˈ㘼нᱟ䇑㇇ަѝⲴᴰᲞ䙽Ⲵ٬DŽᴤ㋮⺞
ൠ䇢ˈѪҶ䙬䘁ањᇎ٬ⴞḷ࠭ᮠf:noˈᡁԜਚ㾱ᢺ㇇⌅ѝⲴޜᔿᴯᦒѪ˖
¦
k
f ( xi )
fˆ ( x q ) m i 1
˄8.1˅
k
8.2.1 䐓⿱ࣖᵹᴶ䘇䛱㇍⌋
ሩk-䘁䛫㇇⌅Ⲵањᱮ㘼᱃㿱Ⲵ᭩䘋ᱟሩkњ䘁䛫Ⲵ䍑⥞࣐ᵳˈṩᦞᆳԜሩḕ䈒⛩xqⲴ
䐍ˈሶ䖳བྷⲴᵳ٬䍻㔉䖳䘁Ⲵ䘁䛫DŽֻྲˈ൘㺘 8-1 䙬䘁ᮓⴞḷ࠭ᮠⲴ㇇⌅ѝˈᡁԜਟ
ԕṩᦞ⇿њ䘁䛫оxqⲴ䐍ᒣᯩⲴقᮠ࣐ᵳ䘉њ䘁䛫ⲴĀ䘹ѮᵳāDŽᯩ⌅ᱟ䙊䗷⭘лᔿਆԓ
㺘 8-1 ㇇⌅ѝⲴޜᔿᶕᇎ⧠˖
k
fˆ ( x q ) m arg max ¦ wi G (v, f ( xi )) ˄8.2˅
vV i 1
1
ަѝ˖ wi {
d ( xq , xi ) 2
˄8.3˅
ķ
䈁⌘˖৸〠ởཊ䗩ᖒ˄Thiessen Polygons˅ˈਟԕ⨶䀓Ѫሩオ䰤Ⲵа࠶ࢢᯩᔿˈањởཊ䗩ᖒⲴ
ԫа⛩ࡠᵜởཊਈᖒѝᗳ⛩Ⲵ䐍䜭ሿҾࡠަԆởཊ䗩ᖒѝᗳ⛩Ⲵ䐍DŽ
ѪҶ༴⨶ḕ䈒⛩xqᚠྭ३䝽Ḁњ䇝㓳ṧֻxiˈӾ㘼ሬ㠤࠶⇽Ѫ 0 ⲴᛵߥˈᡁԜԔ䘉ᛵ
ߥлⲴ fˆ (xq)ㅹҾf(xi)DŽྲ᷌ᴹཊњ䘉ṧⲴ䇝㓳ṧֻˈᡁԜ֯⭘ᆳԜѝঐཊᮠⲴ࠶㊫DŽ
¦
k
wi f ( xi )
fˆ ( x q ) m i 1
˄8.4˅
¦
k
i
w
1 i
ަѝwiⲴᇊѹоޜᔿ˄8.3˅ѝ਼DŽ⌘ޜᔿ˄8.4˅ѝⲴ࠶⇽ᱟањᑨ䟿ˈᆳሶн਼
ᵳ٬Ⲵ䍑⥞ᖂаॆ˄ֻྲˈᆳ؍䇱ྲ᷌ሩᡰᴹⲴ䇝㓳ṧֻxiˈf(xi)=cˈ䛓Ѹ fˆ (xq)mc˅DŽ
⌘ԕкk-䘁䛫㇇⌅Ⲵᡰᴹਈփ䜭ਚ㘳㲁kњ䘁䛫ԕ࠶㊫ḕ䈒⛩DŽྲ᷌֯⭘᤹䐍࣐ᵳˈ
䛓Ѹݱ䇨ᡰᴹⲴ䇝㓳ṧֻᖡ૽xqⲴ࠶㊫һᇎк⋑ᴹൿ༴ˈഐѪ䶎ᑨ䘌Ⲵᇎֻሩ fˆ (xq)Ⲵᖡ૽
ᖸሿDŽ㘳㲁ᡰᴹṧֻⲴᜏан䏣ᱟՊ֯࠶㊫䘀㹼ᗇᴤធDŽྲ᷌࠶㊫ањᯠⲴḕ䈒ᇎֻᰦ㘳㲁
ᡰᴹⲴ䇝㓳ṧֻˈᡁԜ〠↔Ѫޘተ˄global˅⌅DŽྲ᷌ӵ㘳㲁ᴰ䶐䘁Ⲵ䇝㓳ṧֻˈᡁԜ〠↔
Ѫተ䜘˄local˅⌅DŽᖃޜᔿ˄8.4˅Ⲵ⌅ࡉ㻛ᓄ⭘Ѫޘተ⌅ᰦˈᆳ㻛〠ѪShepard⌅˄Shepard
1968˅DŽ
8.2.2 ሯ k-䘇䛱㇍⌋Ⲻ䈪᱄
᤹䐍࣐ᵳⲴ k-䘁䛫㇇⌅ᱟа䶎ᑨᴹ᭸Ⲵᖂ㓣᧘⨶ᯩ⌅DŽᆳሩ䇝㓳ᮠᦞѝⲴಚ༠ᴹᖸ
ྭⲴ励ἂᙗˈ㘼фᖃ㔉ᇊ䏣ཏབྷⲴ䇝㓳䳶ਸᰦᆳҏ䶎ᑨᴹ᭸DŽ⌘䙊䗷ਆ k њ䘁䛫Ⲵ࣐ᵳᒣ
൷ˈਟԕ⎸䲔ᆔ・Ⲵಚ༠ṧֻⲴᖡ૽DŽ
ᓄ⭘ k-䘁䛫㇇⌅Ⲵањᇎ䐥䰞仈ᱟˈᇎֻ䰤Ⲵ䐍ᱟṩᦞᇎֻⲴᡰᴹᙗ˄ҏቡᱟवਜ਼
ᇎֻⲴ⅗∿オ䰤Ⲵᡰᴹḷ䖤˅䇑㇇ⲴDŽ䘉о䛓Ӌਚ䘹ᤙޘ䜘ᇎֻᙗⲴањᆀ䳶Ⲵᯩ⌅н
਼ˈֻྲߣㆆṁᆖҐ㌫㔏DŽѪҶ⨶䀓䘉ㆆ⮕Ⲵᖡ૽ˈ㘳㲁ᢺ k-䘁䛫㇇⌅ᓄ⭘ࡠ䘉ṧањ䰞
仈˖⇿њᇎֻ⭡ 20 њᙗ᧿䘠ˈն൘䘉Ӌᙗѝӵᴹ 2 њоᆳⲴ࠶㊫ᱟᴹޣDŽ൘䘉ᛵߥ
лˈ䘉єњޣᙗⲴ٬а㠤Ⲵᇎֻਟ㜭൘䘉њ 20 㔤Ⲵᇎֻオ䰤ѝ䐍ᖸ䘌DŽ㔃᷌ˈ䎆
䘉 20 њᙗⲴլᙗᓖ䟿Պ䈟ሬ k-䘁䛫㇇⌅Ⲵ࠶㊫DŽ䘁䛫䰤Ⲵ䐍Պ㻛བྷ䟿Ⲵнޣᙗ
ᡰ᭟䝽DŽ䘉⭡Ҿᆈ൘ᖸཊнޣᙗᡰሬ㠤Ⲵ䳮仈ˈᴹᰦ㻛〠Ѫ㔤ᓖ⚮䳮˄curse of
dimensionality˅DŽᴰ䘁䛫ᯩ⌅ሩ䘉њ䰞仈⢩࡛ᝏDŽ
䀓ߣ䈕䰞仈Ⲵањᴹ䏓Ⲵᯩ⌅ᱟˈ ˄1˅ᖃ䇑㇇єњᇎֻ䰤Ⲵ䐍ᰦሩ⇿њᙗ࣐ᵳDŽ䘉
ᖃҾ᤹∄ֻ㕙᭮⅗∿オ䰤ѝⲴḷ䖤ˈ㕙⸝ሩᓄҾнཚޣᙗⲴḷ䖤ˈ䮯ሩᓄҾᴤ
ⲴޣᙗⲴḷ䖤DŽ⇿њḷ䖤ᓄըኅⲴᮠ䟿ਟԕ䙊䗷Ӕ৹傼䇱Ⲵᯩ⌅㠚ࣘߣᇊDŽާփڊ
⌅ྲлˈ俆ٷݸᇊ֯⭘ഐᆀzjըኅ˄҈˅ㅜjṩḷ䖤ˈ䘹ᤙzjⲴњ٬z1}znԕ֯ᆖҐ㇇⌅Ⲵ
ⵏᇎ࠶㊫䭉䈟⦷ᴰሿॆDŽަ⅑ˈ䘉њⵏᇎ䭉䈟⦷ਟԕ֯⭘Ӕ৹傼䇱ᶕՠ䇑DŽᡰԕˈа㇇⌅
ᱟ䲿ᵪ䘹ਆ⧠ᴹᮠᦞⲴањᆀ䳶Ѫ䇝㓳ṧֻˈ❦ਾߣᇊz1}znⲴ٬࢙֯։ṧֻⲴ࠶㊫䭉䈟
⦷ᴰሿॆDŽ䙊䗷ཊ⅑䟽༽䘉њ༴⨶䗷〻ˈਟԕ࣐֯ᵳഐᆀⲴՠ䇑ᴤ࣐߶⺞DŽ䘉ըኅḷ䖤
ԕՈॆk-䘁䛫㇇⌅Ⲵ䗷〻ˈᨀҶаᣁࡦᰐޣᙗᖡ૽ⲴᵪࡦDŽ
˄2˅ਖཆаᴤᕪᴹ࣋Ⲵᯩ⌅ᱟӾᇎֻオ䰤ѝᆼ⎸ޘ䲔ᴰнⲴޣᙗDŽ䘉ㅹ᭸Ҿ䇮
㖞Ḁњ㕙᭮ഐᆀzjѪ 0DŽMoore & Lee˄1994˅䇘䇪Ҷᴹ᭸ⲴӔ৹傼䇱ᯩ⌅ˈѪk-䘁䛫㇇⌅䘹
ᤙⲴޣᙗᆀ䳶DŽ⺞࠷ൠ䇢ˈԆԜ᧒㍒ҶสҾĀ⮉а⌅ā˄leave-one-out˅ⲴӔ৹傼䇱ˈ൘
䘉ᯩ⌅ѝˈmњ䇝㓳ᇎֻⲴ䳶ਸԕਟ㜭ᯩᔿ㻛࠶ᡀm-1 њᇎֻⲴ䇝㓳䳶ਸ઼ 1 њᇎֻ
Ⲵ⍻䈅䳶ਸDŽ䘉ᯩ⌅൘k-䘁䛫㇇⌅ѝᱟᇩ᱃ᇎ⧠ⲴˈഐѪ⇿а⅑䟽ᯠᇊѹ䇝㓳䳶ᰦн䴰㾱
仍ཆⲴ䇝㓳ᐕDŽ⌘к䶒Ⲵєᯩ⌅䜭ਟԕ㻛ⴻԕḀњᑨ䟿ഐᆀըኅḷ䖤DŽਖཆа
ਟ䘹Ⲵ⌅ڊᱟ֯⭘ањ൘ᇎֻオ䰤кਈॆⲴ٬ըኅḷ䖤DŽ䘉ṧ໎࣐Ҷ㇇⌅䟽ᯠᇊѹ䐍ᓖ
䟿Ⲵ㠚⭡ᓖˈ❦㘼ᆳҏ໎࣐Ҷ䗷ᓖᤏਸⲴ仾䲙DŽᡰԕˈተ䜘ըኅḷ䖤Ⲵᯩ⌅ᱟнཚᑨ㿱ⲴDŽ
ᓄ⭘k-䘁䛫㇇⌅Ⲵਖཆањᇎ䐥䰞仈ᱟྲօᔪ・儈᭸Ⲵ㍒ᕅDŽഐѪ䘉њ㇇⌅᧘䘏ᡰᴹⲴ
༴⨶ˈⴤࡠ᧕᭦ࡠањᯠⲴḕ䈒ˈᡰԕ༴⨶⇿њᯠḕ䈒ਟ㜭䴰㾱བྷ䟿Ⲵ䇑㇇DŽⴞࡽᐢ㓿ᔰਁ
Ҷᖸཊᯩ⌅⭘ᶕሩᆈۘⲴ䇝㓳ṧֻ䘋㹼㍒ᕅˈԕׯ൘໎࣐аᇊᆈۘᔰ䬰ᛵߥлᴤ儈᭸ൠ⺞ᇊ
ᴰ䘁䛫DŽа㍒ᕅᯩ⌅ᱟkd-tree˄Bentley 1975˗Friedman et al. 1977˅ˈᆳᢺᇎֻᆈۘ൘ṁⲴ
ਦ㔃⛩ˈ䛫䘁Ⲵᇎֻᆈۘ൘਼ањᡆ䱴䘁Ⲵ㔃⛩DŽ䙊䗷⍻䈅ᯠḕ䈒xqⲴ䘹ᇊᙗˈṁⲴ
䜘㔃⛩ᢺḕ䈒xqᧂࡇࡠⲴޣਦ㔃⛩DŽ
8.2.3 ᵥ䈣⌞䀙
൘ޣҾᴰ䘁䛫⌅઼ተ䜘࣐ᵳഎᖂ⌅Ⲵᖸཊ᮷⥞ѝˈ֯⭘ҶаӋᶕ㠚㔏䇑⁑ᔿ䇶࡛亶ฏⲴ
ᵟ䈝DŽ൘䰵䈫䘉Ӌ᮷⥞ᰦˈ⸕䚃лࡇᵟ䈝ᱟᴹᑞࣙⲴ˖
z എᖂ˄Regression˅Ⲵਜ਼ѹᱟ䙬䘁ањᇎ٬ⴞḷ࠭ᮠDŽ
z Ṩ࠭ᮠ˄Kernel function˅ᱟањ䐍࠭ᮠˈᆳ⭘ᶕߣᇊ⇿њ䇝㓳ṧֻⲴ
ᵳ٬DŽᦒਕ䈍䈤ˈṨ࠭ᮠቡᱟ֯wi=K(d(xi, xq))Ⲵ࠭ᮠKDŽ
8.3 ቶ䜞ࣖᵹഔᖈ
ࡽа㢲᧿䘠Ⲵᴰ䘁䛫ᯩ⌅ਟԕ㻛ⴻ൘অаⲴḕ䈒⛩x=xqк䙬䘁ⴞḷ࠭ᮠf(x)DŽተ䜘࣐
ᵳഎᖂᱟ䘉ᯩ⌅Ⲵ᧘ᒯDŽᆳ൘⧟㔅xqⲴተ䜘४ฏѪⴞḷ࠭ᮠfᔪ・᰾⺞Ⲵ䙬䘁DŽተ䜘࣐
ᵳഎᖂ֯⭘䱴䘁Ⲵᡆ䐍࣐ᵳⲴ䇝㓳ṧֻᶕᖒᡀ䘉ሩfⲴተ䜘䙬䘁DŽֻྲˈᡁԜਟԕ֯⭘
㓯ᙗ࠭ᮠǃҼ⅑࠭ᮠǃཊቲ⾎㓿㖁㔌ᡆ㘵ަԆ࠭ᮠᖒᔿ൘⧟㔅xqⲴ䛫ฏ䙬䘁ⴞḷ࠭ᮠDŽ Āተ
䜘࣐ᵳഎᖂā〠ѝˈѻᡰԕਛĀተ䜘āᱟഐѪⴞḷ࠭ᮠⲴ䙬䘁ӵӵṩᦞḕ䈒⛩䱴䘁Ⲵᮠᦞˈ
ѻᡰԕਛĀ࣐ᵳāᱟഐѪ⇿ањ䇝㓳ṧֻⲴ䍑⥞ᱟ⭡ᆳоḕ䈒⛩䰤Ⲵ䐍࣐ᵳⲴˈѻᡰԕਛ
ĀഎᖂāᱟഐѪ㔏䇑ᆖҐ⭼ᒯ⌋֯⭘䘉њᵟ䈝ᶕ㺘⽪䙬䘁ᇎᮠ٬࠭ᮠⲴ䰞仈DŽ
㔉ᇊањᯠⲴḕ䈒ᇎֻxqˈተ䜘࣐ᵳഎᖂⲴа㡜ᯩ⌅ᱟᔪ・ањ䙬䘁 fˆ ˈ֯ fˆ ᤏਸ⧟㔅
xqⲴ䛫ฏⲴ䇝㓳ṧֻDŽ❦ਾ⭘䘉њ䙬䘁ᶕ䇑㇇ fˆ (xq)Ⲵ٬ˈҏቡᱟѪḕ䈒ᇎֻՠ䇑Ⲵⴞḷ
٬䗃ࠪDŽ❦ਾ fˆ Ⲵ᧿䘠㻛ࡐ䲔ˈഐѪሩҾ⇿ањ⤜・Ⲵḕ䈒ᇎֻ䜭Պ䇑㇇н਼Ⲵተ䜘䙬䘁DŽ
8.3.1 ቶ䜞ࣖᵹ㓵ᙝഔᖈ
л䶒ˈᡁԜݸ㘳㲁ተ䜘࣐ᵳഎᖂⲴаᛵߥˈণ֯⭘ྲлᖒᔿⲴ㓯ᙗ࠭ᮠᶕ䙬䘁xq䛫ฏ
Ⲵⴞḷ࠭ᮠf˖
fˆ (x)=w0+w1a1(x)+}+wnan(x)
઼ࡽ䶒аṧˈai(x)㺘⽪ᇎֻxⲴㅜiњᙗ٬DŽ
എᗶㅜ 4 ㄐѝᡁԜ䇘䇪Ⲵởᓖл䱽ᯩ⌅ˈ൘ᤏਸԕкᖒᔿⲴ㓯ᙗ࠭ᮠࡠ㔉ᇊⲴ䇝㓳䳶ਸ
ᰦˈᆳ㻛⭘ᶕࡠ֯䈟ᐞᴰሿॆⲴ㌫ᮠw0}wnDŽ൘䛓аㄐѝᡁԜᝏޤ䏓Ⲵᱟⴞḷ࠭ᮠⲴޘተ
䙬䘁DŽᡰԕᖃᰦᡁԜ᧘ሬࠪⲴᵳ٬䘹ᤙᯩ⌅ᱟ֯䇝㓳䳶ਸDкⲴ䈟ᐞᒣᯩ઼ᴰሿॆˈণ˖
1
E{ ¦ ( f ( x) fˆ ( x)) 2
2 xD
˄8.5˅
ṩᦞ䘉њ䈟ᐞᇊѹˈᡁԜᗇࠪҶԕлởᓖл䱽䇝㓳⌅ࡉ˖
'wj=K ¦
xD
(f(x)- fˆ (x))aj(x) ˄8.6˅
ަѝKᱟањᑨᮠˈ〠ѪᆖҐ䙏⦷DŽ㘼ф䘉њ⌅ࡉᐢ㓿㻛䟽ᯠ㺘⽪ˈ؞᭩Ҷަѝㅜ 4 ㄐ
ᡁԜᓄ䈕ྲօ؞᭩䘉њ䗷〻ᶕ᧘ሬࠪተ䜘䙬䘁˛ㆰঅⲴᯩ⌅ᱟ䟽ᯠᇊѹ䈟ᐞ߶ࡉE
ԕ⵰䟽Ҿᤏਸተ䜘䇝㓳ṧֻDŽл䶒㔉ࠪҶйਟ㜭Ⲵ䈟ᐞ߶ࡉDŽ⌘ᡁԜᢺ䈟ᐞ߉ѪE(xq)ˈ
ⴞⲴᱟѪҶᕪ䈳ⴞࡽⲴ䈟ᐞ㻛ᇊѹѪḕ䈒⛩xqⲴ࠭ᮠDŽ
1. ਚ൘ k њ䘁䛫кⲴ䈟ᐞᒣᯩ઼ᴰሿॆ˖
1
E1 ( xq ) { ¦ ( f ( x) fˆ ( x)) 2
2 xxqⲴkњ䘁䛫
2. ֯ᮤњ䇝㓳ṧֻ䳶ਸDкⲴ䈟ᐞᒣᯩ઼ᴰሿॆˈնሩ⇿њ䇝㓳ṧֻ࣐ᵳˈ
ᵳ٬ѪޣҾ䐍xq䐍ⲴḀњ䙂߿࠭ᮠK˖
1
E2 ( xq ) { ¦
2 xD
( f ( x) fˆ ( x)) 2 K (d ( x q , x))
3. 㔬ਸ 1 ઼ 2˖
1
E3 ( xq ) { ¦ ( f ( x) fˆ ( x)) 2 K (d ( xq , x))
2 xxqⲴkњ䘁䛫
߶ࡉ 2 ᡆ䇨ᱟᴰԔӪ┑ⲴˈഐѪᆳݱ䇨⇿њ䇝㓳ṧֻ䜭ሩxqⲴ࠶㊫ӗ⭏ᖡ૽DŽ❦㘼䘉
ᯩ⌅ᡰ䴰Ⲵ䇑㇇䟿䲿⵰䇝㓳ṧֻᮠ䟿㓯ᙗ໎䮯DŽ߶ࡉ 3 ᖸྭൠ䘁լҶ߶ࡉ 2 ᒦфާᴹྲл
Ո⛩˖䇑㇇ᔰ䬰⤜・Ҿ䇝㓳ṧֻᙫᮠˈ㘼ӵ䎆Ҿᡰ㘳㲁Ⲵᴰ䘁䛫ᮠkDŽ
⌘䘉њᯠⲴ⌅ࡉ઼ޜᔿ˄8.6˅㔉ࠪⲴ⌅ࡉⲴᐞᔲᱟˈᇎֻxሩᵳ٬ᴤᯠⲴ䍑⥞⧠൘҈
кҶањ䐍㖊亩K(d(xq, x))ˈᒦфӵሩkњᴰ䛫䘁Ⲵ䇝㓳ᇎֻⲴ䈟ᐞ≲઼DŽһᇎкˈྲ᷌
㾱֯ањ㓯ᙗ࠭ᮠᤏਸപᇊⲴ䇝㓳ṧֻ䳶ਸˈ䛓ѸᴹаӋ∄ởᓖл䱽ᴤ儈᭸Ⲵᯩ⌅ˈᆳԜⴤ
᧕≲䀓ᡰ䴰㾱Ⲵ㌫ᮠw0}wnDŽAtkeson et al.˄1997a˅઼Bishop˄1995˅䈳ḕҶࠐњ䘉ṧⲴᯩ
⌅DŽ
8.3.2 ቶ䜞ࣖᵹഔᖈⲺ䈪᱄
к䶒ᡁԜ㘳㲁Ҷ֯⭘ањ㓯ᙗ࠭ᮠ൘ḕ䈒ᇎֻxq䛫ฏ䙬䘁fDŽޣҾተ䜘࣐ᵳഎᖂⲴ᮷
⥞ѝˈ൘ሩ䇝㓳ṧֻ䐍࣐ᵳᯩ䶒वਜ਼བྷ䟿Ⲵਟ䘹ᯩ⌅ˈ䘈वਜ਼བྷ䟿Ⲵⴞḷ࠭ᮠተ䜘䙬䘁ᯩ
⌅DŽ൘བྷཊᮠᛵߥлᱟ䙊䗷ањᑨ䟿ǃ㓯ᙗ࠭ᮠᡆҼ⅑࠭ᮠᶕተ䜘䙬䘁ⴞḷ࠭ᮠDŽᴤ༽ᵲⲴ
࠭ᮠᖒᔿнཚᑨ㿱ˈഐᱟ˄1˅ሩ⇿њḕ䈒ᇎֻ⭘ᴤ༽ᵲⲴ࠭ᮠᶕᤏਸˈަԓԧॱ࠶儈ᰲ˗
˄2˅൘䏣ཏሿⲴᇎֻオ䰤ᆀฏкˈ֯⭘䘉ӋㆰঅⲴ䘁լᐢ㜭ᖃྭൠ⁑ᤏⴞḷ࠭ᮠDŽ
8.4 ᖺੇะ࠳ᮦ
䟼Ⲵkᱟ⭘ᡧᨀⲴᑨ䟿ˈ⭘ᶕᤷᇊ㾱वਜ਼ⲴṨ࠭ᮠⲴᮠ䟿DŽቭ㇑ fˆ (x)ᱟሩf(x)Ⲵޘተ䙬䘁ˈ
ᯩᐞᱟ V u DŽ
2
1 2
d ( xu , x )
2V u2
Ku(d(xu, x)) = e
л䶒ᡁԜᶕ䳶ѝ䇘䇪䘉њᑨ㿱Ⲵ儈ᯟṨ࠭ᮠDŽṩᦞHartman et al.˄1990˅ᡰᤷࠪⲴˈޜ
ᔿ˄8.8˅䘉ṧⲴ࠭ᮠᖒᔿ㜭ཏԕԫሿⲴ䈟ᐞ䙬䘁ԫօ࠭ᮠˈਚ㾱ԕк儈ᯟṨⲴᮠ䟿k䏣ཏ
བྷˈᒦфਟԕ࠶࡛ᤷᇊ⇿њṨⲴᇭᓖV2DŽ
ޜᔿ˄8.8˅㔉ࠪⲴ࠭ᮠਟԕ㻛ⴻᱟ᧿䘠ҶањєቲⲴ㖁㔌ˈㅜаቲ䇑㇇н਼ⲴKu(d(xu,
x))ˈㅜҼቲ䇑㇇ㅜаቲঅݳ٬Ⲵ㓯ᙗ㓴ਸDŽമ 8-2 ⭫ࠪҶањᖴੁส࠭ᮠ㖁㔌ⲴֻᆀDŽ
插图——原书页码:239
മ 8-2 ањᖴੁส࠭ᮠ㖁㔌
⇿њ䳀㯿অݳӗ⭏ањ◰ਁ˄activation˅ˈᆳ⭡ԕḀњᇎֻxuѪѝᗳⲴ儈ᯟ࠭ᮠߣᇊDŽᡰԕˈ䲔䶎
x䶐䘁xuˈࡉᆳⲴ◰ਁ᧕䘁Ҿ 0DŽ䗃ࠪঅݳӗ⭏Ⲵ䗃ࠪᱟ䳀㯿অⲴਁ◰ݳ㓯ᙗ㓴ਸDŽቭ㇑䘉䟼⭫ࠪ
Ⲵ㖁㔌ӵᴹањ䗃ࠪˈնᱟҏਟԕवਜ਼ཊњ䗃ࠪDŽ
⇿њ䳀㯿অݳDŽㅜҼˈ֯⭘ᔿ˄8.5˅㔉ࠪⲴޘተ䈟ᐞ߶ࡉᶕ䇝㓳ᵳ٬wuˈ֯㖁㔌ᤏਸ䇝㓳
ᮠᦞ〻ᓖᴰབྷॆDŽഐѪṨ࠭ᮠ൘ㅜҼ䱦⇥ᱟ؍ᤱнਈⲴˈᡰԕ㓯ᙗᵳ٬wuਟԕ㻛䶎ᑨ儈᭸ൠ
䇝㓳ᗇࡠDŽ
ӪԜᐢ㓿ᨀࠪҶࠐᯩ⌅ᶕ䘹ਆ䘲ᖃⲴ䳀㯿অݳᡆ㘵䈤Ṩ࠭ᮠⲴᮠ䟿DŽаᯩ⌅ᱟѪ⇿
ањ䇝㓳ṧֻ<xi, f(xi)>࠶䝽ањ儈ᯟṨ࠭ᮠˈ↔儈ᯟ࠭ᮠⲴѝᗳ⛩㻛䇮ѪxiDŽᡰᴹ儈ᯟ࠭ᮠ
ⲴᇭᓖV2ਟ㻛䍻Ѫ਼ṧⲴ٬DŽ䙊䗷䘉ᯩ⌅ˈRBF㖁㔌ᆖҐⴞḷ࠭ᮠⲴޘተ䙬䘁ˈަѝ⇿њ
㖁㔌㋮⺞ൠᤏਸ䇝㓳ᮠᦞDŽҏቡᱟ䈤ˈሩҾԫmњ䇝㓳ṧֻ䳶ਸˈѪҶਸᒦmњ儈ᯟṨ࠭
ᾲ㘼䀰ѻˈ⭘ཊњተ䜘Ṩ࠭ᮠⲴ㓯ᙗ㓴ਸ㺘⽪Ⲵᖴੁส࠭ᮠ㖁㔌ᨀҶаⴞḷ࠭ᮠⲴ
ޘተ䙬䘁DŽӵᖃ䗃 ޕx 㩭ޕḀњṨ࠭ᮠⲴѝᗳ઼ᇭᓖᡰᇊѹⲴ४ฏᰦˈ䘉њṨ࠭ᮠⲴ٬
ᱟнਟᘭ⮕ⲴDŽഐ↔ˈRBF 㖁㔌ਟԕ㻛ⴻⴞḷ࠭ᮠⲴཊњተ䜘䙬䘁Ⲵᒣ━㓯ᙗ㓴ਸDŽRBF
㖁㔌Ⲵањޣ䭞Ո⛩ᱟˈо৽ੁՐ㇇⌅䇝㓳Ⲵࡽ侸㖁㔌∄ˈᆳⲴ䇝㓳ᴤ࣐儈᭸DŽ䘉ᱟഐ
Ѫ RBF 㖁㔌Ⲵ䗃ޕቲ઼䗃ࠪቲਟԕ㻛࠶࡛䇝㓳DŽ
8.5 ะӄṾׁⲺ᧞⨼
k-䘁䛫㇇⌅઼ተ䜘࣐ᵳഎᖂ䜭ᱟสҾᇎֻⲴᯩ⌅ˈᆳԜާᴹйњޣⲴ਼ޡ䭞⢩ᙗDŽㅜ 1ˈ
ᆳԜᱟ⎸ᶱᆖҐᯩ⌅ˈ䜭ᢺ൘䇝㓳ᮠᦞкⲴ⌋ॆ᧘䘏㠣䙷ࡠањᯠⲴḕ䈒ᇎֻᰦDŽㅜ 2ˈᆳ
Ԝ䙊䗷࠶᷀լⲴᇎֻᶕ࠶㊫ᯠⲴḕ䈒ᇎֻˈ㘼ᘭ⮕оḕ䈒ᶱަн਼ⲴᇎֻDŽㅜ 3ˈᆳԜᢺ
ᇎֻ㺘⽪Ѫ n 㔤⅗∿オ䰤ѝⲴᇎᮠ⛩DŽสҾṸֻⲴ᧘⨶˄Case-based reasoningˈCBR˅䘉
ᆖҐ㤳රสҾࡽєњࡉˈնнवᤜㅜ 3 њDŽ൘ CBR ѝˈа㡜֯⭘ᴤѠᇼⲴㅖਧ᧿䘠ᶕ㺘
⽪ᇎֻ˗ᓄൠˈ⭘ᶕỰ㍒ᇎֻⲴᯩ⌅ҏᴤ࣐༽ᵲDŽCBR ᐢ㻛ᓄ⭘Ҿ䀓ߣᖸཊ䰞仈ˈ∄ྲˈ
ṩᦞᮠᦞᓃѝᆈۘⲴԕࡽⲴ䇮䇑മ㓨ˈᶕ䘋㹼ᵪỠ䇮༷Ⲵᙫփ䇮䇑˄Sycara et al. 1992˅
(solidworks, proe ㅹй㔤䖟ԦⲴ䇮䇑⨶ԕ৺ᓄ⭘ੇ˛˛˛)˗ṩᦞԕࡽⲴ㻱ߣᶕሩᯠⲴ⌅ᖻ
ṸԦ䘋㹼᧘⨶˄Ashley 1990˅˗䙊䗷ሩԕࡽⲴլ䰞仈Ⲵ䀓ߣᯩṸⲴ༽⭘ᡆਸᒦˈᶕ䀓ߣ㿴
ࡂ઼䈳ᓖ䰞仈˄Veloso 1992˅DŽ
Ѫԕਾ䇘䇪Ⲵสˈ䇙ᡁԜ㘳㲁สҾṸֻⲴ᧘⨶㌫㔏ⲴањֻᆀDŽCADET㌫㔏
˄Sycara et al. 1992˅䟷⭘สҾṸֻⲴ᧘⨶ᶕ䖵ࣙㆰঅᵪỠ䇮༷˄ֻྲ≤嗉ཤ˅Ⲵᙫփ䇮䇑DŽ
ᆳ֯⭘ањᮠᦞᓃˈަѝवਜ਼བྷ㓖 75 њԕࡽⲴ䇮䇑ᡆ䇮䇑⡷ᯝˈᶕ᧘㦀ㅖਸᯠⲴ䇮䇑㿴Ṭ
Ⲵᙫփ䇮䇑DŽᆈѝ⇿ањᇎֻᱟ䙊䗷ᆳⲴ㔃ᶴ઼ᇊᙗⲴ࣏㜭ᶕ㺘⽪ⲴDŽᓄⲴˈᯠⲴ䇮䇑
䰞仈ᱟ䙊䗷ᡰ㾱≲Ⲵ࣏㜭઼㔃ᶴᶕ㺘⽪ⲴDŽമ 8-3 ⭫ࠪҶ䘉њ䰞仈DŽമⲴкॺ䜘࠶ᱮ⽪Ҷа
њިරⲴᆈۘṸֻˈ㻛〠ѪTර᧕ཤ㇑DŽᆳⲴ࣏㜭㻛㺘⽪Ѫ䗃઼ޕ䗃ࠪ⛩Ⲵ⍱䟿઼ᓖ䰤Ⲵ
ᇊᙗޣ㌫DŽ൘ਣ࣏Ⲵח㜭᧿䘠ѝˈḷᴹĀ+āⲴ㇝ཤ㺘᰾㇝ཤཤ䜘Ⲵਈ䟿䲿⵰㇝ཤቮ䜘Ⲵਈ
䟿кॷDŽֻྲˈ䗃ࠪ⍱䟿Q3䲿⵰䗃ޕ⍱䟿Q1໎䮯DŽ㊫լൠˈ Ā-āḷ䇠㺘᰾㇝ཤཤ䜘Ⲵਈ䟿䲿
⵰㇝ཤቮ䜘Ⲵਈ䟿л䱽DŽ䘉ᑵമⲴлॺ䜘࠶⭫ࠪҶањᯠⲴ䇮䇑䰞仈ˈᆳ䙊䗷ᯠ䇮䇑ѝᡰ㾱
≲Ⲵ࣏㜭ᶕ᧿䘠DŽ䘉њ࣏㜭᧿㔈Ҷа≤嗉ཤⲴ㹼Ѫ⢩ᖱDŽ䘉䟼Qcᤷ䘋ޕ嗉ཤⲴߧ≤⍱䟿ˈ
Qhᤷ✝≤Ⲵ䗃ޕ⍱䟿ˈQmᤷ⍱ࠪ嗉ཤⲴঅаਸ⍱䟿DŽ㊫լൠˈTcǃTh઼Tm࠶࡛ᤷ✝≤ǃߧ
≤઼ਸ≤⍱ⲴᓖDŽਈ䟿Ct㺘⽪䗃ࡠޕ嗉ཤⲴᓖ᧗ࡦؑਧˈCf㺘⽪ሩ≤⍱Ⲵ᧗ࡦؑਧDŽ
⌘ˈᡰ㾱≲Ⲵ࣏㜭᧿䘠ѝᤷࠪˈ䘉Ӌ᧗ࡦؑਧCt઼Cf⭘ᶕᖡ૽≤⍱Qc઼QhˈӾ㘼䰤᧕ᖡ૽
嗉ཤⲴ䗃ࠪ⍱䟿Qm઼ᓖTmDŽ
插图——原书页码:241
Structure-㔃ᶴ
Function-࣏㜭
Structure-㔃ᶴ
Function-࣏㜭
മ 8-3 ањᆈۘⲴṸ઼ֻањᯠ䰞仈
㔉ᇊᯠ䇮䇑䰞仈Ⲵ࣏㜭䈤᰾ˈCADET ӾᆳⲴṸֻᓃѝᩌ㍒ᆈۘⲴֻˈ֯ᆳⲴ࣏㜭᧿䘠
઼ᯠ䇮䇑䰞仈३䝽DŽྲ᷌ਁ⧠Ҷањ㋮⺞Ⲵ३䝽ˈ㺘᰾ḀњᆈۘṸֻ㋮⺞ᇎ⧠Ҷᡰ㾱≲Ⲵ
࣏㜭ˈ䛓Ѹਟԕ䘄എ䘉њṸֻѪᯠ䇮䇑䰞仈Ⲵᔪ䇞ᯩṸDŽྲ᷌⋑ᴹਁ⧠㋮⺞Ⲵ३䝽ˈ
CADET ਟ㜭ࡠ३䝽ᡰ䴰࣏㜭Ⲵн਼ᆀമⲴṸֻDŽֻྲˈ൘മ 8-3 ѝ T ර᧕ཤⲴ࣏㜭३䝽
Ҷ ≤ 嗉 ཤ ࣏ 㜭 മ Ⲵ а њ ᆀ മ DŽ ᴤ а 㡜 ൠ 䇢 ˈ CADET ൘ є њ ࣏ 㜭 മ 䰤 ᩌ ㍒ ਼ ᶴ ᆀ മ
˄isomorphisms subgraph˅
ˈԕਁ⧠ањṸֻⲴḀ䜘࠶ˈ֯ᆳ३䝽䇮䇑㿴Ṭ䈤᰾Ⲵᓄ䜘࠶DŽ
↔ཆˈ㌫㔏ਟԕ࣐ᐕⲴ࣏㜭䈤᰾മˈӗ⭏ㅹԧⲴᆀമԕ३䝽ᴤཊⲴṸֻDŽᆳ֯⭘ޣҾ⢙
⨶ᝏᓄⲴа㡜⸕䇶ᶕࡋᔪ䘉ṧⲴ࣐ᐕ䗷Ⲵ࣏㜭മDŽֻྲˈ࡙⭘а䟽߉㿴ࡉਟԕᢺ䘉њᝏᓄ˖
A
o B
䟽߉Ѫ
A
o x
o B
䙊䗷Ự㍒३䝽н਼ᆀമⲴཊњṸֻˈᴹᰦਟԕ᧕ᗇࡠᮤњ䇮䇑DŽа㡜ᶕ䈤ˈӾཊњỰ
㍒ࡠⲴṸֻӗ⭏ᴰ㓸ᯩṸⲴ䗷〻ਟԕᖸ༽ᵲDŽѪҶਸᒦᆈۘṸֻѝⲴỰ㍒ࡠⲴ䜘࠶ˈਟ㜭䴰
㾱Ӿཤ䇮䇑㌫㔏Ⲵњ䜘࠶DŽҏਟ㜭䴰㾱എⓟԕࡽⲴ䇮䇑ᆀⴞḷˈӾ㘼ђᔳࡽ䶒Ự㍒ࡠⲴṸ
ֻDŽCADET ਸᒦ઼㠚䘲ᓄᐢỰ㍒ࡠṸֻᒦᖒᡀᴰ㓸䇮䇑Ⲵ㜭࣋ᖸᴹ䲀ˈᆳѫ㾱䎆⭘ᡧᶕ
ڊ㠚䘲ᓄ䱦⇥Ⲵ༴⨶DŽ↓ྲ Sycara et al.˄1992˅ᡰ᧿䘠ⲴˈCADET ᱟањ⹄ウ⭘Ⲵර㌫
㔏ˈ⭘ᶕ᧒㍒สҾṸֻⲴ᧘⨶൘ᙫփ䇮䇑ѝⲴ▌൘⭘DŽᆳнާ༷⭘ᶕᢺ䘉Ӌᣭ䊑Ⲵᙫփ䇮
䇑ᨀ⛬ᡀᴰ㓸䇮䇑Ⲵ࠶᷀㇇⌅DŽ
ሩҾCADETⲴ䰞仈Ṷ઼ᷦสҾᇎֻⲴᯩ⌅˄ֻྲk-䘁䛫㇇⌅˅Ⲵа㡜Ṷᷦˈ࠶᷀ᆳԜ
ѻ䰤Ⲵሩᓄѻ༴ᱟᴹ⳺ⲴDŽ൘CADETѝ⇿њᆈۘⲴ䇝㓳ṧֻ᧿㔈Ҷањ࣏㜭മԕ৺ᇎ⧠䈕
࣏㜭Ⲵ㔃ᶴDŽᯠⲴḕ䈒ሩᓄᯠⲴ࣏㜭മDŽഐ↔ˈᡁԜਟԕᢺCADETⲴ䰞仈᱐ሴࡠḷ߶Ⲵᆖ
Ґ䰞仈ᇊѹѝDŽަѝᇎֻオ䰤XᇊѹѪᡰᴹ࣏㜭മⲴオ䰤DŽⴞḷ࠭ᮠf᱐ሴࡠᇎ⧠䘉Ӌ࣏㜭Ⲵ
㔃ᶴDŽ⇿њᆈۘ䇝㓳ṧֻ<x, f(x)>ᱟањᒿ᧿ˈڦ䘠Ḁњ࣏㜭മx઼ᇎ⧠xⲴ㔃ᶴf(x)DŽ㌫㔏ᗵ
享ᆖҐ䇝㓳Ṹֻˈԕ䗃ࠪ┑䏣࣏㜭മḕ䈒䗃ޕxqⲴ㔃ᶴf(xq)DŽ
ᾲᤜൠ䇢ˈสҾṸֻⲴ᧘⨶ᱟаสҾᇎֻⲴᆖҐᯩ⌅ˈ൘䘉ᯩ⌅ѝˈᇎֻ˄Ṹֻ˅
ਟԕᱟѠᇼⲴޣ㌫᧿䘠˗㘼ф൘䈕ᯩ⌅ѝˈѪҶ䀓ߣᖃࡽḕ䈒ˈṸֻỰ㍒઼ਸᒦ䗷〻ਟ㜭
䎆Ҿ⸕䇶᧘⨶઼ᩌ㍒ᇶ䳶Ⲵ䰞仈≲䀓ᯩ⌅DŽⴞࡽޣҾสҾṸֻⲴ᧘⨶⹄ウⲴањ䈮仈ᱟˈ᭩
䘋㍒ᕅṸֻⲴᯩ⌅DŽ䘉䟼Ⲵѝᗳ䰞仈ᱟਕ⌅լᓖ䟿˄ֻྲˈ࣏㜭മѻ䰤Ⲵᆀമ਼ᶴ˅ӵ㜭
䘁լൠᤷࠪ⢩ᇊṸֻо⢩ᇊ䰞仈ⲴޣᓖDŽᖃ CBR ㌫㔏䈅മ༽⭘Ự㍒ࡠⲴṸֻᰦˈᆳਟ㜭
䙷ࡠਕ⌅լᓖ䟿ѝ⋑ᴹᦅࡠⲴ䳮⛩DŽֻྲˈ൘ CADET ѝˈỰ㍒ࡠⲴཊњ䇮䇑⡷ᯝਟ㜭
ᖬ↔нެᇩˈ֯ᗇᆳԜᰐ⌅㻛ਸᒦࡠањ㔏аⲴᴰ㓸䇮䇑ѝDŽа㡜ᖃ䘉ᛵߥਁ⭏ᰦˈCBR
㌫㔏ਟഎⓟᩌ㍒ਖཆⲴṸֻԕ䘲ᓄ⧠ᴹⲴṸֻˈᡆ㘵≲ࣙҾަԆⲴ䰞仈≲䀓ᯩ⌅DŽ䟽㾱Ⲵᱟˈ
ᖃỰ⍻ࡠ䘉ṧⲴ䳮⛩ᰦˈᆳԜҏᨀҶ⭘ᶕ᭩䘋լᙗᓖ䟿˄ᡆㅹԧⲴˈṸֻᓃ㍒ᕅ㔃ᶴ˅
Ⲵ䇝㓳ᮠᦞDŽ⺞࠷ൠ䇢ˈྲ᷌ṩᦞլᙗᓖ䟿Ự㍒ࡠҶањṸֻˈն൘䘋а↕Ⲵ࠶᷀ѝਁ⧠
䘉њṸֻоᖃࡽⲴ䇮䇑ᱟᰐˈⲴޣ䛓Ѹ䘉њլᙗᓖ䟿Պ㻛᭩䘋ˈԕׯሩҾԕਾⲴ㊫լḕ䈒
ᤂ㔍䘉њṸֻDŽ
8.6 ሯ⎾ᶷᆜҖૂ〥ᶷᆜҖⲺ䇺䇰
൘䘉аㄐѝᡁԜ㘳㲁Ҷй⎸ᶱᆖҐ˄lazy learning˅ᯩ⌅˖k-䘁䛫㇇⌅ǃተ䜘࣐ᵳഎᖂ
઼สҾṸֻⲴ᧘⨶DŽѻᡰԕ〠䘉Ӌᯩ⌅ᱟ⎸ᶱⲴˈᱟഐѪᆳԜᔦ䘏ҶྲօӾ䇝㓳ᮠᦞѝ⌋ॆ
Ⲵߣㆆˈⴤࡠ䙷ࡠањᯠⲴḕ䈒DŽᵜㄐ䇘䇪Ҷа〟ᶱᆖҐᯩ⌅˖ᆖҐᖴੁส࠭ᮠ㖁㔌Ⲵᯩ
⌅DŽѻᡰԕ〠䘉ᯩ⌅ᱟ〟ᶱⲴˈᱟഐѪᆳ൘㿱ࡠᯠⲴḕ䈒ѻࡽቡྭڊҶ⌋ॆⲴᐕüü൘
䇝㓳ᰦᨀӔҶᇊѹަⴞḷ࠭ᮠ䙬䘁Ⲵ㖁㔌㔃ᶴ઼ᵳ٬DŽṩᦞ਼ṧⲴ⨶䀓ˈᵜҖަԆㄐ㢲䇘䇪
ⲴᡰᴹަԆ㇇⌅䜭ᱟ〟ᶱᆖҐ㇇⌅˄ֻྲˈ৽ੁՐ㇇⌅ǃC4.5˅DŽ
൘㇇⌅㜭࣋ᯩ䶒ˈ⎸ᶱᯩ⌅઼〟ᶱᯩ⌅ᴹ᰾ᱮᐞᔲੇ˛ᡁԜݸ४࠶єᐞᔲ˖䇑㇇ᰦ䰤
Ⲵᐞᔲˈ઼ሩᯠḕ䈒Ⲵ࠶㊫ᐞᔲDŽ൘䇑㇇ᰦ䰤ᯩ䶒⎸ᶱᯩ⌅઼〟ᶱᯩ⌅ᱮ❦ᴹᐞᔲDŽֻྲˈ
⎸ᶱᯩ⌅൘䇝㓳ᰦа㡜䴰㾱䖳ቁⲴ䇑㇇ˈն൘亴⍻ᯠḕ䈒Ⲵⴞḷ٬ᰦ䴰㾱ᴤཊⲴ䇑㇇ᰦ䰤DŽ
ᴤสᵜⲴ䰞仈ᱟˈ൘ᖂ㓣ٿ㖞ᯩ䶒⎸ᶱ઼〟ᶱᯩ⌅ᱟᴹᇎ䍘ᙗⲴᐞᔲ˛൘䘉ᯩ䶒є
ᯩ⌅Ⲵޣ䭞ᐞᔲᱟ˖
x ⎸ᶱᯩ⌅൘ߣᇊྲօӾ䇝㓳ᮠᦞDѝ⌋ॆᰦ㘳㲁ḕ䈒ᇎֻxqDŽ
x 〟ᶱᯩ⌅н㜭ࡠڊ䘉а⛩ˈഐѪ൘㿱ࡠḕ䈒ᇎֻxqࡽˈᆳԜᐢ㓿䘹ਆҶሩⴞ
ḷ࠭ᮠⲴ˄ޘተ˅䙬䘁DŽ
䘉њ४࡛Պᖡ૽ᆖҐಘⲴ⌋ॆ㋮ᓖੇ˛ྲ᷌㾱≲⎸ᶱⲴ઼〟ᶱⲴᆖҐಘ䟷⭘਼ањٷ
䇮オ䰤Hˈ䛓ѸㆄṸᱟ㛟ᇊⲴDŽѪҶ䈤᰾䘉а⛩ˈ㘳㲁⭡㓯ᙗ࠭ᮠ㓴ᡀⲴٷ䇮オ䰤DŽࡽ䶒䇘
䇪Ⲵተ䜘࣐ᵳഎᖂ㇇⌅ᱟสҾ䘉ṧⲴٷ䇮オ䰤Ⲵ⎸ᶱᆖҐᯩ⌅DŽሩҾ⇿њᯠḕ䈒xqˈᆳṩᦞ
xq䱴䘁Ⲵ䇝㓳ṧֻ䘹ᤙањᯠⲴٷ䇮Ӿ䇝㓳ᮠᦞѝ⌋ॆDŽ৽ˈањ֯⭘਼ṧⲴ㓯ᙗ࠭ᮠٷ
䇮オ䰤Ⲵ〟ᶱᆖҐಘᗵ享൘㿱ࡠḕ䈒ѻࡽ䘹ᤙሩⴞḷ࠭ᮠⲴ䙬䘁DŽᡰԕ〟ᶱᆖҐಘᗵ享ᨀӔ
অњⲴ㓯ᙗ࠭ᮠٷ䇮ˈԕ㾶ⴆᮤњᇎֻオ䰤઼ᡰᴹᵚᶕⲴḕ䈒DŽ⎸ᶱᆖҐᯩ⌅ᴹ᭸ൠ֯⭘Ҷ
ᴤѠᇼⲴٷ䇮オ䰤ˈഐѪᆳ֯⭘ᖸཊн਼Ⲵተ䜘㓯ᙗ࠭ᮠᶕᖒᡀሩⴞḷ࠭ᮠⲴ䳀ਜ਼Ⲵޘተ䙬
䘁DŽ⌘ަԆⲴаӋᆖҐಘ઼ٷ䇮オ䰤ҏㅖਸ਼ṧⲴᛵߥDŽֻྲ৽ੁՐ㇇⌅Ⲵ⎸ᶱ⡸ᵜˈ
ਟԕሩ⇿њ⤜・Ⲵḕ䈒⛩ᆖҐн਼Ⲵ⾎㓿㖁㔌DŽ䘉оㅜ 4 ㄐ䇘䇪Ⲵ৽ੁՐ㇇⌅Ⲵ〟ᶱ⡸ᵜ
ᖒᡀሩ➗DŽ
к䶒а⇥ⲴṨᗳ㿲⛩ᱟˈ⎸ᶱⲴᆖҐಘਟԕ䙊䗷ᖸཊተ䜘䙬䘁Ⲵ㓴ਸ˄䳀ਜ਼ൠ˅㺘⽪ⴞ
ḷ࠭ᮠˈ❦㘼〟ᶱⲴᆖҐಘᗵ享൘䇝㓳ᰦᨀӔঅњⲴޘተ䙬䘁DŽഐ↔〟ᶱᆖҐⲴ઼⎸ᶱᆖҐ
ѻ䰤Ⲵᐞᔲણ⵰ሩⴞḷ࠭ᮠⲴޘተ䙬䘁઼ተ䜘䙬䘁ⲴᐞᔲDŽ
֯⭘ཊњተ䜘䙬䘁Ⲵ〟ᶱᯩ⌅ˈਟԕӗ⭏о⎸ᶱᯩ⌅Ⲵተ䜘䙬䘁਼ṧⲴ᭸᷌ੇ˛ᖴੁส
࠭ᮠ㖁㔌ਟԕ㻛ⴻੁ䘉њⴞḷⲴቍ䈅DŽRBF ᆖҐᯩ⌅ᱟ൘䇝㓳ᰦᨀӔⴞḷ࠭ᮠޘተ䙬䘁
Ⲵ〟ᶱᯩ⌅DŽ❦㘼ˈањ RBF 㖁㔌ᢺ䘉њޘተ࠭ᮠ㺘⽪Ѫཊњተ䜘Ṩ࠭ᮠⲴ㓯ᙗ㓴ਸDŽн
䗷ˈഐѪ RBF ᆖҐᯩ⌅ᗵ享൘⸕䚃ḕ䈒⛩ѻࡽᨀӔٷ䇮ˈᡰԕᆳԜࡋᔪⲴተ䜘䙬䘁н㜭䗮
ࡠ⎸ۿᶱᆖҐᯩ⌅ѝ䛓ṧ⢩࡛䪸ሩḕ䈒⛩DŽԓᴯൠˈRBF 㖁㔌ᱟӾԕ䇝㓳ṧֻѪѝᗳⲴተ
䜘䙬䘁ѝ㻛Ā〟ᶱāᔪ・Ⲵˈᡆ㘵䈤ᱟԕ䇝㓳ṧֻⲴ㚊㊫Ѫѝᗳˈнᱟԕᵚ⸕Ⲵᵚᶕḕ䈒⛩
ѪѝᗳDŽ
ᾲ㘼䀰ѻˈ⎸ᶱᆖҐᯩ⌅ਟԕሩҾ⇿ањḕ䈒ᇎֻ䘹ᤙн਼Ⲵٷ䇮˄ᡆⴞḷ࠭ᮠⲴተ䜘
䙬䘁˅DŽ֯⭘਼ṧٷ䇮オ䰤Ⲵ〟ᶱᯩ⌅ᱟᴤ࣐ਇ䲀ࡦⲴˈഐѪᆳԜᗵ享ᨀӔањ㾶ⴆᮤњᇎ
ֻオ䰤Ⲵঅаٷ䇮DŽᖃ❦ˈ〟ᶱⲴᯩ⌅ਟԕ֯⭘ਸᒦҶཊњተ䜘䙬䘁Ⲵٷ䇮オ䰤ˈቡ䊑 RBF
㖁㔌аṧDŽ❦㘼ˈণ֯ᱟ䘉ӋਸᒦⲴተ䜘䙬䘁ˈҏн㜭֯〟ᶱᯩ⌅ᆼާޘᴹ⎸ᶱᯩ⌅䛓䪸
ሩᵚ⸕ḕ䈒ࠪٷ䇮Ⲵ㜭࣋DŽ
8.7 ቅ㔉ૂ㺛ݻ䈱⢟
䘉аㄐⲴ㾱⛩वᤜ˖
x สҾᇎֻⲴᆖҐᯩ⌅н਼ҾަԆⲴ࠭ᮠ䙬䘁ᯩ⌅ˈഐѪᆳԜ᧘䘏༴⨶䇝㓳ṧֻˈ
ⴤࡠᗵ享࠶㊫ањᯠḕ䈒ᇎֻᰦDŽഐ↔ˈᆳԜнᗵᖒᡀањ᰾⺞Ⲵٷ䇮ᶕᇊѹ
ᮤњᇎֻオ䰤кⲴᆼᮤⴞḷ࠭ᮠDŽ৽ˈᆳԜਟԕሩ⇿њḕ䈒ᇎֻᖒᡀањн
਼Ⲵⴞḷ࠭ᮠተ䜘䙬䘁DŽ
x สҾᇎֻⲴᯩ⌅ⲴՈ⛩वᤜ˖䙊䗷а㌫ࡇнཚ༽ᵲⲴተ䜘䙬䘁ᶕ⁑ᤏ༽ᵲⴞḷ
࠭ᮠⲴ㜭࣋˗нՊᦏཡ䇝㓳ṧֻѝ㮤ਜ਼Ⲵԫօؑ˄ഐѪһֻᵜ䓛㻛ⴤ᧕ൠᆈ
ۘ䎧ᶕ˅DŽѫ㾱Ⲵᇎ䐥䰞仈वᤜ˖࠶㊫ᯠᇎֻⲴ᭸⦷˄ᡰᴹⲴ༴⨶䜭൘ḕ䈒ᵏ
䘋㹼㘼нᱟһ˗˅ྭ༷߶ݸ䳮ԕ䘹ᤙ⭘ᶕỰ㍒ޣᇎֻⲴਸ䘲Ⲵ䐍ᓖ䟿˄⢩
࡛ᱟᖃᇎֻᱟ⭘༽ᵲⲴㅖਧ㺘⽪᧿䘠Ⲵᰦ˗˅ىᰐޣ⢩ᖱሩ䐍ᓖ䟿Ⲵ䍏⭘DŽ
x k-䘁䛫ᱟ⭘ᶕ䙬䘁ᇎᮠ٬ᡆᮓ٬ⴞḷ࠭ᮠⲴสҾᇎֻ㇇⌅ˈᆳٷᇊᇎֻሩᓄҾ
n 㔤⅗∿オ䰤ѝⲴ⛩DŽањᯠḕ䈒Ⲵⴞḷ࠭ᮠ٬ᱟṩᦞ k њоަᴰ䘁Ⲵ䇝㓳ṧֻ
Ⲵ٬ՠ䇑ᗇࡠⲴDŽ
x ተ䜘࣐ᵳഎᖂ⌅ᱟ k-䘁䛫ᯩ⌅Ⲵ᧘ᒯˈ൘䘉ᯩ⌅ѝˈѪ⇿њḕ䈒ᇎֻᔪ・а
њ᰾⺞Ⲵⴞḷ࠭ᮠⲴተ䜘䙬䘁DŽⴞḷ࠭ᮠⲴተ䜘䙬䘁ਟԕสҾۿᑨᮠǃ㓯ᙗ࠭
ᮠᡆҼ⅑࠭ᮠ䘉ṧⲴབྷ䟿Ⲵ࠭ᮠᖒᔿˈҏਟԕสҾオ䰤ተ䜘ॆⲴṨ࠭ᮠDŽ
x ᖴੁส࠭ᮠ˄RBF˅㖁㔌ᱟа㊫⭡オ䰤ተ䜘ॆṨ࠭ᮠᶴᡀⲴӪᐕ⾎㓿㖁㔌DŽᆳਟ
㻛ⴻᱟสҾᇎֻⲴᯩ⌅˄⇿њṨ࠭ᮠⲴᖡ૽ᱟ㻛ተ䜘ॆⲴ˅઼⾎㓿㖁㔌ᯩ⌅
˄൘䇝㓳ᵏᖒᡀҶሩⴞḷ࠭ᮠⲴޘተ䙬䘁ˈ㘼нᱟ൘ḕ䈒ᵏᖒᡀተ䜘䙬䘁˅Ⲵ
ਸDŽᖴੁส࠭ᮠ㖁㔌ᐢ㻛ᡀ࣏ൠᓄ⭘ࡠᖸཊ䈮仈ˈ∄ྲ㿶㿹൪Ჟ࠶᷀
˄interpreting visual scenes˅ˈަѝٷᇊオ䰤ተ䜘Ⲵᖡ૽ᱟᖸਸ⨶ⲴDŽ
x สҾṸֻⲴ᧘⨶ҏᱟаสҾᇎֻⲴᆖҐᯩ⌅ˈն䘉ᯩ⌅֯⭘༽ᵲⲴ䙫䗁᧿
䘠㘼нᱟ⅗∿オ䰤ѝⲴ⛩ᶕ㺘⽪ᇎֻDŽ㔉ᇊᇎֻⲴㅖਧ᧿䘠ˈӪԜᐢ㓿ᨀࠪҶ
བྷ䟿Ⲵᯩ⌅⭘Ҿᢺ䇝㓳ṧֻ᱐ሴᡀᯠᇎֻⲴⴞḷ࠭ᮠ٬DŽสҾṸֻⲴ᧘⨶ᯩ⌅
ᐢ㓿ᓄ⭘ࡠᖸཊᇎ䱵䰞仈ѝˈ∄ྲ⁑ᤏ⌅ᖻ᧘⨶ˈԕ৺൘༽ᵲⲴ⭏ӗ઼䘀䗃㿴
ࡂ䰞仈ѝᕅሬᩌ㍒DŽ
k-䘁䛫㇇⌅ᱟᵪಘᆖҐѝ㻛࠶᷀ᗇᴰ䘿ᖫⲴ㇇⌅ѻаˈഐа䜘࠶ᱟ⭡Ҿᆳࠪ⧠Ⲵ䖳
ᰙˈਖཆҏ⭡ҾᆳⲴㆰ᰾ᙗDŽCover & Hart˄1967˅ᨀࠪҶᰙᵏⲴ⨶䇪㔃᷌ˈDuda & Hart
˄1973˅ᨀҶањᖸྭⲴᾲ㿲DŽBishop˄1995˅䇘䇪Ҷ k-䘁䛫㇇⌅ԕ৺ᆳоᾲ⦷ᇶᓖՠ䇑
Ⲵޣ㌫DŽAtkeson et al.˄1997˅ሩተ䜘࣐ᵳഎᖂᯩ⌅㔉ࠪҶањ䶎ᑨྭⲴ㓥㿸DŽAtkeson et al.
˄1997b˅䈳ḕҶ䘉Ӌᯩ⌅൘ᵪಘӪ᧗ࡦᯩ䶒Ⲵᓄ⭘DŽ
Bishop˄1995˅ᨀҶањሩᖴੁส࠭ᮠⲴޘ䶒䇘䇪DŽަԆ䇪䘠⭡ Powell˄1987˅઼
Poggio & Girosi˄1990˅㔉ࠪDŽᵜҖⲴ 6.12 ሿ㢲䇘䇪Ҷ EM ㇇⌅઼ᆳ൘䘹ᤙਸ儈ᯟ൷٬ᯩ
䶒Ⲵᓄ⭘DŽ
Kolodner˄1993˅ᨀҶሩสҾṸֻⲴ᧘⨶Ⲵа㡜ӻ㓽DŽԕл᮷⥞㔉ࠪҶަԆⲴаӋޣ
Ҿ䘁ᶕⲴ⹄ウᡀ᷌Ⲵ㓥㿸઼≷䳶˖Aamodt et al.˄1994˅ˈAha et al.˄1991˅ˈHaton et al.˄1995˅ˈ
Riesbeck & Schank˄1989˅
ˈSchank et al.˄1994˅ˈVeloso and Aamodt˄1995˅ˈWatson˄1995˅ˈ
Wess et al.˄1994˅DŽ
Ґ仈
8.1 ሩҾޜᔿ˄8.7˅ѝⲴⴞḷ࠭ᮠⲴањ䐍࣐ᵳተ䜘㓯ᙗ䙬䘁ˈ᧘ሬởᓖл䱽⌅ࡉDŽ
8.2 ᙍ㘳ԕлѪ䀓ߣተ䜘࣐ᵳഎᖂѝⲴ䐍ᓖ䟿Ⲵਖаᯩ⌅DŽྲлᔪ・ањ㲊ᤏⲴ䇝
㓳ṧֻ䳶ਸDc˖ሩҾ䇝㓳ᮠᦞ䳶ਸDѝⲴ⇿ањ䇝㓳ṧֻ<x, f(x)>ˈ൘Dcѝࡋᔪࠪаᇊ
ᮠ䟿˄ਟ㜭ᱟ࠶ᮠ˅Ⲵ<x, f(x)>Ⲵᤧ䍍ˈަѝᤧ䍍Ⲵᮠ䟿ᱟK(d(xq, x))DŽ⧠൘䇝㓳ањ㓯ᙗ䙬
䘁ᶕᴰሿॆԕл䈟ᐞ߶ࡉ˖
1
E4 { ¦ ( f ( x) fˆ ( x)) 2
2 xDc
䘉䟼Ⲵᜣ⌅ᱟሩ䶐䘁ḕ䈒ᇎֻⲴ䇝㓳ṧֻӗ⭏䖳ཊⲴᤧ䍍ˈ䐍䘌Ⲵᤧ䍍䖳ቁDŽ᧘ሬࠪ
䘉њ䈟ᐞ߶ࡉⲴởᓖл䱽⌅ࡉDŽᢺ䘉њ⌅ࡉ㺘⽪ᡀ൘ D ⲴᡀઈкⲴ≲઼ˈ㘼нᱟ൘ DcⲴᡀ
ઈк≲઼ˈᒦᢺᆳ઼ޜᔿ˄8.6˅઼˄8.7˅ѝⲴ⌅ࡉ䘋㹼∄䖳DŽ
৲㘳᮷⥞
ㅢ9ㄖ 䚍Ֆ㇍⌋
遗传算法提供了一种大致基于模拟进化的学习方法。其中的假设常被描述为
二进制位串,位串的含义依赖于具体的应用。然而,假设也可以被描述为符号表
达式或者甚至是计算机程序。对合适假设的搜索是从若干初始假设的群体
(population)或汇集(collection)开始的。当前群体的成员通过模仿生物进化
的方式来产生下一代群体,比如说随机变异(mutation)和交叉(crossover)。在
每一步,根据给定的适应度(fitness)度量评估当前群体中的假设,而后使用概
率方法选出适应度最高的假设作为产生下一代的种子。遗传算法已被成功地应用
到多种学习任务和最优化问题中。例如,遗传算法已被用于学习机器人控制的规
则集,以及优化人工神经网络的拓扑结构和学习参数。这一章既覆盖了用位串描
述假设的遗传算法(genetic algorithms),也覆盖了用计算机程序描述假设的遗传
编程(genetic programming)。
9.1 ࣞᵰ
䚇Ր㇇⌅˄GA˅ᨀҶаਇ⭏⢙䘋ॆਁⲴᆖҐᯩ⌅DŽᆳнᱟӾа㡜ࡠ⢩↺ᡆӾ
ㆰঅࡠ༽ᵲൠᩌ㍒ٷ䇮ˈ㘼ᱟ䙊䗷ਈᔲ઼䟽㓴ᖃࡽᐢ⸕Ⲵᴰྭٷ䇮ᶕ⭏ᡀਾ㔝Ⲵٷ䇮DŽ൘⇿
а↕ˈ㻛〠Ѫᖃࡽ㗔փ˄population˅Ⲵа㓴ٷ䇮㻛ᴤᯠˈᯩ⌅ᱟ䙊䗷֯⭘ⴞࡽ䘲ᓄᓖᴰ儈
Ⲵٷ䇮Ⲵਾԓᴯԓ㗔փⲴḀњ䜘࠶DŽ䘉њ䗷〻ᖒᡀҶሩٷ䇮Ⲵ⭏ᡀᒦ⍻䈅˄generate-and-test˅
ḡ⣦ᩌ㍒˄beam-search˅ˈަѝ㤕ᒢњᴰ֣ᖃࡽٷ䇮Ⲵਈփᴰᴹਟ㜭൘ла↕㻛㘳㲁DŽGA
ⲴᲞ৺઼ਁኅᗇ⳺Ҿԕлഐ㍐˖
x ൘⭏⢙㌫㔏ѝ䘋ॆ㻛䇔Ѫᱟаᡀ࣏Ⲵ㠚䘲ᓄᯩ⌅ˈᒦфާᴹᖸྭⲴ励ἂ
ᙗDŽ
x GA ᩌ㍒Ⲵٷ䇮オ䰤ѝˈٷ䇮Ⲵњ䜘࠶ӂ⭘ˈ⇿а䜘࠶ሩᙫⲴٷ䇮䘲
ᓄᓖⲴᖡ૽䳮ԕᔪ⁑DŽ
x 䚇Ր㇇⌅᱃Ҿᒦ㹼ॆˈфਟ䱽վ⭡Ҿ֯⭘䎵ᕪ䇑㇇ᵪ⺜ԦⲴᑖᶕⲴᰲ䍥䍩
⭘DŽ
䘉аㄐ᧿䘠Ҷ䚇Ր㇇⌅ˈѮֻ╄⽪ҶᆳⲴ⭘⌅ˈᒦ࠶᷀Ҷᆳᩌ㍒Ⲵٷ䇮オ䰤Ⲵ⢩ᙗDŽᡁ
Ԝҏ᧿䘠ҶᆳⲴањਈփˈ〠Ѫ䚇Ր㕆〻ˈ൘䘉ᯩ⌅ѝˈᮤњ䇑㇇ᵪ〻ᒿੁ⵰Ḁњ䘲ᓄᓖ
߶ࡉ䘋ॆDŽ䚇Ր㇇⌅઼䚇Ր㕆〻ᱟ䘋ॆ䇑㇇˄evolutionary computation˅亶ฏⲴѝⲴє⍱
㹼ᯩ⌅DŽ൘ᵜㄐⲴᴰਾа㢲ᡁԜሶ᧕䀖аӋ⹄ウ⭏⢙䘋ॆⲴ䈮仈ˈवᤜ劽ᗧ᭸ᓄ˄Baldwin
effect˅ˈᆳ᧿䘠ҶњփⲴᆖҐ㜭࣋оᮤњ㗔փ䘋ॆ䙏ᓖѻ䰤ᴹ䏓Ⲵӂ⭘DŽ
9.2 䚍Ֆ㇍⌋
GA ⹄ウⲴ䰞仈ᱟᩌ㍒ањى䘹ٷ䇮Ⲵオ䰤ˈԕ⺞ᇊᴰ֣Ⲵٷ䇮DŽ൘ GA ѝˈĀᴰ֣ٷ
䇮ā㻛ᇊѹѪᱟ֯Ā䘲ᓄᓖ˄fitness˅āᴰՈⲴٷ䇮ˈ䘲ᓄᓖᱟѪᖃࡽ䰞仈亴ݸᇊѹⲴᮠᆇ
ᓖ䟿DŽֻྲˈྲ᷌ᆖҐԫ࣑ᱟ൘㔉ᇊањᵚ⸕࠭ᮠⲴ䗃ޕ䗃ࠪ䇝㓳ṧֻਾ䙬䘁䘉њ࠭ᮠˈ䛓
Ѹ䘲ᓄᓖਟ㻛ᇊѹѪٷ䇮൘䇝㓳ᮠᦞкⲴ㋮ᓖDŽྲ᷌ԫ࣑ᱟᆖҐлഭ䱵䊑ỻⲴㆆ⮕ˈ䛓Ѹ䘲
ᓄᓖਟ㻛ᇊѹѪ䈕њփ൘ᖃࡽ㗔փѝоަԆњփሩᔸⲴ㜌⦷DŽ
ቭ㇑䚇Ր㇇⌅Ⲵн਼ᇎ⧠൘㓶㢲кᴹᡰн਼ˈնᆳԜ䜭ާᴹԕлⲴ਼ޡ㔃ᶴ˖㇇⌅䘝ԓ
ᴤᯠањٷ䇮⊐ˈ䘉њٷ䇮⊐〠Ѫ㗔փDŽ൘⇿а⅑䘝ԓѝˈṩᦞ䘲ᓄᓖ࠭ᮠ䇴ՠ㗔փѝⲴᡰ
ᴹᡀઈDŽ❦ਾӾᖃࡽ㗔փѝ⭘ᾲ⦷ᯩ⌅䘹ਆ䘲ᓄᓖᴰ儈Ⲵњփӗ⭏ᯠⲴаԓDŽ൘䘉Ӌ㻛䘹ѝ
Ⲵњփѝˈа䜘࠶؍ᤱṧൠ䘋ޕлаԓ㗔փˈަԆⲴ㻛⭘ӗ⭏ਾԓњփⲴสˈަѝᓄ
⭘䊑Ӕ৹઼ਈᔲ䘉ṧⲴ䚇Րᯩ⌅DŽ
㺘 9-1 ᧿䘠Ҷањ䚇Ր㇇⌅රDŽ㇇⌅Ⲵ䗃ޕवᤜ˖⭘ᶕᧂᒿى䘹ٷ䇮Ⲵ䘲ᓄᓖ࠭ᮠ˗
ᇊѹ㇇⌅㓸→ᰦ䘲ᓄᓖⲴ䰸٬˗㾱㔤ᤱⲴ㗔փབྷሿ˗઼ߣᇊྲօӗ⭏ਾ㔗㗔փⲴ৲ᮠ˖⇿а
ԓ㗔փѝ㻛␈⊠Ⲵ∄઼ֻਈᔲ⦷DŽ
㺘 9-1 䚇Ր㇇⌅ර
㇇⌅ѝ㔤ᤱањवਜ਼pњٷ䇮Ⲵ㗔փDŽ൘⇿а⅑䘝ԓѝˈਾ㔗㗔փPSⲴᖒᡀ䙊䗷є䙄ᖴ˖ṩ
ᦞٷ䇮Ⲵ䘲ᓄᓖ⭘ᾲ⦷ᯩ⌅䘹ᤙњփˈԕ৺࣐ޕᯠٷ䇮DŽᯠٷ䇮䙊䗷єᯩ⌅ᗇࡠ˖ሩᴰ儈䘲ᓄᓖ
ٷ䇮ሩᓄ⭘Ӕ৹㇇ᆀ˗ሩ䙊䗷䘹ᤙ઼Ӕ৹ӗ⭏Ⲵᯠаԓ㗔փѝⲴ䜘࠶ٷ䇮䘋㹼অ⛩ਈᔲDŽ䟽༽䘉њ
䘝ԓ䗷〻ˈⴤࡠਁ⧠䘲ᓄᓖ䏣ཏྭⲴٷ䇮DŽިරⲴӔ৹઼ਈᔲ㇇ᆀᇊѹ൘ਾ䶒Ⲵ㺘ṬѝDŽ
GA(Fitness, Fitness_threshold, p, r, m)
Fitness˖䘲ᓄᓖ䇴࠶࠭ᮠˈѪ㔉ᇊٷ䇮䍻Ҹањ䇴ՠᗇ࠶DŽ
Fitness_threshold˖ᤷᇊ㓸→ࡔᦞⲴ䰸٬DŽ
p˖㗔փѝवਜ਼Ⲵٷ䇮ᮠ䟿DŽ
r˖⇿а↕ѝ䙊䗷Ӕ৹ਆԓ㗔փᡀઈⲴ∄ֻDŽ
m˖ਈᔲ⦷DŽ
x ࡍॆ㗔փ˖Pm䲿ᵪӗ⭏Ⲵ p њٷ䇮
x 䇴ՠ˖ሩҾ P ѝⲴ⇿ањ hˈ䇑㇇ Fitness(h)
x ᖃ[ max Fitness(h)]<Fitness_thresholdˈ˖ڊ
h
ӗ⭏ᯠⲴаԓPS˖
1ˊ 䘹ᤙ˖⭘ᾲ⦷ᯩ⌅䘹ᤙPⲴ(1-r)pњᡀઈ࣐ޕPS DŽӾPѝ䘹ᤙٷ䇮hi Ⲵᾲ⦷
Pr(hi)䙊䗷л䶒ޜᔿ䇑㇇˖
Fitness(hi )
Pr(hi )
¦
p
j 1
Fitness(h j )
2ˊ Ӕ৹˖ṩᦞк䶒㔉ࠪⲴPr(hi)ˈӾPѝ᤹ᾲ⦷䘹ᤙrp/2 ሩٷ䇮DŽሩҾ⇿аሩ
ٷ䇮<h1, h2>ᓄ⭘Ӕ৹㇇ᆀӗ⭏єњਾԓDŽᢺᡰᴹⲴਾԓ࣐ޕPSDŽ
3ˊ ਈᔲ˖֯⭘൷रⲴᾲ⦷ӾPSѝ䘹ᤙmⲮ࠶∄ⲴᡀઈDŽሩҾ䘹ࠪⲴ⇿њᡀઈˈ
൘ᆳⲴ㺘⽪ѝ䲿ᵪ䘹ᤙањսਆ৽DŽ
4ˊ ᴤᯠ˖PmPSDŽ
5ˊ 䇴ՠ˖ሩҾ P ѝⲴ⇿ањ h 䇑㇇ Fitness(h)
x Ӿ P ѝ䘄എ䘲ᓄᓖᴰ儈Ⲵٷ䇮DŽ
൘䘉њ㇇⌅Ⲵ⇿а⅑䘝ԓѝˈสҾᖃࡽⲴ㗔փӗ⭏ᯠаԓⲴٷ䇮DŽ俆ˈݸӾᖃࡽⲴ㗔փ
ѝ䘹ᤙаᇊᮠ䟿Ⲵٷ䇮वਜ਼൘лаԓѝDŽ䘉Ӌٷ䇮ᱟ⭘ᾲ⦷ᯩ⌅䘹ᤙⲴˈަѝ䘹ᤙٷ䇮hiⲴ
ᾲ⦷ᱟ䙊䗷лᔿ䇑㇇Ⲵ˖
Fitness(hi )
Pr(hi ) ˄9.1˅
¦
p
j 1
Fitness(h j )
ഐ↔ˈањٷ䇮㻛䘹ᤙⲴᾲ⦷оᆳ㠚ᐡⲴ䘲ᓄᓖᡀ↓∄ˈᒦфоᖃࡽ㗔փѝަԆㄎҹٷ
䇮Ⲵ䘲ᓄᓖᡀ৽∄DŽ
൘ᖃࡽԓⲴ䘉Ӌᡀઈᐢ㻛䘹ޕлаԓ㗔փਾˈ֯⭘аӔ৹ӗ⭏ަԆⲴᡀઈDŽӔ
৹ሶ൘ла㢲㻛ާփᇊѹˈᆳӾᖃࡽԓѝਆєњৼӢٷ䇮ˈᒦ䙊䗷䟽ᯠ㓴ਸৼӢⲴ䜘
࠶ӗ⭏єњਾԓٷ䇮DŽৼӢٷ䇮ᱟӾᖃࡽ㗔փѝ᤹ᾲ⦷䘹ࠪⲴˈҏ֯⭘ޜᔿ˄9.1˅Ⲵᾲ⦷
࠭ᮠDŽ൘䙊䗷䘉Ӕ৹ӗ⭏ᯠⲴᡀઈਾˈᯠаԓ㗔փᐢ㓿वਜ਼Ҷᡰ䴰ᮠ䟿ⲴᡀઈDŽ᧕л
ᶕˈӾ䘉Ӌᡀઈѝ䲿ᵪ䘹ࠪаᇊ∄ֻ˄m˅ˈᒦ䘋㹼䲿ᵪਈᔲDŽ
ഐ↔ˈ䘉 GA ㇇⌅ᢗ㹼а䲿ᵪⲴǃᒦ㹼ḡ⣦ٷ䇮ᩌ㍒ˈṩᦞ䘲ᓄᓖ࠭ᮠਁ⧠䖳ྭⲴ
ٷ䇮DŽ൘л䶒Ⲵሿ㢲ѝᡁԜሶᴤ䈖ቭൠ᧿䘠䘉њ㇇⌅ѝ֯⭘Ⲵٷ䇮㺘⽪઼䚇Ր㇇ᆀDŽ
9.2.1 㺞⽰ٽ䇴
GA ѝٷ䇮㓿ᑨ㻛㺘⽪ѪҼ䘋ࡦսѢˈ䘉ṧਟԕᖸᯩׯൠ⭘ਈᔲ઼Ӕ৹䚇Ր㇇ᆀᶕ
DŽ֯⭘䘉ṧⲴսѢ㺘⽪Ⲵٷ䇮ਟ㜭䶎ᑨ༽ᵲDŽֻྲˈif-then 㿴ࡉቡਟԕᖸᇩ᱃ൠ⭘䘉ᯩ
ᔿ㺘⽪ˈ⌅ڊᱟ䘹ᤙ㿴ࡉⲴа㕆⸱ˈަѝѪ⇿њ㿴ࡉⲴࡽԦ઼ਾԦ࠶䝽⢩ᇊⲴᆀѢDŽ
Holland˄1986˅˗Grefenstette˄1988˅
˗DeJong et al.˄1993˅ѝ᧿䘠Ҷ GA ㌫㔏ѝ䘉㿴ࡉ
㺘⽪ⲴֻᆀDŽ
ᴹҶ㺘⽪অњᙗ㓖ᶏⲴᯩ⌅ˈ䛓Ѹሩཊњᙗ㓖ᶏⲴਸਆਟԕᖸᇩ᱃ൠ㺘⽪Ѫሩᓄս
ѢⲴ䘎᧕DŽֻྲˈ㘳㲁ㅜҼњᙗ Windˈᆳਟԕਆєњ٬ Strong ᡆ WeakDŽ䛓Ѹۿл䶒Ⲵ㿴
ࡉࡽԦ˖
(Outlook=OvercastRain)(Wind=Strong)
ਟ㻛㺘⽪Ѫ䮯ᓖѪ 5 ⲴսѢ˖
Outlook Wind
011 10
㿴ࡉⲴਾԦ˄ֻྲ PlayTennis=yes˅ਟԕ⭘լⲴᯩᔿ㺘⽪DŽҾᱟˈᮤњ㿴ࡉ㺘⽪ਟԕ
䙊䗷ᢺ᧿䘠㿴ࡉࡽԦ઼ਾԦⲴսѢ䘎᧕䎧ᶕDŽֻྲˈл䶒Ⲵ㿴ࡉ
ሶ㻛㺘⽪ѪԕлⲴսѢ˖
111 10 10
൘ѪḀњٷ䇮オ䰤䇮䇑սѢ㕆⸱ᰦˈᴹᗵ㾱䇙⇿њਕ⌅ਸ⌅ⲴսѢ㺘⽪ањᴹѹⲴٷ
䇮DŽ∄ྲˈ㤕֯⭘ка⇥Ⲵ㿴ࡉ㕆⸱ᯩᔿˈ䛓ѸսѢ 111 10 11 㺘⽪Ҷањ㿴ࡉˈᆳⲴਾԦ
н㓖ᶏⴞḷᙗ PlayTennisDŽྲ᷌㾱䚯ݽ㘳㲁䘉њٷ䇮ˈਟԕ䟷⭘н਼Ⲵ㕆⸱ᯩᔿ˄ֻྲˈ
ӵ࠶䝽ањս㔉ਾԦ PlayTennisˈ㺘⽪ᆳⲴ٬ᱟ Yes ᡆ No˅˗ᡆ᭩ਈ䚇Ր㇇ᆀԕ᰾⺞䚯ݽᔪ
・䘉ṧⲴսѢ˗ᡆᒢ㜶ᢺᖸվⲴ䘲ᓄᓖ䍻㔉䘉ṧⲴѢDŽ
9.2.2 䚍Ֆ㇍ᆆ
൘ GA ѝ䙊䗷а㌫ࡇ㇇ᆀ˄operators˅ᶕߣᇊਾԓˈ㇇ᆀሩᖃࡽ㗔փѝ䘹ᇊⲴᡀઈ䘋㹼
䟽㓴઼ਈᔲDŽ㺘 9-1 ѝࡇࠪҶ⭘ᶕսѢⲴިර GA ㇇ᆀDŽ䘉Ӌ㇇ᆀᱟ⭏⢙䘋ॆѝⲴ䚇Ր
䗷〻Ⲵ⨶ᜣॆᖒᔿDŽᴰᑨ㿱Ⲵєњ㇇ᆀᱟӔ৹˄crossover˅઼ਈᔲ˄mutation˅DŽ
Ӕ৹㇇ᆀӾєњৼӢѢѝ䙊䗷༽ࡦ䘹ᇊսӗ⭏єњᯠⲴਾԓDŽ⇿њਾԓⲴㅜ i սᱟӾᆳ
ⲴḀњৼӢⲴㅜ i ս༽ࡦᶕⲴDŽ㠣ҾৼӢѝⲴଚањ൘ㅜ i ս䎧⭘ˈ䘉ᱟ⭡ਖཆањ〠Ѫ
Ӕ৹᧙⸱˄crossover mask˅ⲴսѢߣᇊⲴDŽл䶒╄⽪ал䘉њ䗷〻ˈ㘳㲁㺘 9-2 ѝᴰк䗩Ⲵ
অ⛩˄single-point˅Ӕ৹㇇ᆀDŽݸ㘳㲁ަѝк䶒ањਾԓDŽ䘉њਾԓӾㅜањৼӢѝਆࡽ 5
սˈަ։Ⲵ 6 սᶕ㠚ㅜҼњৼӢˈഐѪӔ৹᧙⸱ 11111000000 Ѫ⇿њսᤷᇊ䘉Ӌ䘹ᤙDŽㅜҼ
њਾԓ֯⭘਼ṧⲴӔ৹᧙⸱ˈնӔᦒҶৼӢⲴ䀂㢢DŽᡰԕˈᆳवਜ਼Ҷㅜањਾԓ⋑ᴹ⭘䗷Ⲵ
սDŽ൘অ⛩Ӕ৹ѝˈӔ৹᧙⸱ᙫᱟ䘉ṧ㓴ᡀⲴˈᆳԕ䘎㔝Ⲵ n њ 1 ᔰˈਾ䶒䐏䲿ᗵ㾱њᮠ
Ⲵ 0 ⴤ㠣㔃ᶏDŽ䘉ṧⲴ㔃᷌ᱟਾԓѝࡽ n սᶕ㠚ㅜањৼӢˈ։лⲴսᶕ㠚ㅜҼњৼӢDŽ⇿
⅑ᓄ⭘অ⛩Ӕ৹㇇ᆀᰦˈӔ৹⛩ n ᱟ䲿ᵪ䘹ਆⲴˈ❦ਾӗ⭏Ӕ৹᧙⸱ᒦᓄ⭘DŽ
㺘 9-2 䚇Ր㇇⌅ᑨ㿱㇇ᆀ
䘉Ӌ㇇ᆀᖒᡀ⭘սѢ㺘⽪Ⲵਾԓٷ䇮DŽӔ৹㇇ᆀӾєњৼӢѝӗ⭏єњਾԓˈ֯⭘Ӕ৹᧙⸱ᶕ
ߣᇊଚањৼӢ⭘ҾᓄⲴսDŽਈᔲӾঅаⲴৼӢѝӗ⭏অаⲴਾԓˈ䙊䗷䲿ᵪ䘹ਆаսᒦਆ৽DŽ
插图——原书页码:254
Crossover Mask-Ӕ৹᧙⸱
Offspring-ਾԓ
Single-point crossover:-অ⛩Ӕ৹
Two-point crossover:-є⛩Ӕ৹
Uniform crossover-൷रӔ৹
Point mutation:-⛩ਈᔲ
൘є⛩Ӕ৹˄two-point crossover˅ѝˈਾԓⲴӗ⭏䙊䗷ᢺањৼӢѢⲴѝ䰤⡷⇥ᴯᦒㅜ
ҼњৼӢѢⲴѝ䰤⡷⇥DŽᦒਕ䈍ᶕ䇢ˈӔ৹᧙⸱ԕn0њ 0 ᔰˈਾ䶒䐏䲿n1њ 1ˈ䐏䲿ᗵ
㾱ᮠ䟿Ⲵ 0 㔃ᶏDŽ⇿⅑ᓄ⭘є⛩Ӕ৹㇇ᆀᰦˈ䙊䗷䲿ᵪ䘹ਆєњᮤᮠn0઼n1ᶕӗ⭏᧙⸱DŽֻ
ྲˈ൘㺘 9-2 ᱮ⽪Ⲵֻᆀѝˈᱟ֯⭘n0=2 ઼n1=5 Ⲵ᧙⸱ᶕӗ⭏ਾԓⲴDŽ઼к䶒аṧˈ䙊䗷
䖜ᦒєњৼӢⲴ䀂㢢ᶕӗ⭏䘉єњਾԓDŽ
䲔Ҷ䙊䗷㓴ਸৼӢⲴ䜘࠶ӗ⭏ਾԓⲴ䟽㓴㇇ᆀˈਖа㊫රⲴ㇇ᆀӾঅаⲴৼӢӗ⭏
ਾԓDŽ⺞࠷ൠ䇢ˈਈᔲ˄mutation˅㇇ᆀ⭘ҾሩսѢӗ⭏䲿ᵪⲴሿਈॆˈᯩ⌅ᱟ䘹ਆањսˈ
❦ਾਆ৽DŽਈᔲ㓿ᑨᱟ൘ᓄ⭘ҶӔ৹ѻਾ䘋㹼Ⲵˈۿ㺘 9-1 ѝⲴර㇇⌅䛓ṧDŽ
аӋ GA ㌫㔏ᓄ⭘ҶަԆⲴ㇇ᆀˈ⢩࡛ᱟаӋу䰘䪸ሩ㌫㔏ѝ⢩ᇊٷ䇮㺘⽪Ⲵ㇇ᆀDŽֻ
ྲˈGrefenstette et al.˄1991˅᧿䘠ҶањᆖҐᵪಘӪ᧗ࡦ㿴ࡉ䳶Ⲵ㌫㔏DŽᆳ䲔Ҷ֯⭘ਈᔲ
઼Ӕ৹㇇ᆀˈ䘈֯⭘Ҷањ㇇ᆀԕ֯㿴ࡉ⢩ॆDŽJanikow˄1993˅᧿䘠ҶањᆖҐ㿴ࡉ䳶Ⲵ
㌫㔏ˈަѝ֯⭘Ҷཊⴤ᧕⌋ॆ઼⢩ॆ㿴ࡉⲴ㇇ᆀ˄ֻྲⴤ᧕ᢺањᙗᶑԦᴯᦒѪĀнޣ
ᗳā˄don’t care˅˅DŽ
9.2.3 䘸ᓊᓜ࠳ᮦૂٽ䇴䘿
䘲ᓄᓖ࠭ᮠᇊѹҶى䘹ٷ䇮Ⲵᧂ߶ࡉˈᒦфᱟԕᾲ⦷ᯩ⌅䘹ᤙлаԓ㗔փⲴ߶ࡉDŽྲ
᷌ԫ࣑ᱟᆖҐ࠶㊫Ⲵ㿴ࡉˈ䛓Ѹ䘲ᓄᓖ࠭ᮠѝՊᴹа亩⭘ᶕ䇴ԧ⇿њ㿴ࡉሩ䇝㓳ṧֻ䳶ਸⲴ
࠶㊫㋮ᓖDŽ䘲ᓄᓖ࠭ᮠѝҏਟ㜭वਜ਼ަԆⲴ߶ࡉˈֻྲ㿴ࡉⲴ༽ᵲᓖ઼а㡜ᙗ˄generality˅DŽ
ᴤа㡜ൠ䇢ˈᖃսѢ㻛䀓䟺Ѫ༽ᵲⲴ䗷〻ᰦ˄ֻྲˈᖃսѢ㺘⽪а㌫ࡇ㿴ࡉˈ䘉Ӌ㿴ࡉ㾱㻛
䬮᧕൘а䎧᧗ࡦањᵪಘӪ䇮༷˅ˈ䘲ᓄᓖ࠭ᮠਟԕ⍻䟿⭏ᡀⲴ䗷〻ᙫփᙗ㜭㘼нᱟঅњ㿴
ࡉⲴᙗ㜭DŽ
൘㺘 9-1 ѝᱮ⽪ⲴGAරѝˈ䘹ᤙḀٷ䇮Ⲵᾲ⦷ᱟ䙊䗷ᆳⲴ䘲ᓄᓖоᖃࡽ㗔փѝަԆ
ᡀઈⲴ䘲ᓄᓖⲴ∄٬ᗇࡠⲴˈྲޜᔿ˄9.1˅ᡰ⽪DŽ䘉ᯩ⌅ᴹᰦ㻛〠Ѫ䘲ᓄᓖ∄ֻ䘹ᤙ˄fitness
proportionate selection˅ˈᡆ〠Ѫ䖞ⴈ䍼ķ䘹ᤙ˄roulette wheel selection˅DŽӪԜҏᨀࠪҶަԆ
֯⭘䘲ᓄᓖᶕ䘹ᤙٷ䇮Ⲵᯩ⌅DŽֻྲ䭖ḷ䎋䘹ᤙ˄tournament selection˅ ˈᆳݸӾᖃࡽ㗔փѝ
䲿ᵪ䘹ਆєњٷ䇮ˈ᤹➗һݸᇊѹⲴᾲ⦷p䘹ᤙ䘲ᓄᓖ䖳儈Ⲵٷ䇮ˈ᤹➗ᾲ⦷ 1-p䘹ᤙ䘲
ᓄᓖ䖳վⲴٷ䇮DŽ䭖ḷ䎋䘹ᤙᑨᑨ∄䘲ᓄᓖ∄ֻ⌅ᗇࡠᴤ࣐ཊṧॆⲴ㗔փ˄Goldberg and Deb
1991˅DŽ൘ਖа㻛〠Ѫᧂ䘹ᤙ˄rank selection˅Ⲵᯩ⌅ѝˈᖃࡽ㗔փѝⲴٷ䇮᤹ݸ䘲ᓄ
ᓖᧂᒿDŽ❦ਾˈ䘹ᤙḀٷ䇮Ⲵᾲ⦷оᆳ൘䘉њᧂᒿࡇ㺘ѝⲴս㖞ᡀ∄ֻˈ㘼нᱟоᆳⲴ䘲ᓄ
ᓖᡀ∄ֻDŽ
9.3 ⽰ׁ
䚇Ր㇇⌅ਟԕ㻛ⴻ䙊⭘ⲴᴰՈॆᯩ⌅ˈᆳᩌ㍒ањᐘབྷⲴى䘹ሩ䊑オ䰤ˈṩᦞ䘲ᓄᓖ
࠭ᮠḕ㺘⧠ᴰྭⲴሩ䊑DŽቭ㇑н؍䇱ਁ⧠ᴰՈⲴሩ䊑ˈն GA 㓿ᑨᡀ࣏ൠਁ⧠ާᴹ䖳儈䘲
ᓄᓖⲴሩ䊑DŽGA ᐢ㓿㻛ᓄ⭘ࡠᵪಘᆖҐԕཆⲴབྷ䟿ᴰՈॆ䰞仈ˈवᤜ⭥ۿ䐟ᐳ㓯઼ԫ࣑䈳
ᓖ䘉ṧⲴ䰞仈DŽ൘ᵪಘᆖҐ亶ฏˈGA нӵ㻛ᓄ⭘ࡠ࠭ᮠ䙬䘁䰞仈ˈ䘈ᓄ⭘ࡠۿ䘹ਆӪᐕ⾎
㓿㖁㔌Ⲵᤃᢁ㔃ᶴ䘉ṧⲴԫ࣑DŽ
GA ൘ GABIL ѝⲴާփᓄ⭘ਟԕ㻛ᾲᤜѪԕлࠐ⛩˖
ሶ㻛㺘⽪ѪѢ˖
ķ
䈁⌘˖ 䖞ⴈ䍼ᱟᤷа䍼ঊ㘵ᢃ䍼䖜ⴈк䖜Ⲵሿ⨳ሶ→ڌҾⴈкଚањⲴ⑨ᠿˈ䘉䟼Ⲵਜ਼ѹ
ᱟᾲ⦷བྷⲴٷ䇮ঐᦞⴈк䖳བྷⲴᡷ४ˈഐ㘼㻛䘹ѝⲴᵪՊ䖳བྷDŽ
a1 a2 c a1 a2 c
10 01 1 11 10 0
⌘սѢⲴ䮯ᓖ䲿⵰ٷ䇮ѝ㿴ࡉⲴᮠ䟿໎䮯DŽ⭡ҾսѢ䮯ᓖⲴਟਈᙗˈ䴰㾱ሩӔ৹㇇ᆀ
ቁ䇨؞᭩ˈ䘉ሶ൘л䶒᧿䘠DŽ
a1 a2 c a1 a2 c
h1˖ 10 01 1 11 10 0
a1 a2 c a1 a2 c
h2˖ 01 11 0 10 01 0
ᒦфѪㅜањৼӢ䘹ਆӔ৹⛩ս㖞ᱟㅜ 1 ઼ㅜ 8 սˈྲлᡰ⽪˖
a1 a2 c a1 a2 c
h1˖ 1[0 01 1 11 1]0 0
ަѝĀ[ā઼Ā]ā㺘⽪Ӕ৹⛩ˈ䛓Ѹd1=1 ᒦфd2=3DŽᡰԕˈݱ䇨䘹ਆⲴㅜҼњৼӢӔ৹⛩Ⲵ
ս㖞ᴹ<1, 3>ˈ<1, 8>઼<6, 8>DŽྲ᷌ᚠᐗ䘹ਆҶ<1ˈ3>ˈ
a1 a2 c a1 a2 c
h2˖ 0[1 1]1 0 10 01 0
䛓Ѹ㔃᷌⭏ᡀⲴєњਾԓᱟ
a1 a2 c
h3˖ 11 10 0
a1 a2 c a1 a2 c a1 a2 c
h4˖ 00 01 1 11 11 0 10 01 0
ྲ↔ֻᡰ⽪ˈ䘉Ӕ৹ᯩ⌅ѝਾԓਟԕवਜ਼оৼӢн਼ᮠ䟿Ⲵ㿴ࡉˈ਼ᰦ؍䇱Ҷ᤹䘉ᯩᔿ
ӗ⭏ⲴսѢ㺘⽪㢟ᇊѹⲴ˄well-defined˅㿴ࡉ䳶DŽ
䘲ᓄᓖ࠭ᮠ ⇿њ㿴ࡉ䳶Ⲵ䘲ᓄᓖᱟṩᦞᆳ൘䇝㓳ᮠᦞкⲴ࠶㊫㋮ᓖ䇑㇇ⲴDŽ⺞࠷ൠ䇢ˈ
ᓖ䟿䘲ᓄᓖⲴ࠭ᮠᱟ˖
Fitness(h)=(correct(h))2
ަѝˈcorrect(h)ᱟٷ䇮 h ࠶㊫ᡰᴹ䇝㓳ṧֻⲴ↓⺞⦷DŽ
൘∄䖳 GABIL ઼ ۿC4.5 ઼ ID5R 䘉ṧⲴߣㆆṁᆖҐ㇇⌅ԕ৺㿴ࡉᆖҐ㇇⌅ AQ14 Ⲵᇎ
傼ѝˈṩᦞሩн਼ᆖҐԫ࣑Ⲵ⍻䈅ˈDeJong et al.˄1993˅ᣕҶ䘉Ӌ㌫㔏ާᴹབྷփᖃⲴ
ᙗ㜭DŽֻྲˈሩӪѪ䇮䇑Ⲵ 12 њ䰞仈ˈGABIL 䗮ࡠҶ 92.1%Ⲵᒣ൷⌋ॆ㋮ᓖˈ㘼ަԆ㌫㔏
ⲴⲴᙗ㜭ᱟ൘ 91.2%ࡠ 96.6%ѻ䰤DŽ
9.3.1 ᢟኋ
൘к䶒Ⲵᇎ傼ѝˈєњ㇇ᆀሩ⇿аԓ㗔փѝⲴ⇿њٷ䇮ᱟԕ਼ṧⲴᾲ⦷ᓄ⭘ⲴDŽ൘ਖа
њᇎ傼ѝˈሩٷ䇮ⲴսѢ㺘⽪䘋㹼Ҷᢙኅˈ֯ަवਜ਼ਖཆєսԕߣᇊᱟਟԕሩ䈕ٷ䇮ᓄ⭘
䘉єњ㇇ᆀDŽ൘䘉њᢙኅⲴ㺘⽪ѝˈањިරⲴ㿴ࡉ䳶ٷ䇮ⲴսѢѪ
a1 a2 c a1 a2 c AA DC
01 11 0 10 01 0 1 0
ަѝᴰਾⲴєњս㺘⽪൘䘉ᛵߥлਟԕሩ䈕Ѣᓄ⭘ AddAlternative ㇇ᆀˈ㘼нਟԕᓄ⭘
DropCondition ㇇ᆀDŽ䘉єњᯠⲴսᇊѹҶ䜘࠶Ⲵ GA ᩌ㍒ㆆ⮕ˈ㘼фᆳԜᵜ䓛ҏ઼ѢѝⲴ
ަԆսа䎧㻛਼ṧⲴӔ৹઼ਈᔲ㇇ᆀ؞᭩઼䘋ॆDŽDeJong et al.˄1993˅ᣕҶ䘉ᯩ⌅Ⲵ
㔃᷌Ո࣓৲ॺ˄ҏቡᱟሩḀӋ䰞仈ᨀ儈Ҷᙗ㜭ˈሩަԆ䰞仈䱽վҶᙗ㜭˅ˈᆳֻ⽪Ҷ GA ൘
ࡉкᱟྲօ֯ަٷ䇮Ⲵᩌ㍒ᯩ⌅䘋ॆⲴDŽ
9.4 ٽ䇴グ䰪ᩒ㍘
ྲкᡰ⽪ˈGA 䟷⭘а䲿ᵪॆⲴḡ⣦ᩌ㍒ᶕራᴹᴰབྷ䘲ᓄᓖⲴٷ䇮DŽ䘉ᩌ㍒оᵜ
Җѝᐢ㘳㲁ⲴަԆᆖҐᯩ⌅Ⲵᩌ㍒ᆼޘн਼DŽֻྲˈ∄䖳 GA ֯⭘Ⲵᩌ㍒オ䰤઼⾎㓿㖁㔌৽
ੁՐ㇇⌅֯⭘Ⲵᩌ㍒オ䰤˖൘৽ੁՐ㇇⌅ѝˈởᓖл䱽ᩌ㍒Ӿањٷ䇮ᒣ━〫ࣘࡠањ
䶎ᑨլⲴᯠٷ䇮DŽо↔н਼ˈGA ᩌ㍒Ⲵ〫ࣘਟ㜭䶎ᑨケ❦ˈ֯⭘઼ৼӢṩᵜн਼Ⲵਾԓ
ᴯᦒৼӢٷ䇮DŽ⌘ GA ᩌ㍒ഐ↔нཚਟ㜭ۿởᓖл䱽ᯩ⌅䛓ṧާᴹ䲧ޕተ䜘ᴰሿ٬Ⲵ䰞
仈DŽ
൘аӋ GA ᓄ⭘ѝˈањᇎ䐥кⲴ䳮仈ᱟᤕᥔ˄crowding˅䰞仈DŽᤕᥔᱟ䘉ṧа⧠䊑ˈ
㗔փѝḀањփ䘲ᓄᓖབྷབྷ儈ҾަԆњփˈഐ↔ᆳ䗵䙏㑱⇆ˈԕ㠣Ҿ䘉њњփ઼оᆳլⲴ
њփঐᦞҶ㗔փⲴ㔍བྷ䜘࠶DŽᤕᥔⲴн㢟ᖡ૽ᱟ䱽վҶ㗔փⲴཊṧᙗ˄diversity˅ˈӾ㘼߿ធ
Ҷ GA Ⲵ䘋а↕䘋ॆDŽӪԜᐢ㓿᧒㍒Ҷ㤕ᒢ䱽վᤕᥔⲴㆆ⮕DŽаᯩ⌅ᱟ؞᭩䘹ᤙ࠭ᮠˈ֯
⭘ۿ䭖ḷ䎋䘹ᤙᡆᧂ䘹ᤙ䘉ṧⲴ߶ࡉਆԓ䘲ᓄᓖ∄ֻ䖞ⴈ䍼䘹ᤙDŽањⲴޣㆆ⮕ᱟĀ䘲
ᓄᓖޡӛ˄fitness sharing˅
āˈަѝṩᦞ㗔փѝоḀњփլⲴњփᮠ䟿ˈ߿ሿ䈕њփⲴ䘲ᓄ
ᓖDŽㅜйᯩ⌅ᱟሩਟ䟽㓴⭏ᡀਾԓⲴњփ㊫䘋㹼䲀ࡦDŽֻྲˈ䙊䗷ਚݱ䇨ᴰլⲴњփ
䟽㓴ˈਟԕ൘㗔փѝ׳ᡀլⲴњփ㚊㊫ˈᡆཊњӊ˄subspecies˅DŽаⲴޣᯩ⌅ᱟ᤹
オ䰤࠶ᐳњփˈᒦфӵݱ䇨䛫Ⲵњփ䟽㓴DŽ䘉Ӌᢰᵟᖸཊ䜭ᱟਇࡠҶ⭏⢙䘋ॆⲴ⽪DŽ
9.4.1 㗚։䘑ौૂ⁗ᕅ⨼䇰
н࿘ᙍ㘳ањᴹ䏓Ⲵ䰞仈˖ᱟ㜭⭘ᮠᆖⲴᯩ⌅⭫ GA ѝ㗔փ䲿ᰦ䰤䘋ॆⲴ䗷〻˛
Holland˄1975˅Ⲵ⁑ᔿ⨶˄schema theorem˅ᨀҶа⭫ᯩ⌅DŽᆳสҾ᧿䘠սѢ䳶ਸ
Ⲵ⁑ᔿ˄schemaˈᡆ pattern˅DŽ㋮⺞ൠ䇢ˈањ⁑ᔿᱟ⭡㤕ᒢ 0ǃ1 ઼*㓴ᡀⲴԫѢDŽĀ*ā
㺘⽪ањнޣᗳⲴսDŽֻྲ⁑ᔿ 0*10 㺘⽪ⲴսѢ䳶ਸѝਚवਜ਼ 0010 ઼ 0110DŽ
GAѝ㗔փⲴ䘋ॆ䎆Ҿࠐњ↕僔ˈণ䘹ᤙ↕ǃ䟽㓴↕઼ਈᔲ↕DŽݸӾਚ㘳㲁䘹ᤙ↕Ⲵ
ᖡ૽ᔰDŽ֯⭘f(h)㺘⽪սѢњփhⲴ䘲ᓄᓖˈᒦ⭘ f (t)㺘⽪൘ᰦ䰤t㗔փѝᡰᴹњփⲴᒣ൷
䘲ᓄᓖDŽ䇮nѪ㗔փѝњփⲴᙫᮠ䟿DŽ֯⭘hspt㺘⽪њփhᰒᱟ⁑ᔿsⲴањԓ㺘ˈ৸ᱟᰦ
䰤t㗔փⲴањᡀઈDŽᴰਾˈԔ uˆ (s, t)㺘⽪൘ᰦ䰤t㗔փѝ⁑ᔿsⲴᇎֻⲴᒣ൷䘲ᓄᓖDŽ
f ( h)
Pr(h)
¦
n
i 1
f (hi )
f (h)
nf (t )
⧠൘ྲ᷌ṩᦞ䘉њᾲ⦷࠶ᐳ䘹ᤙᯠ㗔փⲴањᡀઈˈ䛓Ѹ䘹ࡠ⁑ᔿ s Ⲵањԓ㺘Ⲵᾲ⦷
ᱟ˖
f ( h)
Pr( h s ) ¦
hs pt nf (t )
˄9.2˅
uˆ ( s, t )
m( s, t )
nf (t )
к䶒ⲴㅜҼ↕ṩᦞԕлⲴᇊѹ㘼ᗇ˖
uˆ ( s, t )
¦ hs pt
f ( h)
m( s , t )
uˆ ( s, t )
E[m(s, t+1)]= m(s, t) ˄9.3˅
f (t )
Ԝਟԕᵏᵋˈ൘ਾ㔗Ⲵԓѝ儈Ҿᒣ൷䘲ᓄᓖⲴ⁑ᔿࠪ⧠仁⦷Պॷ儈DŽྲ᷌ᡁԜᢺ GA ⴻˈ
൘ሩњփオ䰤䘋㹼ᱮᔿᩌ㍒Ⲵ਼ᰦˈሩਟ㜭⁑ᔿオ䰤䘋㹼⵰㲊ᤏⲴᒦ㹼ᩌ㍒ˈ䛓Ѹޜᔿ˄9.3˅
ᤷࠪ䘲ᓄᓖ儈Ⲵ⁑ᔿⲴᖡ૽࣋Պ䲿⵰ᰦ䰤໎࣐DŽ
❦㘼к䶒Ⲵ࠶᷀ӵ㘳㲁 GA ѝ䘹ᤙ↕Ⲵᖡ૽ˈᡰԕҏᓄ䈕㘳㲁Ӕ৹઼ਈᔲ↕Ⲵᖡ૽DŽ⁑
ᔿ⨶䇪ӵ㘳㲁䘉Ӌ㇇ᆀਟ㜭䙐ᡀⲴ䍏䶒ᖡ૽˄ֻྲˈ䲿ᵪਈᔲਟ㜭䱽վ s Ⲵԓ㺘ᮠ䟿ˈ⤜・
Ҿ uˆ (s,t)˅ˈᒦфӵ㘳㲁অ⛩Ӕ৹ⲴᛵߥDŽᡰԕᆼᮤⲴ⁑ᔿ⨶䇪㔉ࠪҶ⁑ᔿ s Ⲵᵏᵋ仁⦷Ⲵл
⭼ˈྲлᡰ⽪˖
uˆ ( s, t ) § d (s) ·
E[m( s, t 1)] t m( s, t )¨1 pc ¸(1 p m )
o( s )
˄9.4˅
f (t ) © l 1 ¹
䘉䟼ˈpcᱟሩԫњփᓄ⭘অ⛩Ӕ৹㇇ᆀⲴᾲ⦷ˈpmᱟሩԫњփⲴԫս֯⭘ਈᔲ㇇
ᆀ䘋㹼ਈᔲⲴᾲ⦷DŽo(s)ᱟ⁑ᔿsѝ⺞ᇊս˄defined bits˅Ⲵњᮠˈ0 ઼ 1 ᱟ⺞ᇊⲴսˈ*нᱟDŽ
d(s)ᱟ⁑ᔿsѝᴰᐖ䗩Ⲵ⺞ᇊս઼ᴰਣ䗩Ⲵ⺞ᇊս䰤Ⲵ䐍DŽᴰਾˈlᱟ൘㗔փѝњփսѢ䮯
ᓖDŽ⌘ˈޜᔿ˄9.4˅ѝⲴᴰᐖа亩оޜᔿ˄9.3˅ᱟаṧⲴˈ䘉а亩᧿䘠Ҷ䘹ᤙ↕僔Ⲵᖡ
૽DŽѝ䰤а亩᧿䘠Ҷঅ⛩Ӕ৹㇇ᆀⲴᖡ૽ˈ⢩࡛٬ᗇ⌘Ⲵᱟˈ䘉а亩᧿䘠Ҷԓ㺘sⲴԫ
њփ൘ᓄ⭘ҶӔ৹㇇ᆀਾ䘈㺘⽪sⲴᾲ⦷DŽᴰਣа亩᧿䘠Ҷԓ㺘⁑ᔿsⲴԫњփ൘ᓄ⭘Ҷਈ
ᔲ㇇ᆀਾ䘈㺘⽪sⲴᾲ⦷DŽঅ⛩Ӕ৹઼ਈᔲⲴᖡ૽䲿⵰⁑ᔿѝ⺞ᇊսⲴᮠ䟿o(s)઼⺞ᇊս䰤Ⲵ
䐍d(s)໎䮯DŽഐ↔ˈਟԕ⁑ᔿ⨶䇪ਟԕ㻛㋇⮕ൠ䀓䟺Ѫ˖ᴤ儈䘲ᓄᓖⲴ⁑ᔿⲴᖡ૽࣋䎻ੁ
໎བྷˈቔަᱟवਜ਼䖳ቁᮠ䟿Ⲵ⺞ᇊս˄ҏቡᱟवਜ਼བྷ䟿Ⲵ*˅Ⲵ⁑ᔿ઼䘉Ӌ⺞ᇊս൘սѢѝ
ᖬ↔䶐䘁Ⲵ⁑ᔿDŽ
ሩ GA ѝⲴ㗔փ䘋ॆ䗷〻ˈ⁑ᔿ⨶䇪ਟ㜭ᱟ㻛ᕅ⭘ᗇᴰᒯ⌋Ⲵ⭫ᯩᔿDŽᆳнᆼ༷Ⲵа
䶒ᱟᰐ⌅㘳㲁Ӕ৹઼ਈᔲⲴ˄བྷᾲⲴ˅↓䶒ᖡ૽DŽᴰ䘁ӪԜᐢ㓿ᨀࠪҶᖸཊᯠⲴ⨶䇪࠶᷀ˈ
वᤜสҾ傜ቄਟཛ䬮⁑ර˄Markov chain model˅઼㔏䇑࣋ᆖ⁑ර˄statistical mechanics
models˅Ⲵ࠶᷀DŽֻྲਟԕ৲㿱 Whitley & Vose˄1995˅઼ Mitchell˄1996˅DŽ
9.5 䚍Ֆ㕌ぁ
䚇Ր㕆〻˄Genetic ProgrammingˈGP˅ᱟ䘋ॆ䇑㇇Ⲵаᖒᔿˈަѝ䘋ॆ㗔փѝⲴњ
փᱟ䇑㇇ᵪ〻ᒿ㘼нᱟսѢDŽKoza˄1992˅᧿䘠ҶสᵜⲴ䚇Ր㕆〻ᯩ⌅ᒦф㔉ࠪҶᖸཊㆰ
অⲴਟԕ㻛 GP ᡀ࣏ᆖҐⲴ〻ᒿDŽ
9.5.1 ぁᓅ㺞⽰
GP Ⲵ〻ᒿа㡜㻛㺘⽪Ѫ〻ᒿⲴ䀓᷀˄parse˅ṁDŽ⇿њ࠭ᮠ䈳⭘㻛㺘⽪ѪṁⲴањ
ѪҶᓄ⭘䚇Ր㕆〻ࡠḀњ⢩ᇊⲴ亶ฏˈ⭘ᡧᗵ享ᇊѹᖵ㘳㲁Ⲵᆀ࠭ᮠ˄primitive functions˅
˄ֻྲˈsinˈcosˈᔰᯩˈ+ˈ-ˈᤷᮠ˅ˈԕ৺ㄟ⛩˄terminals˅
˄ֻྲ xǃy ԕ৺ᑨᮠ˅DŽ᧕л
ᶕˈ䚇Ր㕆〻㇇⌅֯⭘䘋ॆᩌ㍒ˈᶕ᧒㍒֯⭘䘉Ӌᆀ᧿䘠Ⲵ〻ᒿⲴᐘབྷオ䰤DŽ
о൘䚇Ր㇇⌅ѝаṧˈරⲴ䚇Ր㕆〻㇇⌅㔤ᣔ⭡ཊњњփ˄൘䘉䟼ᱟ〻ᒿṁ˅㓴ᡀⲴ
㗔փDŽ൘⇿а↕䘝ԓѝˈᆳ֯⭘䘹ᤙǃӔ৹઼ਈᔲӗ⭏ᯠаԓњփDŽ㗔փѝḀњփ〻ᒿⲴ䘲
ᓄᓖа㡜䙊䗷൘䇝㓳ᮠᦞкᢗ㹼䘉њ〻ᒿᶕߣᇊDŽӔ৹ᱟ䘉ṧ䘋㹼Ⲵ˖൘ањৼӢ〻ᒿ
ѝ䲿ᵪ䘹ᤙањᆀṁˈ❦ਾ⭘ਖањৼӢⲴᆀṁᴯԓ䘉њᆀṁDŽമ 9-2 ╄⽪ҶањިරⲴӔ
৹DŽ
插图——原书页码:262
മ 9-1 䚇Ր㕆〻ѝⲴ〻ᒿṁ㺘⽪
ԫ〻ᒿਟԕ㺘⽪ѪᆳԜⲴ䀓᷀ṁDŽ
插图——原书页码:263
മ 9-2 ሩєњৼӢ〻ᒿṁ䘋㹼Ӕ৹
ৼӢ〻ᒿṁᱮ⽪൘кᯩˈᆙᆀṁ൘лᯩDŽӔ৹⛩˄к䗩࣐㋇ᱮ⽪Ⲵ㢲⛩˅ᱟ䲿ᵪ䘹ਆⲴDŽ❦ਾԕ䘉
ӋӔ৹⛩ѪṩⲴᆀṁӂᦒԕӗ⭏ᆙᆀṁDŽ
Koza˄1992˅᧿䘠Ҷᓄ⭘ GP ࡠཊњԫ࣑Ⲵᇎ傼DŽ൘ԆⲴᇎ傼ѝˈṩᦞ䘲ᓄᓖᾲ⦷䘹ᤙ
ᖃࡽ㗔փⲴ 10%н࣐᭩ਈⲴࡠ⮉؍лаԓDŽṩᦞ䘲ᓄᓖᾲ⦷Ӿᖃࡽ㗔փѝ䘹ᤙ〻ᒿሩˈ
ᓄ⭘Ӕ৹ӗ⭏ᯠаԓⲴަ։䜘࠶DŽ൘䘉њᇎ傼㌫ࡇѝ⋑ᴹ֯⭘ਈᔲ㇇ᆀDŽ
9.5.2 ⽰ׁ
മ 9-3 ањᆇඇึਐ䰞仈
䘉њ䚇Ր㕆〻Ⲵԫ࣑ᱟਁ⧠ањ〻ᒿˈਟԕᢺᴹԫࡍ㔃ᶴⲴᆇඇਈᦒᡀањḸࠪঅ䇽
ĀuniversalāDŽᒦᨀҶ 166 ࡍ㔃ᶴᶕ䇴ՠى䘹〻ᒿⲴ䘲ᓄᓖ˄᪈㠚 Koza 1992˅DŽ
൘བྷཊᮠ GP ᓄ⭘ѝˈ䰞仈㺘⽪ᯩ⌅Ⲵ䘹ᤙሩҾ亪࡙ൠ䀓ߣ䰞仈䎧⵰䶎ᑨ䟽㾱Ⲵ⭘DŽ
൘ Koza Ⲵ䇮䇑ѝˈ⭘ԕ㓴ᡀ〻ᒿⲴᆀ࠭ᮠवਜ਼л䶒Ⲵйњㄟ⛩৲ᮠ˖
x CS˄current stack˅˖ᖃࡽḸˈᤷḸ亦ᆇඇⲴᆇˈᡆ⋑ᴹᖃࡽḸᰦѪ FDŽ
x TB˄top correct bloack˅˖ᴰк↓⺞ᆇඇˈᤷ䈕ᆇඇ઼ᆳԕлᆇඇ൷Ѫ↓⺞
亪ᒿⲴᆇඇDŽ
x NN˄next necessary˅˖лањᡰ䴰ᆇඇˈᤷѪҶᡀঅ䇽ĀuniversalāˈḸ
㍗䛫 TB ѻкⲴᡰ䴰ᆇඇⲴᆇˈᡆ㘵ᖃн䴰㾱ᆇඇᰦѪ FDŽ
ਟԕⴻࠪˈ䘹ᤙ䘉ṧⲴㄟ⛩৲ᮠሩҾ᧿䘠↔ԫ࣑Ⲵᆇඇ㓥〻ᒿᨀҶа㠚❦Ⲵ㺘
⽪DŽ৽ˈ䇮ᜣྲ᷌ᢺ⇿њᆇඇⲴ xǃy ḷᇊѹѪㄟ⛩৲ᮠˈ䛓Ѹ㾱ᇎ⧠䘉њԫ࣑ሩ㾱
ഠ䳮ᗇཊDŽ
䲔Ҷ䘉Ӌㄟ⛩৲ᮠˈ䘉њᓄ⭘ѝⲴ〻ᒿ䈝䀰䘈वᤜл䶒Ⲵᆀ࠭ᮠ˖
x ˄MS x˅˄move to stack˅˖〫ࣘࡠḸDŽྲ᷌ᆀඇ x ൘Ṽ䶒кˈ䘉њᢺ
x 〫ࣘࡠḸ亦ᒦф䘄എ TDŽࡉˈᆳӰѸҏнڊᒦф䘄എ FDŽ
x ˄MT x˅˄move to table˅˖〫ࣘࡠṼ䶒DŽྲ᷌ᆇඇ x ᱟ൘ḸѝḀњս㖞ˈ
䘉њᢺḸ亦Ⲵᆇඇ〫ࣘࡠṼ䶒ᒦф䘄എ TDŽࡉ䘄എ FDŽ
x ˄EQ x y˅˄equal˅˖ㅹˈྲ᷌ x ㅹҾ y 䘄എ Tˈࡉ䘄എ FDŽ
x ˄NOT x˅˖ྲ᷌ x=F 䘄എ Tˈྲ᷌ x=T 䘄എ FDŽ
x ˄DU x y˅˄do until˅˖৽༽ᢗ㹼㺘䗮ᔿ x ⴤࡠ㺘䗮ᔿ y 䘄എ TDŽ
9.5.3 䚍Ֆ㕌ぁ䈪᱄
↓ྲк䶒Ⲵֻᆀᡰ╄⽪Ⲵˈ䚇Ր㕆〻ᢺ䚇Ր㇇⌅ᢙኅࡠሩᆼᮤⲴ䇑㇇ᵪ〻ᒿⲴ䘋ॆDŽቭ
㇑ᆳᗵ享㾱ᩌ㍒ᐘབྷⲴٷ䇮オ䰤ˈնᐢ㓿䇱ᇎ൘ᖃᮠ䟿Ⲵᓄ⭘ѝ䚇Ր㕆〻ӗ⭏ҶԔӪ⵰䘧
Ⲵ㔃᷌DŽO’Reilly and Oppacher˄1994˅∄䖳Ҷ GP ㇇⌅઼ަԆᩌ㍒䇑㇇ᵪ〻ᒿオ䰤Ⲵ㇇⌅ˈ
ֻྲ⡜ኡ⌅˄hill climbing˅઼⁑ᤏ䘰⚛⌅˄simulated annealing˅DŽ
൘བྷཊᮠᛵߥлˈ㺘⽪ᯩ⌅Ⲵ䘹ᤙ઼䘲ᓄᓖ࠭ᮠⲴ䘹ᤙሩ䚇Ր㕆〻Ⲵᙗ㜭ᱟ㠣ޣ䟽㾱
ⲴDŽ⭡Ҿ䘉њഐˈⴞࡽ⹄ウⲴањ⍫䏳亶ฏᱟ㠚ࣘਁ⧠઼ਸᒦᆀ〻ᒿˈ᭩ழᴰࡍⲴᆀ࠭
ᮠ䳶ਸˈӾ㘼ݱ䇨㌫㔏ࣘᘱൠ᭩ਈ⭘ԕᶴᔪњփⲴᆀDŽֻྲਟԕ৲㿱 Koza˄1994˅DŽ
9.6 䘑ौૂᆜҖ⁗ශ
൘ᖸཊ㠚❦㌫㔏ѝˈ⭏⢙њփ൘ᆳԜа⭏ᖃѝ䜭൘ᆖҐྲօᴤྭൠ䘲ᓄ⧟ຳDŽ਼ᰦˈ⭏
⢙઼⽮Պ䗷〻ݱ䇨ᆳԜⲴ⢙൘ањवਜ਼ᖸཊԓⲴᰦᵏ䘲ᓄ⧟ຳDŽޣҾ䘋ॆ㌫㔏Ⲵањᴹ
䏓䰞仈ᱟ˖Āঅањփ⭏ભᵏ䰤ⲴᆖҐˈоᮤњ⢙䖳䮯ᰦᵏ⭡䘋ॆ׳ᡀⲴᆖҐˈᆳԜⲴ
ޣ㌫ᱟӰѸ˛ā
9.6.1 傢ށ䘑ौ
、ᆖᇦ傜˄ݻLamarck˅൘ॱҍц㓚ᵛᨀࠪˈཊԓⲴ䘋ॆⴤ᧕ਇࡠҶњ࡛⭏⢙փ൘ᆳ
Ԝ⭏ભᵏ䰤Ⲵ㓿傼Ⲵᖡ૽DŽ⺞࠷ൠ䇢ˈԆᨀࠪњ࡛⭏⢙փⲴ㓿傼ⴤ᧕ᖡ૽ަਾԓⲴ䚇Ր㔃ᶴ˖
ྲ᷌ањњփ൘⭏ભᵏᆖՊҶ䚯ᔰḀᴹ∂伏⢙ˈᆳׯ㜭ᢺ䘉⢩ᖱ䚇Ր㔉ᆳⲴਾԓDŽ䘉
ᱟањᖸ੨ᕅӪⲴ⥌ᜣˈഐѪ∄䎧ᘭ⮕њփ㓿傼ⲴĀ⭏ᡀᒦ⍻䈅˄generate-and-test˅ā䗷〻
˄ྲGA઼GPѝ䛓ṧ˅ˈᆳਟ㜭㧧ᗇᴤ儈᭸Ⲵ䘋ॆ䗷〻DŽቭ㇑䘉њ⨶䇪ᖸᴹ੨ᕅ࣋ˈնⴞࡽ
Ⲵ、ᆖ䇱ᦞо傜⁑ݻරᖫᓅߢケDŽⴞࡽ㻛᧕ਇⲴ㿲⛩ᱟˈњփⲴ䚇Ր㔃ᶴһᇎкнਇᆳⲴ
ৼӢⲴ⭏ᆈ㓿傼Ⲵᖡ૽DŽቭ㇑䘉ᱟ᰾ᱮⲴ⭏⢙ᆖкⲴһᇎˈն䘁ᶕⲴ䇑㇇ᵪ⹄ウᐢ㓿㺘᰾ˈ
傜ݻ䗷〻ᴹᰦਟԕᨀ儈䇑㇇ᵪ䚇Ր㇇⌅Ⲵ᭸⦷˄৲㿱Grefenstette 1991˗Ackley & Littman
DŽ
1994˗Hart & Belew 1995˅
9.6.2 勃ᗭ᭾ᓊ
ቭ㇑傜ݻ䘋ॆ⁑ර⋑ᴹ㻛⭏⢙䘋ॆ䗷〻ᡰ᧕ਇˈӪԜᐢ㓿ᨀࠪҶަԆⲴᵪࡦˈ䙊䗷䘉
ӋᵪࡦњփᆖҐਟԕ᭩ਈ䘋ॆ䘋〻DŽަѝа㻛〠Ѫ劽ᗧ᭸ᓄ˄Baldwin effect˅ ˈᱟṩᦞ
俆ݸᨀࠪ䘉ᙍᜣⲴ J. M. Baldwin˄1896˅Ⲵ㘵ᆇભⲴDŽ劽ᗧ᭸ᓄสҾԕл⧠䊑˖
x ྲ᷌ањ⢙൘ањਈॆⲴ⧟ຳѝ䘋ॆˈ䛓Ѹ䘋ॆⲴ࣋Պ᭟ᤱᴹᆖҐ㜭࣋
ⲴњփDŽֻྲˈྲ᷌൘䘋ॆ⧟ຳѝࠪ⧠ҶањᯠⲴᦅ伏㘵ˈ䛓Ѹ㜭ᆖՊ䚯ᔰ
ᦅ伏㘵ⲴњփˈՊ∄н㜭ᆖՊ↔㜭࣋Ⲵњփᴤᡀ࣏DŽ൘᭸᷌кˈ䘉ᆖҐⲴ
㜭࣋ਟԕ֯њփ൘ަ⭏ભᵏ䰤ᢗ㹼аሿⲴተ䜘ᩌ㍒ˈԕᴰབྷॆᆳⲴ䘲ᓄ
ᓖDŽ৽ˈнᆖҐⲴњփⲴ䘲ᓄᓖᆼޘਆߣҾᆳⲴ䚇Ր㔃ᶴˈՊ༴ҾሩⲴ
࣓࣯DŽ
x 䛓Ӌ㜭ཏᆖҐᖸཊ⢩ᙗ˄trait˅ⲴњփˈՊ䖳ቁൠ䎆Ҿ䚇Րԓ⸱ᶕ⺜ᙗൠ
㿴ᇊަ⢩ᙗDŽ㔃᷌ˈ䘉Ӌњփਟԕ䎆њփᆖҐݻᴽ䚇Րԓ⸱ѝⲴĀђཡⲴā
ᡆĀᒦ䶎ᴰՈⲴā⢩ᙗˈӾ㘼᭟ᤱᴤ࣐ཊṧॆⲴสഐ⊐˄gene pool˅DŽ᧕л
ᶕˈ䘉њᴤ࣐ཊṧॆⲴสഐ⊐ਟԕ׳䘋䘲ᓄᙗᴤᘛ䙏ൠ䘋ॆDŽഐ↔ˈњփⲴ
ᆖҐ㜭࣋ާᴹ䰤᧕࣐䙏ᮤњ㗔փ䘋ॆ䘲ᓄⲴ⭘DŽ
ֻྲˈ䇮ᜣḀњ⢙Ⲵ⧟ຳѝਁ⭏ҶḀњᯠⲴਈॆˈ∄ྲࠪ⧠ањᯠⲴᦅ伏㘵DŽ䘉ṧⲴ
ਈॆՊᴹ࡙Ҿ㜭ᆖՊ䚯ᔰᦅ伏㘵ⲴњփDŽ䲿⵰㗔փѝ㠚ᡁᨀ儈ⲴњփⲴ∄ֻⲴ໎䮯ˈ㗔փՊ
᭟ᤱᴤ࣐ཊṧॆⲴสഐ⊐ˈݱ䇨䘋ॆ䗷〻˄ণ֯ᱟ䶎傜ⲴݻĀ⭏ᡀᒦ⍻䈅ā䗷〻˅䘲ᓄᗇ
ᴤᘛDŽ᧕лᶕˈ䘉࣐䙏Ⲵ䘲ᓄਟԕ֯ḷ߶Ⲵ䘋ॆ䗷〻ᴤᘛൠ䘋ॆࠪа䚇Ր⢩ᖱ˄䶎ᆖࡠ
Ⲵ⢩ᖱ˅ᶕ䚯ᔰᦅ伏㘵˄ֻྲˈаሩᦅ伏㘵Ⲵᵜ㜭ᙅ˅DŽഐ↔劽ᗧ᭸ᓄᨀҶа䰤
᧕Ⲵᵪࡦˈ֯њփⲴᆖҐਟԕ↓䶒ᖡ૽䘋ॆ䙏ᓖDŽ䙊䗷ᨀ儈⢙Ⲵ⭏ᆈ઼࣋䚇Րཊṧᙗˈњ
փᆖҐՊ࣐ᘛ䘋ॆ䘋〻ˈӾ㘼໎࣐䘉њ⢙䘋ॆࠪᴤྭൠ䘲ᓄᯠ⧟ຳⲴ䚇Ր⢩ᙗⲴᵪՊDŽ
9.7 ᒬ㺂䚍Ֆ㇍⌋
GA ᖸ㠚❦ൠ䘲ਸᒦ㹼ᇎ⧠ˈ㘼фᐢ㓿᧒㍒ࠪҶᖸཊᒦ㹼ॆⲴᯩ⌅DŽ㋇㋂ᓖ˄coarse grain˅
ᒦ㹼ᯩ⌅ᢺ㗔փ㓶࠶ᡀሩ⤜・Ⲵњփ㗔ˈ〠Ѫ㊫˄deme˅DŽ❦ਾѪ⇿њ㊫࠶䝽㔉ањ
н਼Ⲵ䇑㇇㢲⛩ˈ൘⇿њ㢲⛩䘋㹼ḷ߶Ⲵ GA ᩌ㍒DŽ㊫ѻ䰤Ⲵ䙊઼ؑӔ৹ਁ⭏Ⲵ仁⦷о㊫
∄䖳վDŽ㊫ѻ䰤ⲴӔᦒ䙊䗷䗱〫˄migration˅ᶕ䘋㹼ˈҏቡᱟḀӋњփӾањ㊫
༽ࡦᡆӔᦒࡠަԆⲴ㊫DŽ䘉њ䗷〻⁑ᤏҶԕлⲴ⭏⢙䘋ॆᯩᔿˈণ㠚❦⭼ѝᔲփਇ㋮ਟ㜭
ਁ⭏൘࠶Ⲵ⢙ᆀ㗔փѻ䰤DŽ䘉ᯩ⌅Ⲵањྭ༴ᱟᆳ߿ቁҶ䶎ᒦ㹼 GA 㓿ᑨ⻠ࡠⲴᤕᥔ
䰞仈ˈ൘䶎ᒦ㹼㇇⌅ѝˈ⭡Ҿ䗷ᰙࠪ⧠᭟䝽ᮤњ㗔փⲴสഐරˈ֯㌫㔏䲧ޕተ䜘ᴰՈDŽTanese
˄1989˅઼ Cohoon et al.˄1987˅᧿䘠Ҷ㋇㋂ᓖᒦ㹼 GA ㇇⌅ⲴֻᆀDŽ
ሩҾ㋇㋂ᓖᒦ㹼ᇎ⧠ˈ㓶㋂ᓖ˄fine-grained˅ᇎ⧠а㡜㔉㗔փѝⲴ⇿њњփ࠶䝽ањ
༴⨶ಘDŽ❦ਾ䛫Ⲵњփ䰤ਁ⭏䟽㓴DŽӪԜᐢ㓿ᨀࠪҶࠐњ䛫⁑රˈӾᒣ䶒㖁Ṭࡠ䎵⧟㔃
ᶴDŽSpiessens & Manderick˄1991˅᧿䘠Ҷ䘉ṧⲴ㌫㔏ⲴᇎֻDŽStender˄1993˅ѝਟԕᗇࡠ
ޣҾᒦ㹼 GA ㇇⌅Ⲵ䇪᮷䳶DŽ
9.8 ቅ㔉ૂ㺛ݻ䈱⢟
䘉аㄐⲴ㾱⛩वᤜ˖
x 䚇Ր㇇⌅˄GA˅䘋㹼а䲿ᵪॆⲴᒦ㹼⡜ኡᩌ㍒ˈᶕਁ⧠֯亴ݸᇊѹⲴ䘲
ᓄᓖ࠭ᮠᴰՈⲴٷ䇮DŽ
x GA ᡰ䟷ਆⲴᩌ㍒ᱟสҾሩ⭏⢙䘋ॆⲴ⁑ᤏDŽGA 㔤ᣔањ⭡ㄎҹٷ䇮㓴ᡀ
Ⲵཊṧॆ㗔փDŽ൘⇿а⅑䘝ԓѝˈ䘹ࠪ㗔փѝ䘲ᓄᓖᴰ儈Ⲵᡀઈᶕӗ⭏ਾԓˈ
ᴯԓ㗔փѝ䘲ᓄᓖᴰᐞⲴᡀઈDŽٷ䇮ᑨ㻛㕆⸱ᡀսѢˈਟԕ䙊䗷Ӕ৹㇇ᆀ㓴
ਸˈսѢкҏਟ㜭ਁ⭏䲿ᵪⲴਈᔲDŽ
x GA 䱀᰾ҶྲօᢺᆖҐ䗷〻ⴻᡀᴰՈॆ䗷〻Ⲵањ⢩ֻDŽާփᶕ䈤ˈᆖҐԫ
࣑ቡᱟṩᦞ亴ݸᇊѹⲴ䘲ᓄᓖ࠭ᮠਁ⧠ᴰՈⲴٷ䇮DŽ䘉㺘᰾ަԆⲴᴰՈॆᢰ
ᵟˈֻྲ⁑ᤏ䘰⚛⌅ˈҏਟԕᓄ⭘ࡠᵪಘᆖҐ䰞仈DŽ
x GA ᐢ㓿㻛Პ䙽ᓄ⭘ࡠᵪಘᆖҐཆⲴᴰՈॆ䰞仈ѝˈֻྲ䇮䇑Ոॆ䰞仈DŽᖃ
ᢺ GA ᓄ⭘ࡠᆖҐԫ࣑ᰦˈᆳ⢩࡛䘲ਸٷ䇮ᖸ༽ᵲⲴԫ࣑˄ֻྲˈٷ䇮ᱟᵪ
ಘӪ᧗ࡦⲴ㿴ࡉ䳶ᡆ䇑㇇ᵪ〻ᒿ˅઼ᴰՈॆⲴⴞḷᱟٷ䇮Ⲵ䰤᧕࠭ᮠⲴԫ࣑
˄ֻྲˈ㾱≲ᗇࡠⲴ㿴ࡉ䳶ਟԕᡀ࣏ൠ᧗ࡦањᵪಘӪ˅DŽ
x 䚇Ր㕆〻ᱟ䚇Ր㇇⌅Ⲵањਈփˈ൘䚇Ր㕆〻ѝˈ㻛Ⲵٷ䇮ᱟ䇑㇇ᵪ〻
ᒿ㘼нᱟսѢDŽӔ৹઼ਈᔲ㻛᧘ᒯԕᓄ⭘Ҿ〻ᒿ㘼нᱟսѢDŽӪԜᐢ㓿
╄⽪Ҷ䚇Ր㕆〻ᆖҐ䪸ሩḀӋԫ࣑Ⲵ〻ᒿˈ∄ྲ⁑ᤏᵪಘӪ᧗ࡦ˄Koza
1992˅઼䇶࡛㿶㿹൪Ჟ˄visual scenes˅ѝⲴ⢙փ˄Teller and Veloso 1994˅DŽ
Mitchell˄1996˅઼ Goldberg˄1989˅ᱟ䇘䇪䚇Ր㇇⌅䘉аѫ仈ⲴєᵜᮉᶀDŽForrest˄1993˅
ᾲᤜҶ GA ѝⲴᢰᵟ䰞仈ˈGoldberg˄1994˅ᾲᤜҶᴰ䘁Ⲵࠐњᓄ⭘DŽKoza˄1992˅ޣҾ䚇
Ր㕆〻Ⲵу㪇ᱟሩ䚇Ր㇇⌅ᢙኅࡠ䇑㇇ᵪ〻ᒿⲴḷ߶৲㘳DŽਁ㺘ᯠᡀ᷌Ⲵѫ㾱Պ䇞ᱟ䚇
Ր㇇⌅ഭ䱵Պ䇞˄ICGA˅DŽަԆⲴޣՊ䇞वᤜ㠚䘲ᓄ㹼ѪԯⵏՊ䇞˄CSAB˅ˈӪᐕ⾎㓿
㖁㔌઼䚇Ր㇇⌅ഭ䱵Պ䇞˄ICANNGA˅ˈԕ৺ IEEE 䘋ॆ䇑㇇ഭ䱵Պ䇞˄ICEC˅DŽⴞࡽҏᴹ
䚇Ր㕆〻ᯩ䶒ⲴᒤՊ˄Koza et al. 1996b˅DŽlj䘋ॆ䇑㇇ᵲᘇNJ˄Evolutionary Computation
Journal˅ᱟ䘉њ亶ฏᴰᯠ⹄ウᡀ᷌ⲴањᶕⓀDŽ ljᵪಘᆖҐNJ
˄Machine Learning˅ᵲᘇⲴа
Ӌ⢩࠺ҏᱟ䪸ሩ GA ⲴDŽ
Ґ仈
৲㘳᮷⥞
ㅢ10ㄖ ᆜҖ㿺ࡏ䳼ਾ
ᇍᄺдࠄⱘ؛䆒ˈ᳔᳝㸼ᕕⱘ᳔㛑ЎҎ㉏᠔⧚㾷ⱘ㸼⼎ᮍ⊩ПϔЎ if-then 㾘߭
ⱘ䲚ড়DŽᴀゴ㋶њ㢹ᑆ㛑ᄺд䖭ḋⱘ㾘߭䲚ড়ⱘㅫ⊩DŽ݊Ё᳔䞡㽕ⱘϔ⾡ᰃᄺдࣙব䞣
ⱘ㾘߭䲚ড়ˈ⿄Ўϔ䰊 Horn ᄤহ䲚ড়DŽ⬅Ѣϔ䰊 Horn ᄤহ䲚ড়ৃ㹿㾷䞞Ў䘏䕥㓪䇁
㿔 Prolog Ёⱘᑣˈᄺдⱘ䖛㒣ᐌ㹿⿄Ўᔦ㒇䘏䕥㓪˄ILP˅DŽᴀゴ㗗ᆳњ⾡ᄺд㾘
߭䲚ড়ⱘ䗨ᕘˈ݊Ёϔ⾡䗨ᕘѢᴎ఼ᅮ⧚䆕ᯢ఼Ёⓨ㒢᪡ⱘ䗚䕀DŽ
10.1 ԁ㔃
䆌ᚙމϟˈ᳝ᖙ㽕ᄺдϔϾⳂᷛߑ᭄ˈᅗ㸼⼎Ў݅ৠᅮН䆹ߑ᭄ⱘ㢹ᑆ if-then 㾘
߭ⱘ䲚ড়DŽབ 3 ゴ᠔⼎ˈᄺд㾘߭䲚ড়ⱘϔ⾡ࡲ⊩ᰃ佪ܜᄺдࠄއㄪᷥˈ✊ৢᇚℸᷥ䕀ᤶ
Ўϔㄝᬜⱘ㾘߭䲚ড়DŽϔ⾡ᮍ⊩ᰃ 9 ゴҟ㒡ⱘ䘫Ӵㅫ⊩ˈᅗ⫼ԡІ㓪ⷕ↣Ͼ㾘߭䲚ড়ˈ
✊ৢ⫼䘫Ӵ᧰㋶ㅫᄤᴹ㋶ᭈϾ؛䆒ぎ䯈DŽᴀゴ៥Ӏ䅼䆎ϔᮣϡৠⱘㅫ⊩ˈᅗⳈᄺд㾘߭
䲚ড়ˈ䖭ᮣㅫ⊩Ϣࠡ䴶ⱘㅫ⊩Ⳍ↨᳝ϸ⚍݇䬂ⱘϡৠDŽ佪ˈܜᅗӀৃᄺдࣙব䞣ⱘϔ䰊㾘
߭䲚ড়ˈ䖭ϔ⚍ᕜ䞡㽕ˈЎϔ䰊ᄤহⱘ㸼⼎㛑↨ੑ乬㾘߭㽕ᔎᕫDŽѠˈ䖭䞠䅼䆎ⱘ
ㅫ⊩Փ⫼ᑣ߫㽚Ⲫㅫ⊩ˈϔᄺдϔϾ㾘߭ˈҹ䗦ഄᮍᓣᔶ៤᳔㒜ⱘ㾘߭䲚ড়DŽ
Ўϔ䰊㾘߭䲚ড়ⱘ՟ᄤˈ㗗㰥ҹϟϸϾ㾘߭ˈᅗӀ݅ৠᦣ䗄њⳂᷛὖᗉ AncestorDŽ䖭
䞠៥ӀՓ⫼䇧䆡 Parent(x,y)ᴹ㸼⼎ y ᰃ x ⱘ⠊҆↡҆ˈ㗠䇧䆡 Ancestor(x,y)㸼⼎ y ᰃ x ⱘ
ӏᛣҷⱘ⼪ܜDŽ
⊼ᛣҹϞϸϾ㾘߭ᕜ㋻ޥഄᦣ䗄њϔϾ䗦ᔦߑ᭄ˈᅗᕜ䲒⫼އㄪᷥ݊Ҫⱘੑ乬ⱘᮍ⊩
ᴹ㸼⼎DŽЎ䇈ᯢϔ䰊㾘߭ⱘᔎⱘ㸼⼎㛑ˈৃҹ㗗㰥䗮⫼ⱘ㓪䇁㿔 PrologDŽ Prolog
Ёˈᑣᰃϔ䰊㾘߭ⱘ䲚ড়ˈབϞ᠔⼎ⱘ䙷ḋ˄䖭⾡ᔶᓣⱘ㾘߭г㹿⿄Ў Horn ᄤহ˅DŽᅲ
䰙ϞˈབᵰׂᬍϞ䴶ϸϾ㾘߭ⱘ䇁⊩ˈህৃҹᕫࠄϔϾড়⊩ⱘ Prolog ᑣˈᅗ⫼ᴹ䅵
ㅫ Ancestor ݇㋏DŽℸˈϔϾৃҹᄺд䖭⾡㾘߭䲚ড়ⱘ䗮⫼ㅫ⊩ˈৃ㹿ⳟᰃҢḋ՟Ё㞾
ࡼᇐߎ Prolog ᑣⱘㅫ⊩DŽᴀゴҟ㒡њ㒭ᅮ䗖ᔧⱘ䆁㒗՟䲚ড়ᯊˈ㛑ᄺд䖭⾡㾘߭
ⱘᄺдㅫ⊩DŽ
ᅲ䏉ЁѢϔ䰊㸼⼎ⱘᄺд㋏㒳Ꮖ៤ࡳഄᑨ⫼Ѣ⾡䯂乬ˈབ䋼䈅ҾЁᄺдાϔϾ࣪
ᄺ㥃ક㛑㉬ড়⠛BuchananLindsayˈᄺдાϔϾ࣪ᄺѮ㒧ᵘӮѻ⫳䇅ᇐ᳝
ᴎԧさবⱘᬒᇘᗻ⠽䋼˄ϔϾ݇Ѣ㟈Ⱐ⠽䋼ⱘሲᗻ˅˄Srinivasanetal˅ˈҹঞᄺд᳝
䰤ऩܗ㔥ҹߚᵤ⠽⧚㒧ᵘЁⱘᑨ˄Dolsak Muggleton˅DŽ↣Ͼᑨ⫼Ёˈ؛䆒ⱘ㸼
⼎ᖙ乏ࣙ݇㋏ᮁ㿔ˈᅗৃ⬅ϔ䰊㸼⼎ᴹㅔऩഄ㸼䖒ˈैᕜ䲒⫼ੑ乬㸼⼎ᴹᦣ䗄DŽ
ᴀゴЁˈ៥Ӏܜҟ㒡㛑ᄺдੑ乬㾘߭䲚ⱘㅫ⊩ˈेϡব䞣ⱘ㾘߭DŽ䖭⾡ḚᶊЁˈ
᧰ᇏ؛䆒ぎ䯈ҹᄺдࠄᵤপ㾘߭䲚ড়ⱘㅫ⊩↨䕗ᯧѢ⧚㾷DŽ✊ৢˈ៥Ӏ㗗㰥њᇚ䖭ѯㅫ⊩ᠽ
ሩࠄϔ䰊㾘߭DŽϟᴹ䅼䆎њᔦ㒇䘏䕥ⱘϸ⾡䗮⫼䗨ᕘˈҹঞᔦ㒇ⓨ㒢⧚ⱘᴀ݇㋏DŽ
10.2 ᓅࡍ㾼ⴌ㇍⌋
䖭䞠㗗㰥ⱘϔᮣㅫ⊩ˈ݊ᄺд㾘߭䲚ⱘㄪ⬹Ў˖ᄺдϔϾ㾘߭ˈ⿏এᅗ㽚Ⲫⱘ᭄ˈݡ
䞡䖭ϔ䖛DŽ䖭ḋⱘㅫ⊩㹿⿄Ўᑣ߫㽚Ⲫ˄sequentialcovering˅ㅫ⊩DŽᛇ䈵៥ӀᏆ᳝њ
ϔϾᄤᑣ learnoneruleˈᅗⱘ䕧ܹЎϔ㒘ℷ՟ড՟ˈ✊ৢ䕧ߎऩϾ㾘߭ˈᅗ㛑㽚Ⲫ
䆌ℷ՟ˈᑊϨ㽚Ⲫᕜᇥⱘড՟DŽ៥Ӏ㽕∖䖭ϔ䕧ߎⱘ㾘᳝߭䕗催ⱘ㊒⹂ᑺˈԚϡᖙ᳝䕗催
ⱘ㽚ⲪᑺDŽ䕗催ⱘ㊒⹂ᑺ䇈ᯢᅗ᠔ⱘߎخ乘⌟ᑨЎℷ⹂ⱘDŽৃফ䕗Ԣⱘ㽚Ⲫᑺˈ㸼⼎ᅗϡ
ᖙᇍ↣Ͼ䆁㒗ḋ՟䛑ߎ乘⌟DŽ
ᑣ߫㽚Ⲫㅫ⊩ᰃᑓ⊯Փ⫼ⱘᄺдᵤপ㾘߭䲚ㅫ⊩ⱘ݊ЁПϔDŽᅗᇚᄺдᵤপ㾘߭䲚ⱘ䯂
乬࣪ㅔЎϔ㋏߫ㅔऩⱘ䯂乬ˈ↣Ͼᄤ䯂乬া䳔ᄺࠄऩϾড়প㾘߭DŽ⬅Ѣᅗᠻ㸠ⱘᰃϔ⾡䋾
ှ᧰㋶ˈᔶ៤ᑣ߫࣪ⱘ㾘߭Ϩ≵᳝ಲ⒃ˈ᠔ҹᅗϡ㛑ֱ䆕ᡒࠄ㛑㽚Ⲫḋ՟ⱘ᳔ᇣⱘ᳔Շⱘ
㾘߭DŽ
㸼 10-1 ᄺдᵤপⱘ㾘߭䲚ⱘᑣ߫㽚Ⲫㅫ⊩DŽ
10.2.1 ж㡢ࡦ⢯⇀ḧ⣬ᩒ㍘
插图——原书页码:277
↣ϔℹˈ᳔Շ㾘߭ⱘࠡӊ㹿ҹ⾡ৃ㛑ᮍᓣ⡍࣪DŽ㾘߭ৢӊᰃ⬅⒵䎇ࠡӊⱘḋ՟᠔އᅮⱘDŽ
䆹ᰒ⼎ⱘᰃᆑᑺЎ 1 ⱘ᷅⢊᧰㋶DŽ
Ϟ䴶㤤ⱘϔ㠀ࠄ⡍⅞᧰㋶ᰃϔ⾡ϡᏺಲ⒃ⱘ䋾ှ⏅ᑺӬ᧰ܜ㋶DŽབ݊Ҫ䋾ှ᧰㋶ϔ
ḋˈᅗ᠔ᏺᴹⱘॅ䰽ᰃ↣ϔℹৃ㛑ߎњӬⱘ䗝ᢽDŽЎޣᇣ䖭⾡亢䰽ˈৃᇚℸㅫ⊩ᠽሩЎ
ϔ⾡᷅⢊᧰㋶˄beamsearch˅ˈे↣ϔℹㅫ⊩ֱ⬭ k Ͼ᳔Շ䗝ⱘ߫㸼ˈ↣ϔ᧰㋶ℹᇍ䖭
k Ͼ᳔Շ䗝⫳៤ߚᬃ˄⡍࣪˅ˈᑊϨ㒧ᵰ䲚ݡ㹿ࠞޣ㟇 k Ͼ᳔ৃ㛑៤ਬDŽ᷅⢊᧰㋶䎳䏾ᔧ
᳔ࠡ催ߚؐ؛䆒ⱘ᳔᳝Ꮰᳯⱘ᳓ҷ㗙ˈҹՓ↣ϔℹЁᅗӀⱘ᠔᳝ৢ㒻䛑㹿㗗㰥ࠄDŽ䆹ϔ㠀ࠄ
⡍⅞᷅⢊᧰㋶⫼Ѣ CN ᑣˈᅗ⬅ Clark Niblett˄˅ᦤߎDŽ䆹ㅫ⊩㸼 Ёᦣ䗄DŽ
10.2.2 ࠖ〃ශ
ㅫ⊩ⱘϔবൟᰃϔᮣ⿄Ў AQ ⱘㅫ⊩˄MichalskMichalskietal˅ˈᅗ
↨Ϟ䴶䅼䆎᠔Ѣⱘ CN ㅫ⊩ᮽDŽབ CN ϔḋˈAQ ᄺдᵤপ㾘߭䲚ˈҹ㽚ⲪⳂᷛߑ᭄DŽ
✊㗠ˈAQ ϢϞ䴶㒭ߎⱘㅫ⊩᳝ҹϟϡৠ˖佪 ܜAQ ⱘ㽚Ⲫㅫ⊩Ϣᑣ߫㽚Ⲫㅫ⊩ϡৠˈЎ
ᅗᯢ⹂ഄᇏᡒ㽚Ⲫϔ⡍ᅮⳂᷛؐⱘ㾘߭ˈ✊ৢᇍ↣ϾⳂᷛؐᄺдϔᵤপ㾘߭䲚DŽѠˈAQ
ㅫ⊩ᄺдऩϾ㾘߭ⱘᮍ⊩гϡৠѢ learnoneruleDŽᔧᅗᇍ↣Ͼ㾘߭ᠻ㸠ϔ㠀ࠄ⡍⅞᷅⢊᧰
㋶ᯊˈᅗೈ㒩ऩϾℷ՟ᴹ䖯㸠᧰㋶DŽ⹂ߛഄ䇈ˈᅗ᧰㋶Ёা㗗㰥㹿䆹ℷ՟⒵䎇ⱘሲᗻˈҹ
ᕫࠄ䗤⏤⡍⅞ⱘ؛䆒DŽ↣ᄺϔϾᮄ㾘߭ᯊˈᅗҢ䙷ѯ㽚Ⲫⱘḋ՟Ёг䗝ᢽϔϾᮄⱘℷ՟ˈ
Ў⾡ᄤҹᣛᓩᮄᵤপ乍ⱘ᧰㋶DŽ
10.3 ᆜҖ㿺ࡏ䳼φቅ㔉
Ϟ䴶䅼䆎ⱘᑣ߫㽚Ⲫㅫ⊩ ゴЁⱘއㄪᷥᄺдㅫ⊩ᦤկњ⾡ᄺд㾘߭䲚ⱘᮍ⊩DŽ
ᴀ㡖㗗㰥䖭ѯ㾘߭ᄺдㅫ⊩䆒䅵Ёⱘ݇䬂ᗱᛇDŽ
佪ˈܜᑣ߫㽚Ⲫㅫ⊩↣ᄺдϔϾ㾘߭ˈ⿏এ㽚Ⲫⱘḋ՟✊ৢ࠽ԭḋ՟Ϟ䞡䖭ϔ䖛
DŽⳌডˈབ ID 䙷ḋⱘއㄪᷥㅫ⊩Փ⫼ऩϾ᧰㋶䖛ᴹ᧰㋶ৃফއㄪᷥˈ↣ℹᑊ㸠ᄺ
дᭈϾᵤপ乍ⱘ䲚ড়DŽℸˈ៥Ӏгৃᇚ ID 䖭ḋⱘㅫ⊩⿄Ўᑊ㸠㽚Ⲫㅫ⊩ˈᇍᑨѢ CN
䖭ḋⱘᑣ߫㽚Ⲫㅫ⊩DŽાϔ⾡ㅫ⊩↨䕗ད˛ㄨḜ݇䬂Ѣ᧰㋶Ё᳔ᴀℹ偸П䯈ⱘᏂ߿DŽ
ID ↣ϔ᧰㋶ℹЁḍᅗᇍ᭄ѻ⫳ⱘߦߚ䗝ᢽϡৠⱘሲᗻDŽⳌডˈCN 䗝ᢽⱘᰃϡৠⱘ
ሲᗻؐᇍˈᮍ⊩ᰃ䗮䖛↨䕗ᅗӀ㽚Ⲫⱘ᭄ᄤ䲚DŽ㽕ⳟߎ䖭⾡Ꮒ߿ⱘᛣН᠔ˈ䳔㽕↨䕗
ϸ⾡ㅫ⊩ЎᄺдࠄⳌৠⱘ㾘߭䲚ড়᠔ߎⱘϡৠ䗝ᢽⱘ᭄DŽЎњᄺдࠄ n Ͼ㾘߭ⱘ䲚ড়ˈ
↣Ͼ㾘߭ࠡӊࣙড় k Ͼሲᗻؐ⌟䆩ˈᑣ߫㽚Ⲫㅫ⊩䳔㽕ᠻ㸠 ngk ᴀ᧰㋶ℹˈЎ↣Ͼ㾘
߭ⱘ↣Ͼࠡӊخ⣀ゟⱘ䗝ᢽˈ㗠ᑊ㸠㽚Ⲫㅫ⊩ⱘ⣀ゟ䗝ᢽ᭄䖰䖰ᇥѢℸˈЎއㄪᷥЁ
↣Ͼއㄪ㒧⚍ⱘ䗝ᢽ䛑ᇍᑨњϢ䆹㒧⚍Ⳍ݇㘨ⱘϾ㾘߭ⱘࠡӊ䗝ᢽDŽᤶ㿔Пˈབᵰއㄪ㒧
⚍⌟䆩ϔϾ᳝ m ⾡ৃ㛑ؐⱘሲᗻˈ↣އㄪ㒧⚍ⱘ䗝ᢽ䛑ᇍᑨњᇍ m ϾⳌᑨⱘ㾘߭Ё↣Ͼ
㾘߭ⱘࠡӊ䗝ᢽ˄㾕д乬 ˅DŽ䖭ḋˈᑣ߫㽚Ⲫㅫ⊩˄བ CN˅ߎⱘ⣀ゟ䗝ᢽ᭄催Ѣ
ID 䖭ḋⱘᑊ㸠㽚Ⲫㅫ⊩DŽԚાϔ⾡ㅫ⊩དⱘ䯂乬ձ✊ᄬDŽ݊㾷ㄨձ䌪Ѣ᳝ᇥ䆁㒗᭄
ᰃৃ⫼ⱘDŽབᵰ᭄䴲ᐌЄᆠˈ䙷Мᅗৃҹᬃᣕᑣ߫㽚Ⲫㅫ⊩᠔㽕∖ⱘ䕗᭄䞣ⱘ⣀ゟ䗝
ᢽDŽ✊㗠㢹᭄䕗㔎УˈᇍѢϡৠ㾘߭ࠡӊⱘއㄪĀ݅ѿā᳝߭ᬜDŽϔ㗗㰥Ѣ⡍ᅮⱘ
ӏࡵЁᰃ৺Ꮰᳯϡৠⱘ㾘߭⌟䆩ⳌৠⱘሲᗻDŽᑊ㸠㽚Ⲫއㄪᷥᄺдㅫ⊩ЁӮߎ⦄䖭ḋⱘᚙ
މDŽᑣ߫㽚Ⲫㅫ⊩Ё߭ϡᄬDŽ
݊ЁcЎⳂᷛߑ᭄ৃপⱘϡৠ᭄ؐ䞣ˈpiЎSЁⳂᷛߑ᭄পiϾؐⱘḋ՟᠔ऴ↨
՟DŽϢ㒳䅵ᛣН⌟䆩Ⳍ㒧ড়ˈ➉ᑺ䞣⫼ѢCN2 ㅫ⊩˄Clark & Niblett 1989˅ˈᅗ
гᰃ䆌އㄪᷥᄺдㅫ⊩ЁֵᙃⲞᑺ䞣ⱘ⸔DŽ
10.4 ᆜҖж䱬㿺ࡏ
ࠡ䴶䅼䆎ⱘㅫ⊩䩜ᇍᄺдੑ乬㾘߭䲚˄े᮴ব䞣ⱘ㾘߭˅DŽᴀ㡖Ёᇚ㗗㰥ᏺ᳝ব䞣ⱘ㾘
߭ˈ⹂ߛഄ䆆Ўϔ䰊 Horn ᄤহDŽП᠔ҹ㗗㰥䖭ḋⱘ㾘߭ˈᰃЎᅗӀ↨ੑ乬㾘᳝߭㸼ᕕ
㛑DŽᇍѢϔ䰊↉㾘߭ⱘᔦ㒇ᄺд䗮ᐌ㹿⿄Ўᔦ㒇䘏䕥㓪˄InductiveLogicProgrammingˈ
ㅔ ݭILP˅ˈЎ䖭ϔ䖛ৃⳟҢḋ՟Ё㞾ࡼ䆎ߎ Prolog ᑣDŽProlog ᰃϔϾ䗮⫼ⱘǃ
♉ㄝӋⱘ㓪䇁㿔ˈ݊Ёᑣ㹿㸼⼎Ўϔ㒘 Horn ᄤহDŽ
10.4.1 ж䱬 Horn ᆆਛ
Ў䇈ᯢϔ䰊㸼⼎↨ੑ乬˄᮴ব䞣˅㸼⼎ⱘӬ䍞П໘ˈ㗗㰥ϔϾᄺдӏࡵˈⳂᷛὖᗉᕜㅔ
ऩˈЎ DaughterxyˈᅮН᠔᳝ⱘҎ x y ϞDŽDanghterxyⱘؐ x ᰃ y ⱘཇܓᯊЎ
ⳳˈ৺߭Ў؛DŽ؛ᅮ↣ϾҎ㹿ᦣ䗄Ўሲᗻ NameMotherFatherMale FemaleDŽℸ↣
Ͼ䆁㒗ḋ՟ᇚࣙҹ䖭ѯሲᗻ䖯㸠ⱘᦣ䗄ⱘϸϾҎˈҹঞⳂᷛሲᗻ Daughter ⱘؐDŽ՟བˈ
ϟ䴶ЎϔϾℷ՟ˈ݊Ё Sharon Ў Bob ⱘཇܓDŽ
݊Ё↣ϾሲᗻৡϞⱘϟᷛᰃЎњऎߚ䖭ϸϾҎDŽ⦄ˈབᵰ᧰䲚䆌䖭ḋⱘⳂᷛὖᗉ
Daughterⱘ䆁㒗ḋ՟ˈᑊᇚᅗӀᦤկ㒭ϔϾੑ乬㾘߭ᄺд఼ˈབCN Cˈ㒧ᵰᇚЎϔ
㒘䴲ᐌ⡍⅞ⱘ㾘߭བ˖
㱑✊䖭Ͼ㾘߭ᰃℷ⹂ⱘˈԚᅗ䖛Ѣ⡍⅞њˈℸᅗᇍҞৢⱘߚ㉏Т↿᮴⫼໘DŽ䯂乬
Ѣˈੑ乬㸼⼎ᮍ⊩ϡ㛑ᦣ䗄ሲᗻؐП䯈ᅲ䋼݇㋏DŽϢℸϡৠˈՓ⫼ϔ䰊㸼⼎ⱘᑣᇚᄺࠄ
ϟ䴶ⱘϔ㠀㾘߭˖
݊Ё x y Ўব䞣ˈᅗӀৃᣛҷӏᛣҎDŽ
䖬ৃ㛑㾘߭ⱘৢӊࠡӊЁՓ⫼Ⳍৠⱘ䇧䆡ˈᦣ䗄䗦ᔦⱘ㾘߭DŽབᴀゴᓔ༈ⱘϸϾ
㾘߭ᦤկњὖᗉ Ancestorxyⱘ䗦ᔦᅮНDŽҹϟᇚᦣ䗄ⱘ ILP ᄺдᮍ⊩Ꮖৃҹᄺд⾡ㅔ
ऩⱘ䗦ᔦߑ᭄ˈࣙᣀབϞ䴶ⱘ Ancestor ߑ᭄ҹঞ݊Ҫϔѯߑ᭄ˈབᇍ߫㸼Ёܗ㋴䖯㸠ᥦᑣ˗
Ң߫㸼Ё⿏এϔ⡍ᅮܗ㋴˗ᣐϸϾ߫㸼DŽ
10.4.2 ᵥ䈣
ᇍѢ䖭ѯヺোˈৃབϟᵘ䗴㸼䖒ᓣ˖乍˄term˅ᰃӏᛣᐌ䞣ǃӏᛣব䞣ǃᑨ⫼ࠄӏᛣ
乍Ϟⱘӏᛣߑ᭄˄՟བ˖BobxageBobㄝ˅DŽϔϾ᭛ᄫ˄literal˅ᰃᑨ⫼ࠄ乍Ϟⱘӏᛣ䇧
䆡݊৺ᅮDŽབ MarriedBobLouise GreaterBThanageSueㄝDŽབᵰϔ᭛ᄫࣙ
ϔ৺ᅮヺো˄˅ˈᇚ݊⿄Ў䋳᭛ᄫ˄negativeliteral˅ˈ৺߭Ўℷ᭛ᄫ˄positiveliteral˅DŽ
ϔϾᄤহ˄clause˅ᰃϾ᭛ᄫⱘӏᛣᵤপˈ݊Ё᠔᳝ⱘব䞣؛ᅮЎܼ⿄䞣࣪ⱘDŽHorn
ᄤহ˄Hornclause˅Ўࣙ㟇ϔϾℷ᭛ᄫⱘᄤহˈ՟བ˖
H L1 Ln
H m ( L1 Ln )
IF L1 Ln , THEN H
㸼 10-3 ϔ䰊䘏䕥ЁⱘᴀᅮН
H m ( L1 Ln )
݊ Ё H LĂLn Ў ℷ ᭛ ᄫ DŽ H 㹿 ⿄ Ў Horn ᄤ হ ⱘ ༈ head 䆎 ˄ consequent ˅ DŽ ᭛ ᄫ ড় প ᓣ
L1 L2 Ln 㹿⿄ЎHornᄤহⱘԧ˄body˅㗙ܜ㸠䆡˄antecedents˅DŽ
ᇍӏᛣ᭛ᄫ A Bˈ㸼䖒ᓣ(AĕB)ㄝӋѢ(AĢB)ˈ㗠㸼䖒ᓣ (AġB)ㄝӋѢ(AĢB)DŽℸˈϔϾ
Horn ᄤহৃ㹿ㄝᬜഄݭϟ䴶ⱘᵤপᓣ˖
H L1 Ln
㕂ᤶ˄substitution˅ᰃϔϾᇚᶤѯব䞣᳓ᤶЎᶤѯ乍ⱘߑ᭄DŽ՟བ㕂ᤶ{x/3, y/z}ᡞব䞣 x ᳓ᤶЎ乍 3
ᑊϨᡞব䞣 y ᳓ᤶЎ乍 zDŽ㒭ᅮϔϾ㕂ᤶ©ϔ᭛ᄫ Lˈ៥ӀՓ⫼ L©ҷ㸼ᑨ⫼㕂ᤶ©ࠄ L ᕫࠄⱘ㒧ᵰDŽ
ϸϾ᭛ᄫL1L2ⱘড়ϔ㕂ᤶ˄unifying substitution˅ЎϔϾ㕂ᤶ©ˈՓᕫL1©=L2©DŽ
10.5 ᆜҖж䱬㿺ࡏ䳼φFOIL
ˊᄺд↣Ͼᮄ㾘߭ⱘϔ㠀ࠄ⡍⅞᧰㋶ЁˈFOIL Փ⫼њϡৠⱘ㒚㡖ℹ偸ᴹ⫳៤㾘߭ⱘ
䗝⡍࣪ᓣDŽ䖭ϔϡৠᰃЎњ໘⧚㾘߭ࠡӊЁ᳝ⱘব䞣DŽ
ϟ䴶ϸ㡖ᇚ䆺㒚ഄ㗗㰥䖭ϸϾϡৠП໘DŽ
Ўњ⫳៤ᔧࠡ㾘߭ⱘ䗝⡍࣪ᓣˈFOIL ⫳៤᭄Ͼϡৠⱘᮄ᭛ᄫˈ↣Ͼৃ㹿ऩ⣀ഄࡴࠄ
㾘߭ࠡӊЁDŽ㊒⹂ഄ䆆ˈ؛ᅮᔧࠡ㾘߭Ў˖
PxxĂxkĕLĂLn
GrandDaughterxyĕ
⫳៤Ў䖯ϔℹ⡍࣪䆹㾘߭ⱘ䗝᭛ᄫᯊˈFOIL ⦄㽕㗗㰥ⱘ᭛ᄫ䰸Ϟϔℹ᠔᳝᭛ᄫП
ˈ䖬㽕ࡴϞ᭛ᄫˈFemalezEqualzxEqualzyFatherzwFatherwzˈҹ
ঞᅗӀⱘ৺ᅮDŽП᠔ҹࡴϞ䖭ѯ᭛ᄫᰃЎࠡϔℹব䞣 z 㹿ࡴࠄ㾘߭Ёˈ᠔ҹ FOIL 㽕㗗
㰥ࡴϔϾᮄব䞣 wDŽ
䖭ᯊˈFOIL ᇚӮ⿏এ㹿䆹ᮄ㾘߭㽚Ⲫⱘ᠔᳝ḋ՟DŽབᵰ䖬᳝㽚Ⲫⱘℷ՟ˈㅫ⊩ᇚᓔ
ྟϟϔϾϔ㠀ࠄ⡍⅞᧰㋶ҹ㦋ᕫᮄⱘ㾘߭DŽ
㽕↣ϔℹЁҢ䗝᭛ᄫЁ䗝ᢽ᳔᳝Ꮰᳯⱘ᭛ᄫˈFOIL 䆁㒗᭄Ϟ⌟䞣㾘߭ⱘᗻ㛑DŽ
ℸ䖛Ёˈᅗ㗗㰥ᔧࠡ㾘߭Ё↣Ͼব䞣ⱘৃ㛑ⱘ㑺ᴳDŽЎ䇈ᯢ䖭ϔ䖛ˈݡ㗗㰥ᄺдⳂ
ᷛ᭛ᄫ GrandDaughterxyⱘ㾘߭䲚ⱘ՟ᄤDŽ؛ᅮ䆁㒗᭄ࣙϟ߫ⱘㅔऩⱘᮁ㿔䲚ড়ˈ
݊ЁՓ⫼㑺ᅮⱘ Pxyৃ㹿䇏Āx ⱘ P ᰃ yāDŽ
ᇍ䖭Ͼᇕ䯁ⱘϪ⬠䖬㽕ϔ؛ᅮˈेӏԩ⍝ঞࠄ䇧䆡 GrandDaughterFatherFemale
ঞᐌ䞣 VictorˈSharonˈBob Tom ⱘ᭛ᄫˈ㢹ᅗӀ≵᳝Ϟ䴶߫ߎˈ߭㹿؛ᅮЎ False˄བˈ
៥Ӏৃҹ䱤ഄᮁ㿔GrandDaughterTomBobˈGrandDaughterVictorVictorㄝ˅DŽ
Ў䗝ᢽᔧࠡ㾘߭ⱘ᳔Շ⡍࣪ᓣˈFOIL 㗗㰥㾘߭ব䞣㑺ᴳࠄ䆁㒗ḋ՟Ёᐌ䞣ⱘ↣⾡ϡ
ৠⱘᮍᓣDŽ՟བˈ߱ྟℹ㾘߭Ў˖
GrandDanghterxyĕ
↣ϔ䰊↉ˈ㾘߭ⱘ䆘ԄѢ䖭ѯℷ՟ড՟ব䞣㑺ᴳˈ㗠៥ӀؒѢ䗝ᢽⱘᰃᢹ᳝䕗
ℷ՟㑺ᴳ㗠䕗ᇥড՟㑺ᴳⱘ㾘߭DŽᔧᮄ᭛ᄫࡴܹࠄ㾘߭Ёˈ㑺ᴳⱘ䲚ড়ᇚᬍবDŽ⊼ᛣᔧϔ
᭛ᄫࡴܹৢˈᅗᓩܹњϔϾᮄব䞣ˈ䙷М㾘߭ⱘ㑺ᴳ䭓ᑺᇚ䭓DŽ՟བˈ㢹Fatheryzࡴ
ܹࠄϞ䗄㾘߭ˈ䙷М߱ྟⱘ㑺ᴳ^xVictorySharon`ᇚবЎ䭓ⱘ^xVictorySharon
zBob`DŽ䖬㽕⊼ᛣབᵰᮄব䞣ৃ㑺ᴳࠄϾϡৠⱘᐌ䞣ˈ䙷МϢᠽሩৢ㾘߭Ⳍऍ䜡ⱘ㑺ᴳⱘ
᭄ⳂᇚѢϢॳྟ㾘߭ऍ䜡ⱘ᭄ⳂDŽ
FOIL Փ⫼䆘Ԅߑ᭄ҹԄ䅵ࡴᮄ᭛ᄫⱘᬜ⫼ˈᅗѢࡴܹᮄ᭛ᄫࠡৢⱘℷ՟ড՟㑺
ᴳ᭄ⳂDŽ㊒⹂ഄ䆆ˈ㗗㰥ᶤ㾘߭ RˈϔϾৃ㛑㹿ࡴࠄ R ⱘ㾘߭ԧⱘ䗝᭛ᄫ LDŽҸ R嘔
Ўࡴܹ᭛ᄫ L ࠄ㾘߭ R ৢ⫳៤ⱘ㾘߭DŽFoilBGainLRⱘؐᅮНЎ˖
§ p1 p0 ·
Foil _ Gain( L, R) { t ¨¨ log 2 log 2 ¸¸ ˄˅
© p1 n1 p 0 n0 ¹
݊ЁpЎ㾘߭Rⱘℷ՟㑺ᴳ᭄ⳂˈnЎRⱘড՟㑺ᴳ᭄Ⳃˈpᰃ㾘߭R嘔ⱘℷ՟㑺ᴳ᭄ˈnЎ
㾘߭R嘔ⱘড՟㑺ᴳ᭄ⳂDŽ᳔ৢˈtᰃࡴܹ᭛ᄫLࠄRৢҡᮻ㛑㽚Ⲫⱘ㾘߭Rⱘℷ՟㑺ᴳ᭄DŽ
ᔧࡴܹLᓩܹњϔϾᮄব䞣ࠄRЁᯊˈা㽕R嘔ⱘ㑺ᴳЁⱘᶤѯ㑺ᴳᠽሩњॳྟⱘ㑺ᴳˈᅗ
Ӏҡ✊㛑㹿㽚ⲪDŽ
p0
䆹 FoilBGain ߑ᭄ৃҹ⫼ֵᙃ䆎ᴹㅔऩഄ㾷䞞DŽᣝ✻ֵᙃ䆎ⱘ⧚䆎ˈ log 2 ᰃ
p 0 n0
p1
Ўњᇍ㾘߭ R 㛑㽚Ⲫⱘӏᛣℷ՟㑺ᴳ㓪ⷕ᠔䳔ⱘ᳔ᇣԡ᭄DŽⳌԐⱘˈ log 2 ᰃᇍ㾘
p1 n1
߭ R嘔㛑㽚Ⲫⱘӏᛣℷ՟㑺ᴳ㓪ⷕⱘ᳔ᇣԡ᭄DŽ⬅Ѣ t ᰃ R 㛑㽚Ⲫⱘℷ՟㑺ᴳЁҡֱ⬭ R嘔
Ёⱘ㑺ᴳˈFoilBGainLRৃ㹿ⳟ˖Ўњ㓪ⷕ R ⱘ᠔᳝ℷ՟㑺ᴳⱘߚ㉏᠔䳔ⱘܼ䚼ԡ᭄⬅
Ѣ L ᏺᴹⱘޣᇥDŽ
10.5.3 ᆜҖ䙈ᖈ㿺ࡏ䳼
Ϟ䴶ⱘ䅼䆎Ёˈ៥Ӏᗑ⬹њࡴܹࠄ㾘߭ԧЁⱘᄤহЎⳂᷛ䇧䆡ᴀ䑿˄े㾘߭༈Ёߎ
⦄ⱘ䇧䆡˅ⱘৃ㛑ᗻDŽ✊㗠ˈབᵰ Predicates ⱘ䕧ܹ߫㸼ЁࣙⳂᷛ䇧䆡ˈFOIL ⫳៤
䗝᭛ᄫᯊᖙ乏㗗㰥ᅗDŽ䖭ܕ䆌ᅗѻ⫳䗦ᔦⱘ㾘߭üüे㾘߭༈㾘߭ԧЁՓ⫼Ⳍৠ䇧䆡
ⱘ㾘߭DŽ՟བˈಲᖚ Ancestor ݇㋏ⱘ䗦ᔦᅮНDŽ⬅ϟ䴶ⱘ㾘߭䲚㸼⼎˖
10.5.4 FOIL ቅ㔉
䆁㒗᭄᮴ాໄⱘᚙމϟˈFOIL ৃᣕ㓁ഄࡴᮄ᭛ᄫࠄ㾘߭ЁˈⳈࠄᅗϡ㽚Ⲫӏԩ
ড՟DŽЎ໘⧚᳝ాໄ᭄ˈ᧰㋶ⱘ㒜ℶ䳔㽕㾘߭㊒ᑺǃ㽚ⲪᑺᴖᗻП䯈ߎᡬЁDŽ
FOIL Փ⫼᳔ᇣᦣ䗄䭓ᑺⱘᮍ⊩ᴹՓ㾘߭䭓㒜ℶˈᮄⱘ᭛ᄫাᅗӀⱘᦣ䗄䭓ᑺⷁѢᅗӀ
᠔㾷䞞ⱘ᭄ⱘᦣ䗄䭓ᑺᯊᠡ㹿ࡴܹDŽ䆹ㄪ⬹ⱘ㒚㡖⬅ Quinlan˄˅㒭ߎDŽDŽFOIL
ᇍ↣Ͼᄺࠄⱘ㾘߭䖯㸠ৢׂ࠾ˈՓ⫼ ゴއㄪᷥЁⳌৠⱘ㾘߭ৢׂ࠾ㄪ⬹DŽ
10.6 ֒Ѱ䘼╊㔄Ⲻᖈ㓩
ᔦ㒇䘏䕥㓪᳝ϔ⾡ᅠܼϡৠⱘ䗨ᕘˈᅗѢϔϾㅔऩⱘџᅲ˖ेᔦ㒇ᰃⓨ㒢ⱘ䗚䖛
DŽϔ㠀ᴹ䇈ˈᴎ఼ᄺд⍝ঞⱘᰃབԩᓎゟ㛑㾷䞞㾖ᆳ᭄ⱘ⧚䆎DŽ㒭ᅮᶤѯ᭄Dϔѯ
ϡᅠᭈⱘ㚠᱃ⶹ䆚Bˈᄺд䖛ৃ㹿ᦣ䗄Ў⫳៤ϔϾ؛䆒hˈᅗϢBϔ䍋㾷䞞њDDŽ㊒⹂ഄ
䆆ˈ؛ᅮབ䗮ᐌ䙷ḋ䆁㒗᭄DЎ䆁㒗ḋ՟ⱘ䲚ড়ˈ↣Ͼḋ՟ᔶᓣЎLJxifxiLjDŽ䖭䞠xiҷ
㸼iϾ䆁㒗ᅲ՟ˈ㗠fxiҷ㸼ᅗⱘⳂᷛؐDŽ䙷Мᄺд䖛ህᰃЎњথ⦄ϔϾ؛䆒hˈՓ↣Ͼ
䆁㒗ᅲ՟xiⱘߚ㉏fxiᰃҢ؛䆒hǃxiⱘᦣ䗄ǃঞ㋏㒳ⶹ䘧ⱘӏᛣ㚠᱃ⶹ䆚BЁⓨ㒢⌒⫳DŽ
㸼䖒ᓣXƅY䇏ĀYҢXЁⓨ㒢⌒⫳ā
ˈ㗙ЎĀX⎉㭈˄entail˅YāDŽ㸼䖒ᓣ ᦣ䗄
њᄺдࠄⱘ؛䆒hᖙ乏⒵䎇ⱘ㑺ᴳˈेᇍ↣Ͼ䆁㒗ᅲ՟xiˈⳂᷛߚ㉏fxiᖙ乏ҢBǃhxiЁⓨ
㒢⌒⫳DŽ
ᓣ ⱘᛣНѢᅗᡞᄺд䯂乬㕂Ѣⓨ㒢⧚ᔶᓣ䘏䕥ⱘḚᶊПϟDŽᇍѢੑ乬䘏䕥
ϔ䰊䘏䕥ˈ᳝ϔѯᏆ⧚㾷ᕫᕜདⱘㅫ⊩ৃ㞾ࡼⓨ㒢DŽ᳝䍷ⱘᰃˈ᳝ৃ㛑߽⫼ⓨ㒢⧚ⱘ䗚
䖛ˈҹՓᔦ㒇⊯࣪ⱘ䖛㞾ࡼ࣪DŽᇍĀᔦ㒇ৃ⬅ড䕀ⱘⓨ㒢ᅲ⦄ā䖭ϔ㾖⚍ⱘ⋲ᙝ佪ߎܜ
⦄Ѣ Ϫ㑾ⱘ㒣⌢ᄺᆊ WSJevonsˈҪ˖ࠄݭ
ᔦ㒇ᅲ䰙Ϟᰃⓨ㒢ⱘ䗚᪡ˈ㗠Ϩϡ㛑ᛇ䈵≵᳝݊ЁϔϾᯊˈϔϾӮᄬDŽℸϡӮ᳝ાϔ
Ͼ䞡㽕ⱘ䯂乬DŽ䇕Ӯ䯂ࡴ⊩⊩ޣЁાϔϾᰃ↨䕗䞡㽕ⱘ᭄ᄺ᪡ਸ਼˛Ԛৠᯊˈϔ᪡ᅗⱘ䗚
᪡П䯈ˈ݊䲒ᑺ᳝ᕜⱘᏂᓖ˗ĂĂᖙ乏ᡓ䅸ˈᔦ㒇ߚᵤ䲒ᑺᴖᑺᮍ䴶䛑䖰䖰Ѣӏԩⓨ㒢
䯂乬DŽ˄Jevons 1874˅
ᴀゴⱘ࠽ԭ䚼ߚᇚお䖭⾡ᡞᔦ㒇ⳟ៤䗚ⓨ㒢ⱘ㾖⚍DŽ៥Ӏ䖭䞠᠔ᛳ݈䍷ⱘᰃϔ㠀䯂
乬ᰃ䆒䅵ϔϾ䗚⎉㭈ㅫᄤinverseentailmentoperatorDŽϔϾ䗚⎉㭈ㅫᄤOBDՓ⫼䆁㒗
᭄D ^xifxi!`㚠᱃ⶹ䆚BЎ䕧ܹˈᑊϨ䕧ߎϔ؛䆒h⒵䎇ᓣ DŽ
ৠᯊˈᣝ✻䖭⾡݀ᓣⱘᔦ㒇䘏䕥㓪䘛ࠄњ⾡ᅲ䏉Ϟⱘೄ䲒DŽ
ϟϔ㡖ˈ៥Ӏ㗗ᶹњϔϾᕜ᱂䘡ⱘ䗚⎉㭈ㅫᄤˈᅗ䗮䖛ড䕀ⱘⓨ㒢⧚㾘߭ᴹᵘ䗴؛
䆒DŽ
10.7 䘼ᖈ㔉
㞾ࡼⓨ㒢ⱘϔ㠀ᮍ⊩ᰃ⫼ Robinson˄˅ᦤߎⱘᔦ㒧㾘߭˄resolutionrule˅DŽᔦ㒧㾘
߭ᰃϔ䰊䘏䕥ЁϔϾড়⧚Ϩᅠⱘⓨ㒢⧚㾘߭DŽℸˈৃҹᛇࠄ䖭ḋⱘ䯂乬˖ᰃ৺ৃҹ䗮
䖛ড䕀ᔦ㒧㾘߭ᴹᔶ៤䗚⎉㭈ㅫᄤDŽಲㄨᰃ㚃ᅮⱘˈ㗠Ϩℷᰃ䖭Ͼㅫᄤᔶ៤њ Cigol ᑣⱘ
⸔DŽ˄Muggleton Buntine˅DŽ
ҟ㒡ᔦ㒧㾘᳔߭ᆍᯧⱘᮍ⊩ᰃҹੑ乬㸼⼎ⱘᔶᓣˈᅗৃҹ㹿ᠽሩࠄϔ䰊㸼⼎ЁDŽҸ L
ЎӏᛣϔϾੑ乬᭛ᄫˈᑊҸ P R Ўӏᛣੑ乬ᄤহDŽᔦ㒧㾘߭Ў˖
P Ģ L
L Ģ R
P Ģ R
ᅗৃ⧚㾷Ў˖㒭ᅮ㒓ϞⱘϸϾᄤহˈᕫࠄ㒓ϟⱘᄤহDŽⳈ㾝Ϟᔦ㒧㾘߭ᰃ⧚᠔ᔧ✊ⱘDŽ
㒭ᅮϸϾᮁ㿔 PĢL LĢRˈᰒ✊ L L Ёᖙ᳝ϔϾЎ؛DŽℸˈP R Ёᖙ᳝ϔϾЎ
ⳳDŽℸ㒧䆎 PĢR 㚃ᅮᰃ⒵䎇ⱘDŽ
㸼 10-5 ᔦ㒧ㅫᄤ˄ੑ乬ᔶᓣ˅
DŽ
㒭ᅮᄤহC1C2DŽᔦ㒧ㅫᄤᵘ䗴ߎϔᄤহCՓC1ġC2ƅCDŽ
1. 㒭ᅮ߱ྟᄤহC1C2ˈҢᄤহC1ЁᇏᡒϔϾ᭛ᄫLˈᑊϨLߎ⦄C2ЁDŽ
2. 䗮䖛ড়ᑊC1C2Ёⱘ䰸њLLⱘ᠔᳝᭛ᄫˈᔶ៤ᔦ㒧ᓣCDŽ㊒⹂ഄˈߎ⦄㒧ᵰCЁⱘ᭛ᄫ䲚ড়
Ў˖
插图——原书页码:295
10-2 ᔦ㒧䗚ᔦ㒧ⱘ՟ᄤ
Ꮊ䖍Ўᑨ⫼ᔦ㒧㾘߭˄ⓨ㒢ⱘ˅Ң㒭ᅮᄤহC1C2Ё⧚ߎᄤহCDŽে䖍Ў݊䗚䖛ⱘᑨ⫼˄ᔦ
㒇ⱘ˅ˈҢCC1Ё䆎ߎC2DŽ
⊼ᛣϞ՟ЁC᳝ϔ⾡ৃ㛑ⱘ㾷DŽ⹂ߛഄ䆆ˈCৃҹᰃ⡍⅞ⱘᄤহAĢDĢBDŽℸ
㾷ϢϔϾ㾷ⱘϡৠѢCЁࣙњϔϾCЁߎ⦄ⱘ᭛ᄫDŽҢЁৃᕫࠄⱘϔ㠀䆎⚍Ѣˈ䗚
ᔦ㒧ᰃϡ⹂ᅮⱘˈेৃ㛑᳝ϾᄤহCՓCCѻ⫳ᔦ㒧ᓣCDŽ݊Ё䖯㸠䗝ᢽⱘϔϾਃথ
ᓣᮍ⊩ЎأདⷁⱘᄤহˈㄝӋഄˈ؛ᅮCϢC≵᳝݅ৠⱘ᭛ᄫDŽབᵰᓩܹ䖭⾡ᇍⷁᄤহ
ⱘأདˈᇍ䗚ᔦ㒧䖛ⱘϔ㠀ᦣ䗄㾕㸼 DŽ
㸼 10-6 䗚ᔦ㒧ㅫᄤ˄ੑ乬ᔶᓣ˅
DŽ
㒭ᅮϸᄤহCC1ˈᅗ䅵ㅫߎC2ՓCġCƅCDŽ
1. 㒭ᅮ߱ྟᄤহC1CˈᇏᡒϔϾ᭛ᄫLˈᅗߎ⦄ᄤহC1ЁԚϡߎ⦄CЁDŽ
2. 䗮䖛ࣙϟ߫ⱘ᭛ᄫˈᔶ៤ѠϾᄤহC2˖
៥ӀৃҹѢབ䗚ᔦ㒧䖭ḋⱘ䗚⎉㭈ㅫᄤᓔথߎ㾘߭ᄺдㅫ⊩ᴹDŽ⹂ߛഄ䆆ˈᄺдㅫ⊩
ৃՓ⫼䗚⎉㭈ᴹᵘ䗴ߎ؛䆒ˈℸ؛䆒Ϣ㚠᱃ⶹ䆚ϔ䍋⎉㭈䆁㒗᭄DŽϔ⾡ㄪ⬹ᰃՓ⫼ᑣ߫㽚
Ⲫㅫ⊩ˈᕾ⦃ഄҹ䖭⾡ᮍ⊩ᄺдHornᄤহ䲚DŽ↣ᕾ⦃Ёˈㅫ⊩䗝ᢽ≵᳝㹿ҹࠡᄺдࠄ
ⱘᄤহ㽚ⲪⱘϔϾ䆁㒗ḋ՟xifxi!DŽ✊ৢᑨ⫼ᔦ㒧㾘߭ᴹ⫳៤⒵䎇 ( B h xi ) ƅfxi
ⱘ䗝؛䆒hiˈ݊ЁBЎ㚠᱃ⶹ䆚ࡴϞҹࠡᕾ⦃ЁᄺࠄⱘӏᛣᄤহDŽ⊼ᛣ䖭ᰃϔϾḋ՟偅ࡼ
ⱘ᧰㋶ˈЎ↣Ͼ䗝؛䆒ⱘᓎゟᰃЎњ㽚Ⲫϔ⡍ᅮḋ՟DŽᔧ✊བᵰᄬϾ䗝؛䆒ˈ䙷
М݊Ё䗝ᢽⱘㄪ⬹ᰃ䗝প݊Ҫḋ՟Ϟг᳔᳝催㊒ᑺⱘ؛䆒DŽCigolᑣՓ⫼њ㒧ড়䖭⾡
ᑣ߫㽚Ⲫㅫ⊩ⱘ䗚ᔦ㒧ˈҹℸϢ⫼᠋䖯㸠ѸѦҹ㦋ᕫ䆁㒗ḋ՟ᑊᓩᇐ݊ৃ㛑ⱘᔦ㒇⧚ℹ
ⱘᎼぎ䯈Ёⱘ᧰㋶DŽ✊㗠CigolՓ⫼њϔ䰊㸼⼎㗠ϡᰃੑ乬㸼⼎DŽϟ䴶៥Ӏᦣ䗄Ў໘⧚ϔ
䰊㸼⼎᠔䳔ᇍᔦ㒇㾘߭ⱘᠽሩDŽ
10.7.1 ж䱬ᖈ㔉
ᔦ㒧㾘߭ৃҹᕜᆍᯧഄᠽሩࠄϔ䰊㸼⼎ЁDŽབੑ乬䘏䕥Ёϔḋˈᅗ䳔㽕䕧ܹϸϾᄤহˈ
䕧ߎϝϾᄤহDŽᅗϢੑ乬ᔦ㒧ⱘ݇䬂ϡৠѢˈ䖭ϔ䖛བҞ㽕Ѣড়ϔ˄unifying˅㕂
ᤶ᪡DŽ
བᵰL© L©ˈ߭⿄©Ўϸ᭛ᄫLLⱘড়ϔ㕂ᤶ˄unifyingsubstitution˅DŽ՟བˈ㢹
L FatherxyˈL FatherBillzˈϨ© ^xBillzy`ˈ䙷М©ᰃLLⱘড়ϔ㕂ᤶˈ
ЎL© L© FatherBillyDŽড়ϔ㕂ᤶⱘᛣНᰃ˖ᔦ㒧ⱘੑ乬ᔶᓣЁˈϸᄤহCCⱘ
ᔦ㒧ᓣⱘ㦋ᕫᰃ䗮䖛⹂ᅮϔCЁⱘᄤহLᑊϨLCЁDŽϔ䰊ᔦ㒧ЁˈᅗᑓЎҢᄤহ
CЁᇏᡒϔ᭛ᄫLCЁᇏᡒ᭛ᄫLˈՓᕫৃᡒࠄᇍѢLLⱘᶤড়ϔ㕂ᤶ©˄ेˈՓL
© L©˅DŽᔦ㒧㾘߭✊ৢᣝϟ䴶ⱘㄝᓣᓎゟᔦ㒧ᓣC˖
㸼 10-7 ᔦ㒧㾘߭˄ϔ䰊ᔶᓣ˅
1. ᇏᡒC1Ёⱘ᭛ᄫL1ˈC2Ёⱘ᭛ᄫL2ˈҹঞ㕂ᤶ©ˈՓᕫL© L©DŽ
2. 䗮䖛ࣙC1©C©Ё䰸њL©L©ҹⱘ᭛ᄫˈᔶ៤ᔦ㒧ᓣCDŽ㊒⹂ഄ䆆ˈߎ⦄㒧䆎CЁⱘ
᭛ᄫ䲚ড়Ў˖
10.7.2 䘼ᖈ㔉φж䱬߫
䆄ԣ䖭䞠ⱘޣোĀāҷ㸼䲚ড়ᏂDŽ⦄བᵰ䰤ࠊ䗚ᔦ㒧ㅫᄤЎ⧚ߎⱘCЁ≵᳝ϢC݅
ৠⱘ᭛ᄫ˄㸼⼎أད᳔ⷁⱘCᄤহ˅
ˈ䙷МৃᇚϞᓣݭЎ˖
1
᳔ৢৃՓ⫼ᔦ㒧㾘߭ⱘᅮН L2 L1T 1T 2 ˈ㾷ߎCᴹᕫࠄ
䗚ᔦ㒧˖
1 1
C2 (C (C1 {L1 })T 1 )T 2 {L1T 1T 2 } ˄˅
ᓣ 㒭ߎњϔ䰊䘏䕥ⱘ䗚ᔦ㒧㾘߭DŽབੑ乬ᔶᓣЁˈℸ䗚⎉㭈ㅫᄤᰃ䴲⹂ᅮᗻⱘDŽ
⹂ߛഄ䆆ˈᑨ⫼ᅗⱘ䖛Ёˈϔ㠀ৃᡒࠄᕙᔦ㒧ⱘᄤহC㕂ᤶ©©ⱘ⾡䗝ᢽDŽ↣
ϔ㒘䗝ᢽ䛑ѻ⫳ϔϾϡৠⱘC㾷DŽ
⼎њℸ䗚ᔦ㒧㾘߭ᑨ⫼ϔㅔऩ՟ᄤϞⱘϾℹ偸DŽЁˈ៥ӀᏠᳯḍ
㒭 ᅮ ⱘ 䆁 㒗 ᭄ D GrandChild Bob Shannon 㚠 ᱃ ֵ ᙃ B ^FatherShannon Tom
FatherTomBob`ˈᄺдࠄⳂᷛ䇧䆡GrandChildyxⱘ㾘߭DŽ㗗㰥 Ё䗚ᔦ㒧ᷥⱘ
᳔ϟ䴶ϔℹDŽ䖭䞠ˈ៥Ӏ䆒㕂㒧䆎CЎ䆁㒗ḋ՟GrandChildBobShannonˈᑊϨҢ㚠᱃
ֵᙃЁ䗝ᢽᄤহC FatherShannonTomDŽЎᑨ⫼䗚ᔦ㒧ㅫᄤˈᇍѢ᭛ᄫLা᳝ϔ⾡䗝ᢽˈ
⿄ЎFatherShannonTomDŽ؛ᅮ៥Ӏ䗝ᢽ䗚㕂ᤶ© ^`Ϩ© ^Shannonx`DŽℸᚙމϟˈ
1 1
ᕫࠄⱘᄤহC Ўᄤহ (C (C1 {L1 })T 1 )T 2 (CT 1 )T 2 GrandChild ( Bob, x) ᄤহ
1
{L1T 1T 2 } Father ( x, Tom) ⱘ 㘨 ড় DŽ ℸ 㒧 ᵰ Ў ᄤ হ GrandChild ( Bob, x )
Father(x,Tom)ˈㄝӋⱘᄤহ GrandChild ( Bob, x) m Father ( x, Tom ) DŽ⊼ᛣ䖭Ͼϔ㠀㾘
߭ϢCϔ䍋⎉㭈њ䆁㒗ḋ՟GrandChildBobShanonDŽ
插图——原书页码:298
10-3 ϔϾℹ䗚ᔦ㒧
݊ЁᏺᮍḚⱘᄤহЎ⧚ℹⱘ㒧ᵰDŽ↣ϔℹˈCᰃԡѢᑩ䚼ⱘᄤহˈC1 ᰃᎺ䖍ⱘᄤহˈC2
ᰃে䖍ᏺᮍḚⱘᄤহDŽ䖭ϸϾ⧚ℹЁˈ©䛑ᰃぎ㕂ᤶˈ㗠©㕂ᤶᰒ⼎C ϟᮍDŽ⊼ᛣ᳔㒜
ⱘ㒧䆎˄᳔েϞ㾦ⱘᏺᮍḚᄤহ˅ᰃHornᄤহGrandChildyx mFatherxzFatherzyⱘ
ϔ⾡ᔶᓣDŽ
10.7.3 䘼ᖈ㔉ቅ㔉
ὖᣀഄ䆆ˈ䗚ᔦ㒧ᦤկњϔ⾡ϔ㠀ⱘ䗨ᕘҹ㞾ࡼѻ⫳⒵䎇㑺ᴳ ( B h xi ) ƅfxiⱘ
؛䆒hDŽ䖭ᰃ䗮䖛䗚䕀ᓣ 㒭ߎⱘᔦ㒧㾘߭ᕫࠄⱘDŽҢℸᔦ㒧㾘߭Ё㾷ߎᄤহCˈᓣ
Ёⱘ䗚ᔦ㒧㾘߭ⱘᕜᆍᯧᇐߎDŽ
㒭ᅮϔ㒘ᓔྟᄤহˈৃ䗮䖛䞡ᑨ⫼ℸ䗚ᔦ㒧㾘߭⫳៤Ͼ؛䆒DŽ⊼ᛣ䗚ᔦ㒧㾘᳝߭
ϔ Ӭ ⚍ ˈ ᅗ া ⫳ ៤ ⒵ 䎇 ( B h xi ) ƅ fxi ⱘ ؛䆒 DŽ Ⳍ ড ˈ FOIL ⱘ ⫳ ៤ ⌟ ݡ䆩
˄generate-and-test˅᧰㋶↣ϔ᧰㋶ℹ⫳៤Ͼ؛䆒ˈࣙᣀϔѯϡ⒵䎇ℸ㑺ᴳⱘDŽ✊ৢFOIL
䗮䖛㗗㰥᭄Dᴹ䖭ѯ؛䆒Ёߎ䗝ᢽDŽ⬅Ѣ䖭ϔᏂᓖˈ៥ӀৃᳳᳯѢ䗚ᔦ㒧ⱘ᧰㋶
᳝䩜ᇍᗻϨ᳝ᬜDŽ✊㗠ᅲ䰙ᖙབℸDŽϔϾॳᰃ䗚ᔦ㒧ㅫᄤӏᛣϔℹ⫳៤ᅗⱘ؛䆒ᯊˈ
া㛑㗗㰥ৃ⫼᭄Ёⱘϔᇣ䚼ߚDŽ㗠FOIL㗗㰥᠔᳝ⱘৃ⫼᭄ˈ݊ᣝ䇁⊩⫳៤ⱘ؛䆒Ё
䖯㸠䗝ᢽDŽՓ⫼䗚⎉㭈Փ⫼⫳៤⌟ݡ䆩ϸ⾡᧰㋶ㄪ⬹ⱘᏂ߿ҡᰃϔϾⷨおЏ乬DŽSrinivasan
ㄝ˄˅ᦤկњᇍ䖭ϸ⾡ᮍ⊩ⱘᅲ偠ᗻ↨䕗DŽ
10.7.4 ⌑ौȽऻᇯૂ⏫㮪
ࠡϔ㡖ᣛߎњᔦ㒇䗚⎉㭈П䯈ⱘ㘨㋏DŽ⬅Ѣҹࠡⴔ䞡Ѣ䆆䗄؛䆒᧰㋶Ёⱘϔ㠀ࠄ⡍
⅞ᑣˈ䙷М᳝ᖙ㽕ⷨお moregeneralthan ݇㋏䗚⎉㭈П䯈ⱘ㘨㋏DŽЎ䇈ᯢℸˈ㗗㰥བϟ
ⱘᅮН˖
x more-general-thanDŽ 2 ゴЁⱘmore-general-than-or-equal-to݇㋏˄ıg˅ᅮНЎ˖
㒭ᅮϸᏗᇨؐߑ᭄hj(x)hk(x)ˈ៥Ӏ⿄hjıg hkᔧϨҙᔧ (x)hk ( x) o h j ( x) DŽℸ
ıg݇㋏㹿⫼Ѣ䆌ᄺдㅫ⊩Ёҹᓩᇐ؛䆒ぎ䯈ⱘ᧰㋶DŽ
x ©-ࣙᆍ˄©-subsumption˅DŽ㗗㰥ϸϾᄤহCjCkˈᅗӀⱘᔶᓣ䛑ᰃHĢL1Ģ…Lnˈ
݊ЁHЎϔℷ᭛ᄫˈ㗠LiЎӏᛣ᭛ᄫDŽ⿄ᄤহCj©-ࣙᆍᄤহCkˈᔧϨҙᔧᄬϔ
Ͼ㕂ᤶՓ C jT C k˄䖭䞠៥ӀᇚӏᛣᄤহCᦣ䗄Ў݊ᵤপᓣЁ᭛ᄫⱘ䲚ড়˅DŽ
䆹ᅮН㾕Plotkin˄1970˅DŽ
x ⎉㭈˄entailment˅㗗㰥ϸᄤহCjCkDŽᄤহCj㹿⿄Ў⎉㭈ᄤহCk˄ݭCjƅCk˅
ᔧϨҙᔧCkҢCjЁⓨ㒢⌒⫳DŽ
䖭ϝϾᅮНП䯈᳝ҔМݙ㘨㋏˛佪ˈܜᇚıgⱘᅮН䞡ᮄ㸼⼎Ўϔ䰊ᔶᓣˈབϸϾ
ᅮНϔḋDŽབᵰᇍᶤⳂᷛὖᗉcx㗗㰥ϔᏗᇨؐ؛䆒hxˈ݊Ёhx㸼⼎Ў᭛ᄫⱘড়পˈ䙷
Мৃ䞡ᮄ㸼⼎ℸ؛䆒Ўᄤহ˖
cxĕhx
䖭䞠៥Ӏ䙉ᕾ䗮ᐌⱘProlog㾷䞞ˈेx㢹ϡ㛑㹿䆕ᯢЎℷ՟ᯊˈ߭x㹿ߚ㉏Ўড՟DŽℸˈ
ৃⳟߎࠡ䴶ᅮНⱘıgᑨ⫼ѢHornᄤহⱘࠡӊ˄㾘߭ԧ˅DŽHornᄤহ䱤ⱘৢӊЎⳂᷛὖᗉ
cxDŽ
ıgᅮН©ࣙᆍᅮНП䯈ⱘ݇㋏ᰃҔМ˛⊼ᛣབᵰhıghˈ߭ᄤহCcxĕhx
ᰃ©ࣙᆍᄤহCcxĕhxDŽ䖯ϔℹˈेՓᄤহ᳝ϡৠⱘ༈䚼ᯊˈ©-ࣙᆍгৃ៤ゟDŽ
՟བˈϟ䴶ⱘᚙᔶЁᄤহA©ࣙᆍᄤহB˖
10.7.5 Progol
㱑✊ᇍѢ⫳៤䗝؛䆒ˈ䗚ᔦ㒧ᰃϔ⾡ᕜᓩҎⱘᮍ⊩DŽᅲ䏉Ёᅗᕜᆍᯧᇐ㟈䗝؛
䆒ⱘ㒘ড়⟚⚌DŽϔ⾡䗨ᕘᰃাՓ⫼䗚⎉㭈ᴹ⫳៤ϔϾ᳔⡍⅞؛䆒ˈᅗϢ㚠᱃ֵᙃϔ䍋⎉㭈
㾖ᆳⱘ᭄DŽ✊ৢˈ䖭Ͼ᳔⡍⅞؛䆒ৃ⫼Ѣ⹂ᅮ؛䆒ぎ䯈ⱘϔ㠀ࠄ⡍⅞᧰㋶䖍⬠ˈϢ FOIL
ЁՓ⫼ⱘ᧰㋶ϔḋˈԚ᳝ϔⱘ䰤ࠊ˖া㗗㰥↨ℸ䖍⬠ϔ㠀ⱘ؛䆒DŽ䆹ᮍ⊩㹿⫼Ѣ Progol
㋏㒳ˈᅗⱘㅫ⊩ৃὖ䗄བϟ˖
ˊ⫼᠋ᣛᅮՓ⫼ϔϾফ䰤ⱘϔ䰊㸼⼎䇁㿔Ў؛䆒ぎ䯈ˤDŽ䖭ѯ䰤ࠊ⫼Āᗕໄᯢ˄mode
declaration˅āᴹᦣ䗄ˈᅗܕ䆌⫼᠋ᣛᅮ㽕㗗㰥ⱘ䇧䆡ߑ᭄ヺোˈҹঞᅗӀⱘখ㗗㉏ൟḐ
ᓣDŽ
ˊProgolՓ⫼ᑣ߫㽚Ⲫ⊩ᴹҢˤЁᄺдϔ㒘㽚Ⲫ᭄ⱘ㸼䖒ᓣDŽᇍѢ↣Ͼ䖬≵㹿䖭ѯ
ᄺࠄⱘ㸼䖒ᓣ㽚Ⲫⱘḋ՟xifxi!ˈᅗ佪ܜᇏᡒ ˤ Ё᳔⡍⅞ⱘ؛䆒hi ˈՓ ( B h xi ) ƅ
fxiDŽ㊒⹂ഄ䆆ˈᅗܜᡒࠄ㛑䗮䖛ᑨ⫼kᔦ㒧㾘߭⎉㭈fxiⱘ؛䆒ˈ݊Ё䅵ㅫߎ᳔⡍
⅞ⱘ؛䆒ˈҢ㗠䖥ԐᕫࠄhiDŽ
ˊ✊ৢProgol䖭Ͼ⬅᳔ϔ㠀؛䆒ˎℹЁᕫࠄⱘ⡍⅞䖍⬠hi᠔⬠ᅮⱘ؛䆒ぎ䯈Ёᠻ
㸠њϔ㠀ࠄ⡍⅞᧰㋶DŽℸ؛䆒䲚ড়Ёˈᅗᇏᡒ᳔᳝ᇣᦣ䗄䭓ᑺ˄⬅᭛ᄫⱘ᭄䞣ᑺ䞣˅ⱘ؛
䆒DŽ䆹䚼ߚⱘ᧰㋶ᰃ⬅ڣA 䙷ḋⱘਃথᓣ㾘߭ᓩᇐⱘˈᅗⱘׂ࠾᪡ৃ≵ׂ᳝࠾ᥝ᳔ⷁ؛
䆒ⱘ亢䰽ϟ䖯㸠DŽ
10.8 ቅ㔉ૂ㺛ݻ䈱⢟
ᴀゴⱘ㽕⚍ࣙᣀ˖
x ᑣ߫㽚Ⲫㅫ⊩ᄺдᵤপⱘ㾘߭䲚ˈᮍ⊩ᰃܜᄺдऩϾ㊒⹂ⱘ㾘߭ˈ✊ৢ⿏এ㹿
ℸ㾘߭㽚Ⲫⱘℷ՟ˈݡ࠽ԭḋ՟Ϟ䞡䖭ϔ䖛DŽᅗᦤկњϔϾᄺд㾘߭䲚
ⱘ᳝ᬜⱘ䋾ှㅫ⊩ˈৃЎ⬅乊ϟⱘއㄪᷥᄺдㅫ⊩˄བ ID3˅ⱘ᳓ҷㅫ⊩DŽ
އㄪᷥㅫ⊩ৃ㹿ⳟᑊ㸠㽚ⲪˈϢᑣ߫㽚ⲪⳌᇍᑨDŽ
x ᑣ߫㽚Ⲫㅫ⊩ЁˈᏆⷨおњ⾡ᮍ⊩ҹᄺдऩϾⱘ㾘߭DŽ䖭ѯᮍ⊩ⱘϡৠ
ѢᅗӀ㗗ᶹ㾘߭ࠡӊぎ䯈ⱘㄪ⬹ϡৠDŽϔϾᕜ⌕㸠ⱘǃ CN2 ᑣЁՓ⫼ⱘᮍ
⊩ᰃᠻ㸠ϔ㠀ࠄ⡍⅞ⱘ᷅⢊᧰㋶ˈ⏤䖯ഄ⫳៤ᑊ⌟䆩⡍⅞ⱘ㾘߭ˈⳈࠄᡒࠄ
ϔϾ䎇㊒⹂ⱘ㾘߭DŽ݊Ҫⱘᮍ⊩Ң⡍⅞ࠄϔ㠀䖯㸠؛䆒᧰㋶ˈՓ⫼ḋ՟偅ࡼ
㗠ϡᰃ⫳៤ᑊ⌟䆩ˈᑊϨᑨ⫼њϡৠⱘ㒳䅵䞣ᑺⱘ㾘߭㊒ᑺᴹᣛᓩ᧰㋶DŽ
x ϔ䰊㾘߭䲚˄ेࣙব䞣ⱘ㾘߭˅ᦤկњϔ⾡㸼ᕕ㛑ᕜᔎⱘ㸼⼎DŽ՟བˈ㓪
䇁㿔 Prolog Փ⫼ϔ䰊 Horn ᄤহᑣ߫ᴹ㸼⼎ϔ㠀ⱘᑣDŽℸˈᄺдϔ䰊 Horn
ᄤহⱘ䯂乬гᐌ㹿⿄Ўᔦ㒇䘏䕥㓪ⱘ䯂乬DŽ
x ᄺдϔ䰊㾘߭䲚ⱘᮍ⊩ᰃᇚ CN2 Ёⱘᑣ߫㽚Ⲫㅫ⊩⬅ੑ乬ᔶᓣᠽሩࠄϔ䰊㸼
⼎DŽ䆹ᮍ⊩ FOIL ᑣЁ՟⼎ˈᅗৃᄺдࣙᣀㅔऩ䗦ᔦ㾘߭䲚ⱘݙϔ䰊㾘߭
䲚DŽ
x ᄺдϔ䰊㾘߭ⱘϔᮍ⊩ѢϔϾথ⦄˖ेᔦ㒇ᰃⓨ㒢ⱘ䗚䕀DŽᤶ㿔Пˈᔦ㒇
ⱘ䯂乬ᰃᇏᡒϔϾ؛䆒 h ⒵䎇ϟ䴶ⱘ㑺ᴳDŽ
(¢ xi , f ( xi )² D)( B h xi ) ƅfxi
݊ЁBᰃϔ㠀㚠᱃ֵᙃˈx1…xnᰃ䆁㒗᭄DЁᅲ՟ⱘᦣ䗄ˈ㗠f(x1)…f(xn)Ў䆁㒗
ᅲ՟ⱘⳂᷛؐDŽ
x ϔѯᑣ䙉ᕾњᔦ㒇ᰃⓨ㒢ⱘ䗚䕀ⱘ㾖⚍ˈ䗮䖛䖤⫼❳ⶹⱘⓨ㒢⧚ⱘ䗚᪡
ᴹ᧰㋶؛䆒DŽ՟བ Cigol Փ⫼ⱘ䗚ᔦ㒧ᰃᔦ㒧ㅫᄤⱘ䗚䕀ˈ㗠ᔦ㒧ᰃ᱂䘡⫼Ѣᴎ
఼ᅮ⧚䆕ᯢⱘϔ⾡⧚㾘߭DŽProgol 㒧ড়њ䗚⎉㭈ㄪ⬹ϔ㠀ࠄ⡍⅞ㄪ⬹ᴹ᧰
㋶؛䆒ぎ䯈DŽ
ᄺд݇㋏ᦣ䗄ⱘᮽᳳᎹࣙᣀ Winston˄˅ⱘ㨫ৡⱘᑣˈᅗᄺдབĀarchā䖭ḋ
ⱘὖᗉⱘ㔥㒰ᓣᦣ䗄DŽBanerjiⱘᎹ Michalski ⱘ AQ ㅫ⊩㋏߫Ꮉ˄བ
MichalskiMichalskietal˅ᰃ᳔ᮽᇚ䘏䕥㸼⼎⫼Ѣᄺд䯂乬ⱘⷨおПϔDŽPlotkin
˄˅ⱘ©ࣙᆍᅮН䕗ᮽഄᇍᔦ㒇ⓨ㒢П䯈ⱘ݇㋏䖯㸠њᔶᓣ࣪DŽVere˄˅гⷨ
おњᄺдⱘ䘏䕥㸼⼎䯂乬ˈϨ Buchanan˄˅ⱘ METADENDRAL ᑣৃᄺдࠄ݇㋏ᦣ
䗄ҹ㸼⼎ߚᄤ㒧ᵘЁৃ䋼䈅ҾЁ㹿ߚࡆⱘ䚼ߚDŽ䆹ᑣ៤ࡳഄথ⦄њϔѯ᳝⫼ⱘ㾘߭ˈᅗ
Ӏ࣪ᄺᄺᴃ乚ඳ㹿݀ᏗDŽMitchell˄˅ⱘ䗝⍜䰸বൟぎ䯈ㅫ⊩㹿ᑨ⫼Ѣৠḋⱘ࣪ᄺ
㒧ᵘⱘ݇㋏ᦣ䗄DŽ
Lavrac Dzeroski˄˅ᦤկњᔦ㒇䘏䕥㓪ⱘϔϾৃ䇏ᗻᕜᔎⱘᬭᴤDŽ䖥ᳳ݊Ҫ᳝
⫼ⱘϧ乬㗗᭛䲚ࣙᣀ˄Bergadano Gunetti˗Moriketal˗Muggleton
b˅DŽWrobel˄˅ⱘ㓐䗄ゴгᦤկњ䆹乚ඳⱘϔϾདᴤ᭭DŽBratko Muggleton
ὖ䗄њ ILP ϔѯ䞡㽕䯂乬Ϟⱘ䖥ᳳᑨ⫼DŽϔ㋏߫ⱘ ILP ᮍ䴶ⱘᑈᑺϧ乬䅼䆎Ӯгᦤկњ䖥
ᳳⷨお䆎᭛ⱘᕜདᴹ⑤˄՟བ DeRaedt˅DŽ
д乬
˄a˅⫳៤ᑊ⌟䆩 vs᭄偅ࡼ
˄b˅ϔ㠀ࠄ⡍⅞ vs⡍⅞ࠄϔ㠀
˄c˅ᑣ߫㽚Ⲫ vsᑊ㸠㽚Ⲫ
㗗㰥ᴀゴЁᔦ㒇䯂乬ⱘᅮН˖
⾎㓿㖁㔌઼ߣㆆṁ䘉ṧⲴᆖҐᯩ⌅䴰㾱аᇊᮠⴞⲴ䇝㓳ṧֻˈԕ䗮ࡠаᇊ㓗࡛Ⲵ⌋ॆ㋮
ᓖDŽࡽ䶒ㄐ㢲䇘䇪Ⲵ⨶䇪⭼䲀઼ᇎ傼㔃᷌৽᱐ࠪҶ䘉аһᇎDŽ࠶᷀ᆖҐ֯⭘ݸ傼⸕䇶઼╄㓾᧘
⨶ᶕᢙབྷ䇝㓳ṧֻᨀؑⲴˈഐ↔ᆳнਇ਼ṧⲴ⭼䲀ᡰࡦ㓖DŽᵜㄐ㘳㲁Ҷа〠ѪสҾ䀓䟺
ⲴᆖҐ˄EBL˅Ⲵ࠶᷀ᆖҐᯩ⌅DŽ൘สҾ䀓䟺ⲴᆖҐѝˈݸ傼⸕䇶⭘Ҿ࠶᷀˄ᡆ㘵䀓䟺˅㿲ሏ
ࡠⲴᆖҐṧֻᱟᘾṧ┑䏣ⴞḷᾲᘥⲴDŽ❦ਾ䘉њ䀓䟺㻛⭘Ҿ४࠶䇝㓳ṧֻѝଚӋᱟⲴޣ⢩
ᖱˈଚӋᱟнⲴޣDŽ䘉ṧṧֻቡਟสҾ䙫䗁᧘⨶䘋㹼⌋ॆˈ㘼нᱟสҾ㔏䇑᧘⨶DŽสҾ䀓䟺
ⲴᆖҐᐢ㻛ᡀ࣏ൠ⭘Ҿ൘㿴ࡂ઼䈳ᓖԫ࣑ѝᆖҐᩌ㍒᧗ࡦ㿴ࡉDŽᵜㄐ㘳㲁ᆖҐಘⲴݸ傼⸕
䇶↓⺞ᒦфᆼᮤᰦⲴสҾ䀓䟺ⲴᆖҐDŽлаㄐ㘳㲁ݸ傼⸕䇶ਚᱟ䘁լ↓⺞ᰦˈሶᖂ㓣ᆖҐ઼࠶
᷀ᆖҐ㔃ਸ䎧ᶕDŽ
11.1 ԁ㔃
ࡽ䶒ㄐ㢲ᐢ㘳㲁Ҷᖂ㓣⌅ˈণ䙊䗷⺞ᇊ㜭ཏ㓿傼ൠ४࠶↓઼ֻ৽ֻⲴ⢩ᖱˈᶕӾ㿲ሏ
ࡠⲴ䇝㓳ṧֻѝ⌋ॆDŽߣㆆṁᆖҐǃ⾎㓿㖁㔌ᆖҐǃᖂ㓣䙫䗁㕆〻ǃԕ৺䚇Ր㇇⌅ᱟԕ䘉ᯩ
ᔿⲴᖂ㓣ᆖҐᯩ⌅DŽ䘉Ӌᖂ㓣ᆖҐಘ൘ᇎ䐥ѝⲴањޣ䭞䲀ࡦ൘ҾˈᆳԜ൘ਟ⭘ᮠᦞн䏣
ᰦᙗ㜭䖳ᐞDŽᇎ䱵кˈྲㅜ 7 ㄐᡰ䇘䇪Ⲵˈ⨶䇪࠶᷀ᱮ⽪Ӿ㔉ᇊᮠⴞⲴ䇝㓳ṧֻѝᆖҐ൘㋮ᓖ
кᆈ൘สᵜⲴкл⭼DŽ
ᱟ㜭ᔰਁࠪ䘉ṧⲴᆖҐᯩ⌅ˈᆳԜнਇਟ⭘䇝㓳ᮠᦞⲴᮠ䟿ᡰᑖᶕⲴ䇝㓳㋮ᓖкⲴสᵜ
䲀ࡦᡰࡦ㓖˛ㆄṸᱟ㛟ᇊⲴˈਚ㾱ᡁԜ㜭䟽ᯠ㘳㲁алᆖҐ䰞仈ⲴᖒᡀDŽа࣎⌅ᱟ֯ᆖҐ㇇
⌅㜭᧕ਇᱮᔿⲴݸ傼⸕䇶ˈ࣐к䇝㓳ᮠᦞⲴа਼Ѫ䗃ޕDŽสҾ䀓䟺ⲴᆖҐᱟ䘉ṧⲴаᯩ
⌅DŽᆳ֯⭘ݸ傼⸕䇶ᶕ࠶᷀ᡆ䀓䟺⇿њ䇝㓳ṧֻˈԕ᧘⨶ࠪṧֻⲴଚӋ⢩ᖱоⴞḷ࠭ᮠˈޣ
ଚӋнޣDŽ䘉Ӌ䀓䟺㜭֯ᆖҐಘ∄অ⤜䶐ᮠᦞ䘋㹼⌋ॆᴹᴤ儈Ⲵ㋮ᓖDŽྲࡽаㄐᡰ㿱ࡠⲴ
䛓ṧˈᖂ㓣䙫䗁㌫㔏˄ྲ Cigol˅֯⭘ݸ傼㛼Ჟ⸕䇶ᶕᤷሬᆖҐDŽ❦㘼ᆳԜ֯⭘㛼Ჟ⸕䇶᧘⨶
ࠪⲴ⢩ᖱᢙབྷҶ䗃ޕᇎֻⲴ᧿䘠ˈഐ↔໎࣐Ҷᖵᩌ㍒ٷ䇮オ䰤Ⲵ༽ᵲᓖDŽ৽ˈสҾ䀓䟺Ⲵᆖ
Ґ֯⭘ݸ傼⸕䇶ᶕ߿ሿᖵᩌ㍒ٷ䇮オ䰤Ⲵ༽ᵲᓖˈഐ↔߿ሿҶṧᵜ༽ᵲᓖᒦᨀ儈ҶᆖҐಘⲴ⌋
ॆ㋮ᓖDŽ
Ѫ⨶䀓สҾ䀓䟺ⲴᆖҐⲴⴤ㿲ѹˈ㘳㲁лഭ䱵䊑ỻⲴᆖҐԫ࣑DŽ⺞࠷ൠ䇢ˈٷᇊᡁԜᐼ
ᵋ〻ᒿᆖҐ䇶࡛ỻተս㖞Ⲵ䟽㾱㊫࡛ˈ∄ྲⴞḷᾲᘥĀ唁ỻሶ൘є↕ђਾⲴỻⴈ⣦ᘱāDŽമ
11-1 ᱮ⽪Ҷ↔ⴞḷᾲᘥⲴањ↓ֻDŽᖃ❦ˈᖂ㓣䙫䗁ᯩ⌅ҏ㜭⭘ҾᆖҐ↔ⴞḷᾲᘥDŽ❦㘼ˈ⭡
Ҿỻⴈᖃ༽ᵲ˄ᴹ 32 њᆀˈਟԕ൘ 64 њᯩṬѝ˅ˈ㘼ф↔ᾲᘥᡰ᧿䘠Ⲵ⢩ᇊ⁑ᔿᖃᗞ࿉
˄वਜ਼Ҷỻⴈкн਼ᆀⲴሩս㖞˅ˈᡁԜ䴰㾱ᨀᡀॳкзⲴ㊫լҾമ 11-1 䘉ṧⲴ䇝㓳ṧ
ֻˈ㜭ᵏᵋᖂ㓣ᆖҐࡠⲴٷ䇮㻛↓⺞ൠ⌋ॆDŽ
插图——原书页码:308
മ 11-1 ⴞḷᾲᘥĀ唁ỻ൘є↕ђਾⲴỻⴈ⣦ᘱāⲴањ↓ֻDŽ
⌘ⲭ傜਼ᰦ᭫ࠫ唁⦻઼唁ਾDŽ唁ỻᗵ享〫ࣘަ⦻ˈӾ㘼ⲭỻ㜭ਲ਼ᦹ唁ਾDŽ
ᆖҐлỻԫ࣑Ⲵᴹ䏓ѻ༴൘ҾˈӪ㊫ਚ㾱ቁᮠⲴ䇝㓳ṧֻቡਟᆖҐࡠ䘉ṧⲴⴞḷᾲᘥDŽᇎ
䱵кˈཊᮠӪ൘ⴻҶമ 11-1 䘉ṧањṧֻѻਾቡਟᨀࠪањⴞḷᾲᘥⲴа㡜ٷ䇮ˈྲĀ唁ਾ
઼唁⦻਼ᰦ㻛᭫ࠫⲴᛵߥāˈ㘼нՊᗇࡠ䈨ྲ䘉ṧⲴٷ䇮˄նҏ਼ṧᱟа㠤ٷ䇮˅˖Āഋњⲭ
ޥ䘈൘սⲴỻⴈ⣦ᘱāDŽӪ㊫ᱟᘾṧӾӵӵањṧֻѝᡀ࣏ൠ⌋ॆⲴ˛
എㆄᱟӪ㊫䶎ᑨ䎆ҾԕԆԜޣҾỻᆀਸ⌅〫ࣘⲴݸ傼⸕䇶ᶕ䀓䟺ᡆ࠶᷀䇝㓳ṧֻDŽྲ᷌
䰞ѪӰѸമ 11-1 Ⲵ䇝㓳ṧֻᱟĀ唁ỻ൘є↕ђਾāⲴ↓ֻˈཊᮠӪՊ㔉ࠪ㊫լҾл䶒Ⲵ䀓
䟺˖ĀഐѪⲭ傜਼ᰦ᭫ࠫ唁⦻઼唁ਾˈ唁ᗵ享᩶㝡㻛ሶߋⲴຳ䙷ˈӾ㘼䇙ⲭਲ਼ᦹਾDŽā䈕䀓䟺
Ⲵ䟽㾱ᙗ൘ҾᆳᨀҶᡰ䴰ⲴؑԕӾ䇝㓳ṧֻⲴ㓶㢲ѝਸ⨶⌋ॆࡠ↓⺞Ⲵа㡜ٷ䇮DŽ↔䀓䟺
ѝᨀࡠⲴṧֻ⢩ᖱ˄ྲⲭ傜ǃ唁⦻ǃ唁ਾⲴս㖞˅ᱟоⴞḷᾲᘥˈⲴޣᒦфᓄ䈕㻛वਜ਼൘а
㡜ٷ䇮ѝDŽ৽ˈ䀓䟺ѝ⋑ᴹᨀࡠⲴṧֻ⢩ᖱ˄ྲⲭỻⲴⲴޥ⣦ᘱ˅ਟ㻛䇔ѪᱟнⲴޣ㓶
㢲DŽ
൘↔лỻֻᆀѝˈᆖҐಘѪᔪ・ٷ䇮ˈᆳ䴰㾱Ⲵݸ傼⸕䇶ウㄏᱟӰѸ˛ᖸㆰঅˈᱟлỻ
Ⲵਸ⌅㿴ࡉ˖ণ傜ԕ৺ަԆᆀⲴਸ⌅〫ࣘ˗ሩᔸ㘵ᗵ享Ӕᴯ〫ᆀ˗ԕ৺㾱䎒ỻᗵ享տሩᯩⲴ
⦻DŽ⌘ਚ㔉ᇊ䘉ṧⲴݸ傼⸕䇶ˈ൘ࡉкቡᴹਟ㜭ሩԫỻⴈ⣦ᘱ䇑㇇ࠪᴰՈⲴỻᆀ〫ࣘDŽ
❦㘼ˈᇎ䐥ѝ䘉ṧⲴ䇑㇇ਟ㜭ᶱѪ༽ᵲˈ㘼фণ֯ᡁԜӪ㊫൘ᦼᨑҶ↔ᆼᮤⲴлỻ⸕䇶ˈӽн
㜭䗮ࡠᴰՈⲴሩᔸDŽഐ↔ˈ൘лỻ˄ԕ৺ަԆᩌ㍒ᇶ䳶Ⲵ䰞仈ˈྲ䈳ᓖ઼㿴ࡂ˅䘉ṧⲴӪ㊫ᆖ
Ґѝˈवਜ਼Ҷањᖸ䮯Ⲵਁ⧠ݸ傼⸕䇶Ⲵ䗷〻ˈᆳᱟ⭡ᡁԜ൘лỻᰦ䙷ࡠⲴ⢩ᇊṧֻᡰᕅሬ
ⲴDŽ
ᵜㄐ᧿䘠Ҷ㜭㠚ࣘᔪ・઼ᆖҐ䘉ṧⲴ䀓䟺ⲴᆖҐ㇇⌅DŽᵜㄐⲴ࢙։䜘࠶ሶᴤ㋮⺞ൠᇊѹ࠶
᷀ᆖҐ䰞仈DŽла㢲㔉ࠪҶањ⢩ᇊⲴสҾ䀓䟺ⲴᆖҐ㇇⌅ˈ〠Ѫ Prolog-EBGDŽਾ㔝ࠐ㢲㘳
ḕҶ䘉㇇⌅Ⲵа㡜⢩ᙗˈԕ৺ᆳоࡽ䶒ㄐ㢲ѝ䇘䇪Ⲵᖂ㓣ᆖҐ㇇⌅ѻ䰤Ⲵ㚄㌫DŽᴰਾа㢲᧿
䘠Ҷᓄ⭘สҾ䀓䟺ⲴᆖҐԕᨀ儈བྷ⣦ᘱオ䰤ᩌ㍒Ⲵᙗ㜭DŽᵜㄐᡁԜ㘳㲁Ҷа⢩↺ᛵߥˈণ⭏
ᡀ䀓䟺ᡰสҾⲴݸ傼⸕䇶ᱟᆼྲˈⲴ⺞↓ޘ൘лỻֻᆀѝӪ㊫ᴹ↓⺞⸕䇶ⲴᛵᖒDŽㅜ 12 ㄐሶ
㘳㲁ᴤа㡜ⲴᆖҐᛵߥˈণݸ傼⸕䇶ਚᱟ䘁լ↓⺞ⲴᛵߥDŽ
11.1.1 ᖈ㓩ૂ࠼᷆ᆜҖ䰤从
࠶઼᷀ᖂ㓣ᆖҐ䰞仈Ⲵ䟽㾱४࡛൘ҾˈᆳԜ䇮ᜣⲴᆖҐ䰞仈Ⲵᖒᔿн਼˖
x ൘ᖂ㓣ᆖҐѝˈᆖҐಘ㻛㔉Ҹањٷ䇮オ䰤Hˈᆳᗵ享Ӿѝ䘹ᤙањ䗃ࠪٷ䇮DŽ䘈
ᴹањ䇝㓳ṧֻ䳶ਸD={<x1, f(x1)>, …<xn, f(xn)>}ˈަѝf(xi)ѪᇎֻxiⲴⴞḷ٬DŽᆖ
ҐಘᡰᐼᵋⲴ䗃ࠪѪHѝо䘉Ӌ䇝㓳ṧֻа㠤Ⲵٷ䇮hDŽ
x ൘࠶᷀ᆖҐѝˈᆖҐಘⲴ䗃ޕवਜ਼оᖂ㓣ᆖҐ਼ṧⲴٷ䇮オ䰤 H ઼䇝㓳ṧֻ DDŽ
ᆖҐಘ䘈ᴹਖа䗃˖ޕањ亶 亶ฏ⨶䇪(domain theory)Bˈᆳ⭡ਟ⭘Ҿ䀓䟺䇝㓳ṧֻ
Ⲵ㛼Ჟ⸕䇶㓴ᡀDŽᆖҐಘⲴᐼᵋⲴ䗃ࠪѪ H ѝⲴٷ䇮 hˈᆳᰒо䇝㓳ṧֻ D а
㠤ˈҏо亶ฏ⨶䇪 B а㠤DŽ
Ѫ䈤᰾䘉а⛩ˈ൘лỻⲴֻᆀѝ⇿њᇎֻxiਟ᧿䘠а⢩ᇊỻⴈ⣦ᘱˈf(xi)Ⲵ٬൘xiᱟ唁ỻ൘
є↕ђਾⲴỻⴈ⣦ᘱᰦѪⵏˈࡉѪٷDŽᡁԜਟྲㅜ 10 ㄐ䛓ṧᇊѹٷ䇮オ䰤HѪHornᆀਕ
䳶˄ণif-then 㿴ࡉ˅ˈަѝ㿴ࡉᡰ֯⭘Ⲵ䉃䇽㺘⽪ỻⴈк⢩ᇊᆀⲴս㖞ᡆሩս㖞DŽ亶ฏ⨶䇪
Bਟ⭡ᖒᔿॆⲴлỻ㿴ࡉ㓴ᡀˈ᧿䘠Ҷਸ⌅Ⲵ䎠ỻǃሩᔸ㘵䖞⍱㹼ỻǃԕ৺տտሩᯩ⦻ᰦ㧧
㜌ㅹDŽ
⌘൘࠶᷀ᆖҐѝˈᆖҐಘᗵ享䗃ࠪаٷ䇮ˈᰒо䇝㓳ᮠᦞа㠤ˈ৸о亶ฏ⨶䇪а㠤DŽᖃ
B н⏥㮤 h Ⲵᇊᰦ˄ণ Bƅ/ h˅ˈᡁԜ〠 h о亶ฏ⨶䇪 B а㠤˄consistent˅DŽ↔䱴࣐Ⲵа㠤
ᙗ㓖ᶏˈ߿ቁҶᖃᮠᦞн㜭অ⤜൘ H ѝߣᇊ h ᰦᆖҐಘ䶒ѤⲴ↗ѹᙗDŽྲ᷌亶ฏ⨶䇪↓⺞ˈަ
ᴰਾ᭸᷌ቡᱟᨀ儈Ҷ䗃ࠪٷ䇮Ⲵ㋮ᓖDŽ
⧠䈖㓶ӻ㓽алᵜㄐਾ䶒аⴤ⭘ࡠⲴ࠶᷀ᆖҐ䰞仈ⲴਖањֻᆀDŽ㘳㲁аᇎֻオ䰤 Xˈަ
ѝ⇿њᇎֻ䜭ᱟаሩ⢙⨶ሩ䊑DŽ⇿ሩ⢙⨶ሩ䊑⭡䉃䇽 Color, Volume, Owner, Material, Type ઼
Density ᧿䘠ˈ㘼єњሩ䊑ѻ䰤Ⲵޣ㌫⭘䉃䇽 On ᧿䘠DŽ൘↔ٷ䇮オ䰤ѝˈᆖҐԫ࣑ᱟᆖҐⴞḷ
ᾲᘥĀєњ⢙⨶ሩ䊑ˈањਟ㻛ᆹޘൠਐ᭮൘ਖањкāˈ㺘⽪Ѫ䉃䇽 SafeToStack(x,y)DŽᆖҐ
↔ⴞḷᾲᘥᴹᇎ⭘Ⲵԧ٬ˈֻྲањᵪಘӪ㌫㔏㾱൘аᴹ䲀オ䰤ѝᆈ᭮н਼Ⲵ⢙⨶ሩ䊑DŽ↔࠶
᷀ᆖҐⲴᆼᮤᇊѹ൘㺘 11-1 ѝ㔉ࠪDŽ
㺘 11-1 ањ࠶᷀ᆖҐ䰞仈˖SafeToStack(x, y)
ᐢ⸕˖
ᇎֻオ䰤 X˖⇿њᇎֻ᧿䘠Ҷаሩሩ䊑ˈ᧿䘠Ѫ䉃䇽 Type, Color, Volume, Owner, Material, Density ઼
OnDŽ
ٷ䇮 オ 䰤 H˖ ⇿ њ ٷ䇮 ᱟа 㓴 Horn ᆀਕ 㿴 ࡉ DŽ⇿њ Horn ᆀ ਕⲴ ཤ 䜘 Ѫа њव ਜ਼ ⴞ ḷ䉃 䇽
SafeToStack Ⲵ᮷ᆇDŽHorn ᆀਕփѪ᮷ᆇⲴਸਆˈ䘉Ӌ᮷ᆇสҾ᧿䘠ᇎֻⲴ䉃䇽ˈԕ৺䉃䇽 LessThan,
Equal, GreaterThan ઼࠭ᮠ plus, minus ઼ timesDŽֻྲл䶒Ⲵ Horn ᆀਕᱟٷ䇮オ䰤ѝⲴаઈ˖
SafeToStack(x, y)ĕVolume(x, vx)ġVolume(y, vy) ġLessThan(vx, vy)
ⴞḷᾲᘥ˖SafeToStack(x,y)
䇝㓳ṧֻ˖л䶒ᱮ⽪ҶањިරⲴ↓ֻ SafeToStack(Obj1, Obj2)˖
On(Obj1, Obj2) Owner(Obj1, Fred)
Type(Obj1, Box) Owner(Obj2, Louise)
Type(Obj2, Endtable) Density(Obj1, 0.3)
Color(Obj1, Red) Material(Obj1, Cardboard)
Color(Obj2, Blue) Material(Obj2, Wood)
Volume(Obj1, 2)
亶ฏ⨶䇪 B˖
SafeToStack(x, y)ĕFragile(y)
SafeToStack(x, y) ĕLighter(x, y)
Lighter(x, y) ĕWeight(x, wx) ġWeight(y, wy) ġLessThan(wx, wy)
Weight(x, w) ĕVolume(x, v) ġDensity(x, d)ġEqual(w, times(v, d))
Weight(x, 5) ĕType(x, Endtable)
Fragile(x) ĕMaterial(x, Glass)
…
≲䀓˖
H ѝањٷ䇮ˈо䇝㓳ṧ઼ֻ亶ฏ⨶䇪а㠤DŽ
Ѫ᰾⺞ൠ㺘䗮↔࠶᷀ᆖҐ䰞仈ˈ䘈ᗵ享ᨀ亶ฏ⨶䇪ˈԕ࠶ݵ䀓䟺ѪӰѸ㿲ሏࡠⲴ↓ֻ┑
䏣ⴞḷᾲᘥDŽ൘ࡽ䶒Ⲵлỻֻᆀ䟼ˈ亶ฏ⨶䇪Ѫỻᆀ䎠⌅Ⲵ⸕䇶ˈӾѝᡁԜᔪ・ࠪѪӰѸ唁ỻ
ՊђਾⲴ䀓䟺DŽ൘ᖃࡽֻᆀѝˈ亶ฏ⨶䇪ᗵ享ᖸᇩ᱃䀓䟺ѪӰѸањሩ䊑ਟ᭮൘ਖањѻкDŽ
㺘ѝᱮ⽪Ⲵ亶ฏ⨶䇪वᤜᯝ䀰˖Āਟሶ x ᆹޘൠਐ᭮൘ y кˈྲ᷌ y нᱟ᱃⺾Ⲵ˄Fragile˅ā
ԕ৺Āሩ䊑 x ᱟ᱃⺾Ⲵ(Fragile)ˈᖃ x Ⲵᶀ䍘(Material)ᱟ⧫⪳˄Glass˅ᰦDŽāྲᆖҐࡠⲴٷ䇮
аṧˈ亶ฏ⨶䇪⭡а㓴 Horn ᆀਕ᧿䘠ˈᆳ֯㌫㔏ࡉкਟԕ࣐ޕԫօᆖҐࡠⲴٷ䇮㠣ਾ㔝Ⲵ
亶ฏ⨶䇪ѝDŽ⌘亶ฏ⨶䇪वᤜྲ Lighter ઼ Fragile 䘉ṧⲴ䱴࣐䉃䇽ˈᆳԜн൘䇝㓳ṧֻⲴ᧿
䘠ѝˈնᱟ⭡ᴤᆀⲴᇎֻᙗྲ Material, Density ઼ Volume ֯⭘亶ฏ⨶䇪ѝަԆ㿴ࡉ᧘⨶ᗇ
ࠪDŽᴰਾˈ⌘㺘ѝᱮ⽪Ⲵ亶ฏ⨶䇪࠶ݵ䇱᰾䘉䟼ᱮ⽪Ⲵ↓ֻ┑䏣ⴞḷᾲᘥ SafeToStackDŽ
11.2 ⭞ᇂ㗄Ⲻ亼ต⨼䇰ᆜҖφProlog-EBG
ྲࡽᡰ䘠ˈᵜㄐѫ㾱㘳㲁ⲴสҾ䀓䟺ⲴᆖҐᱟ൘亶ฏ⨶䇪ᖸᆼ㖾ⲴᛵߥлⲴˈণ亶ฏ⨶䇪
ᱟ↓⺞ⲴᒦфᆼᮤⲴDŽањ亶ฏ⨶䇪㻛〠Ѫ↓⺞Ⲵˈᖃަѝ⇿њᯝ䀰䜭ᱟц⭼Ⲵⵏᇎ᧿䘠DŽа
њ亶ฏ⨶䇪㻛〠ѪᆼᮤⲴ˄ሩᓄ㔉ᇊⲴⴞḷᾲᘥ઼ᇎֻオ䰤˅ˈᖃ亶ฏ⨶䇪㾶ⴆҶᇎֻオ䰤ѝ
ᡰᴹ↓ֻDŽᦒ䀰ѻˈަᆼᮤᙗ䈤᰾⇿њ┑䏣ⴞḷᾲᘥⲴᇎֻ䜭ਟ⭡亶ฏ⨶䇪䇱᰾ަ┑䏣ᙗDŽ⌘
ࡽ䶒ሩᆼᮤᙗⲴᇊѹн㾱≲亶ฏ⨶䇪ਟ䇱᰾৽ֻн┑䏣ⴞḷᾲᘥDŽ❦㘼ˈྲ᷌䚥ᗚ䙊ᑨ
Prolog ᜟֻˈн㜭䇱᰾Ⲵᯝ䀰ਟ䇔ᇊᱟٷDŽഐ↔䈕ᆼᮤᙗᇊѹਟवਜ਼ޘ䜘↓઼ֻ৽ֻDŽ
䈫㘵൘↔ਟ㜭Պ䰞ˈሩҾᆖҐಘٷᇊᴹ䘉ṧⲴᆼ㖾亶ฏ⨶䇪ᱟਸ⨶˛㘼фˈᰒ❦ᆖҐಘ
ᴹҶањᆼ㖾Ⲵ亶ฏ⨶䇪ˈ䘈ᴹօᗵ㾱৫ᆖҐ˛ሩҾ↔䰞仈ਟ᤹ԕлє⛩എㆄ˖
x 俆ˈݸḀӋᛵᖒлᱟᴹਟ㜭ᨀᆼ㖾亶ฏ⨶䇪ⲴDŽࡽ䶒ⲴлỻⲴ䰞仈ቡᱟ䘉ṧⲴ
ањֻᆀˈަѝỻᆀⲴਸ⌅䎠ᆀᖒᡀҶањᆼ㖾Ⲵ亶ฏ⨶䇪ˈ˄ࡉк˅ਟ⭘ᆳ
ᶕ᧘⨶ᴰՈⲴлỻㆆ⮕DŽᴤ䘋а↕ˈ㲭❦ᖸᇩ᱃߉ࠪᶴᡀ亶ฏ⨶䇪Ⲵỻᆀਸ⌅↕
ᆀˈ㾱߉ࠪᴰՈлỻㆆ⮕ӽ❦ᖸ䳮DŽ൘䘉ᛵߥлˈᡁԜᴤᐼᵋሶ䘉ṧⲴ亶ฏ⨶
䇪ᨀ㔉ᆖҐಘˈᒦᐼᵋᆖҐಘᖒᡀⴞḷᾲᘥⲴᴹᑞࣙⲴ᧿䘠˄ྲ˖Āਟ㜭ђਾ
Ⲵỻተ⣦ᘱā˅DŽᯩ⌅ᱟ䙊䗷ሩ⢩↺䇝㓳ṧֻ䘋㹼㘳ḕ઼⌋ॆDŽ11.4 㢲᧿䘠Ҷ֯⭘
ᆼ㖾亶ฏ⨶䇪ⲴสҾ䀓䟺ⲴᆖҐᡀ࣏ൠᓄ⭘ࡠࠐњᩌ㍒ᇶ䳶Ⲵ䇑ࡂ઼Ոॆ䰞仈
ѝˈԕ㠚ࣘ᭩䘋ᙗ㜭DŽ
x ㅜҼˈ൘䇨ཊᛵߥлн㜭ཏٷᇊᴹᆼ㖾Ⲵ亶ฏ⨶䇪DŽ∄ྲᖸ䳮Ѫࡽ䶒䘉њሩㆰ
অⲴ SafeToStack 䰞仈㔉ࠪᆼᮤ㘼↓⺞Ⲵ亶ฏ⨶䇪DŽᴤᇎ䱵Ⲵᯩ⌅ᱟٷᇊᗵ享֯⭘
สҾнᆼ㖾亶ฏ⨶䇪Ⲵ䘁լਸ⨶Ⲵ䀓䟺ˈ㘼нᱟสҾᆼ㖾⸕䇶ࠪ⺞࠷䇱᰾DŽᰐ
䇪ᘾṧˈᡁԜਟԕ䙊䗷㘳㲁⨶ᜣᛵߥлⲴᆼ㖾亶ฏ⨶䇪ˈᔰҶ䀓൘ᆖҐѝ֯⭘
䀓䟺ⲴⴞⲴDŽㅜ 12 ㄐᡁԜሶ㘳㲁Ӿнᆼ㖾亶ฏ⨶䇪ѝᆖҐDŽ
11.2.1 䘆㺂⽰ׁ
11.2.1.1 䀙䠀䇣㓹ṭׁ
༴⨶⇿њᯠṧֻⲴㅜа↕ᱟ᤹➗亶ฏ⨶䇪ᔪ・а䀓䟺ˈԕ䈤᰾䈕↓ֻྲօ┑䏣ⴞḷᾲᘥDŽ
ᖃ亶ฏ⨶䇪↓⺞фᆼᮤᰦˈ↔䀓䟺㓴ᡀҶ䇝㓳ṧֻ┑䏣ⴞḷᾲᘥⲴањ䇱᰾˄proof˅DŽྲ᷌
ݸ傼⸕䇶нᆼ㖾ˈ䀓䟺ѝⲴ䇠ਧᗵ享㻛ᢙኅԕݱ䇨䘁լⲴ৲ᮠˈ㘼нᱟᆼ㖾Ⲵ䇱᰾DŽ
ሩ ᖃ ࡽ ṧ ֻ Ⲵ 䀓 䟺 㿱 മ 11-2 DŽ ⌘ ަ ѝ ᓅ 䜘 Ⲵ മ ᖒ ԓ 㺘 Ҷ 㺘 11-1 ѝ Ⲵ ↓ ֻ
SafeToStack(Obj1, Obj2)DŽമѝк䜘Ѫሩ↔ṧֻᶴ䙐Ⲵ䀓䟺DŽ⌘↔䀓䟺˄ᡆ〠䇱᰾˅䈤᰾ഐѪ
Obj1 ∄ Obj2 ᴤ 䖫˄Lighter˅ˈᡰԕ Obj1 ਟԕᆹึޘਐ˄SafeToStack˅൘ Obj2 кDŽᴤ䘋а
↕ˈ⸕䚃 Obj1 ᴤ䖫ᱟഐѪᆳⲴ䟽䟿˄Weight˅ਟԕ⭡ަᇶᓖ˄Density˅઼փ〟˄Volume˅᧘
ᗇˈ㘼ф Obj2 Ⲵ 䟽䟿˄Weight˅ਟӾ㥦ࠐ˄Endtable˅Ⲵ唈䇔Ⲵ䟽䟿˄Weight˅٬ᗇࠪDŽ↔䀓
䟺สҾⲴ⢩ᇊ Horn ᆀਕ൘㺘 11-1 Ⲵ亶ฏ⨶䇪ѝᱮ⽪ࠪDŽ⌘↔䀓䟺ਚᨀࡠҶ Obj1 ઼ Obj2 Ⲵ
ᙗѝⲴаሿ䜘࠶˄ণሩᓄҾമѝ䱤ᖡ४ฏⲴᙗ˅DŽ
㲭❦䘉䟼ሩҾ䇝㓳ṧ઼ֻ亶ฏ⨶䇪ਚᴹа䀓䟺ˈа㡜ᛵߥлਟ㜭ᴹཊ䀓䟺DŽ䘉ṧˈ䘉
Ӌ䀓䟺ѝԫⲴᡆᡰᴹⲴ䜭ਟ㻛֯⭘DŽ⇿њ䀓䟺ਟሩ䇝㓳ṧֻᖒᡀн਼Ⲵ⌋ॆˈնᡰᴹ䀓䟺䜭
ሶ㻛㔉ᇊⲴ亶ฏ⨶䇪䇪䇱DŽ൘ Prolog-EBG ѝˈ䀓䟺Ⲵ⭏ᡀ֯⭘Ҷྲ Prolog ѝⲴਾੁ䬮ᔿᩌ
㍒DŽProlog-EBG ྲ Prolog аṧˈ൘ᆳࡠㅜањᴹ᭸䇱᰾ᰦ㓸→DŽ
11.2.1.2 ࠼᷆䀙䠀
൘⌋ॆ䇝㓳ṧֻᰦ䶒ѤⲴޣ䭞䰞仈ᱟĀ൘ᖃࡽṧֻѝ䇨ཊ↓ྭѪⵏⲴ⢩ᖱѝˈଚањᱟ൘
а㡜ᛵߥлоⴞḷᾲᘥ˛Ⲵޣā⭡ᆖҐಘᶴ䙐Ⲵ䀓䟺ሩ↔䰞仈ࠪҶⴤ᧕Ⲵഎㆄ˖↓ྭᱟ䛓
Ӌ൘䀓䟺ѝᨀ৺Ⲵ⢩ᖱDŽֻྲˈമ 11-2 Ⲵ䀓䟺वਜ਼Ҷ Obj1 Ⲵ Densityˈն⋑ᴹᆳⲴ Owner
ᙗDŽഐ↔ˈSafeToStack(x,y)Ⲵٷ䇮ᓄवਜ਼ Density(x,0.3)ˈ㘼нवਜ਼ Owner(x,Fred)DŽ䙊䗷᭦䳶മ
11-2 ѝ䀓䟺Ⲵਦ㔃⛩ѝᨀ৺Ⲵ⢩ᖱˈᒦሶ Obj1 ઼ Obj2 ᴯᦒѪ x ઼ yˈਟᖒᡀањ⭡亶ฏ⨶䇪
䇪䇱Ⲵа㡜㿴ࡉDŽ
插图——原书页码:315
Explanation: 䀓䟺
മ 11-2 䇝㓳ṧֻⲴ䀓䟺
䘎਼↔ᆖࡠⲴ㿴ࡉа䎧ˈ〻ᒿ䘈ਟԕᨀަ䇪䇱˖ሩ䇝㓳ṧֻⲴ䀓䟺ᖒᡀҶሩ↔㿴ࡉ↓⺞
ᙗⲴ䇱᰾DŽ㲭❦↔䀓䟺ᱟѪҶ㾶ⴆ㿲ሏࡠⲴ䇝㓳ṧֻ㘼ᖒᡀˈ਼ṧⲴ䀓䟺ሶ䘲⭘Ҿԫօо↔а
㡜㿴ࡉ३䝽ⲴᇎֻDŽ
к䶒Ⲵ㿴ࡉᶴᡀҶ↔䇝㓳ṧֻⲴањᖸᴹѹⲴ⌋ॆˈഐѪᆳ৫䲔ҶṧֻⲴ䇨ཊоⴞḷᾲ
ᘥᰐޣᙗ˄ྲєњሩ䊑Ⲵ Color˅ˈ❦㘼䙊䗷ሩ䀓䟺ᴤԄ㓶ൠ࠶᷀ਟԕᗇࡠᴤа㡜Ⲵ㿴ࡉDŽ
Prolog-EBG ਟ䇑㇇㜭⭡䀓䟺䇪䇱Ⲵᴰа㡜Ⲵ㿴ࡉˈᯩ⌅䙊䗷䇑㇇䀓䟺Ⲵᴰᕡࡽ˄ۿweakest
preimage˅ˈᇊѹྲл˖
插图——原书页码:317
മ 11-3 䇑㇇ SafeToStack(Obj1,Obj2)ޣҾ䀓䟺Ⲵᴰᕡࡽۿ
ⴞḷᾲᘥӾ䀓䟺Ⲵṩ䜘˄㔃䇪˅ᔰഎᖂˈл䱽ࡠਦ㔃⛩DŽ൘⇿а↕˄⭡㲊㓯㺘⽪˅ˈᖃࡽ᮷ᆇ
䳶ਸ䗩㕈˄ᑖлࡂ㓯Ⲵᯌփ˅൘䀓䟺Ⲵањ㿴ࡉк㻛ਾੁഎᖂDŽᖃ↔䗷〻ᆼᡀᰦˈ㔃᷌᮷ᆇਸਆᶴᡀ
ҶሩᓄҾ䀓䟺ⲴⴞḷᾲᘥⲴᴰᕡࡽۿDŽ↔ᴰᕡࡽۿ൘മⲴᓅ䜘ԕᯌփⲴ᮷ᆇᱮ⽪DŽ
⭡Prolog-EBG䗃ࠪⲴᴰ㓸Hornᆀਕᖒᔿྲл˖ᆀਕփ㻛ᇊѹѪк䘠䗷〻䇑㇇ࠪⲴᴰᕡࡽ
ԦDŽᆀਕཤѪⴞḷᾲᘥᵜ䓛ˈԕ৺ᓄ⭘ࡠᆳкⲴ⇿аഎᖂ↕ѝⲴ⇿њ㖞ᦒ˄ྲ㺘 11-3 ѝⲴ㖞
ᦒ©hl˅DŽᓄ⭘↔㖞ᦒᱟѪҶ൘ࡋᔪࠪⲴᆀਕཤ઼ᆀਕփѝ؍ᤱа㠤ਈ䟿ˈԕ৺ᖃ↔䀓䟺ਚ
ᓄ⭘ҾⴞḷᾲᘥⲴ⢩↺ᛵߥᰦ⢩ॆᆀਕཤDŽྲࡽᤷࠪⲴˈሩҾᖃࡽⲴֻᆀˈᴰ㓸㿴ࡉѪ˖
⭡䗩㕈˄Frontier˅㔉ࠪⲴ᮷ᆇ䳶ਸ䙊䗷Rule㻛എᖂDŽLiteralѪ↔䀓䟺ѝ⭡Rule᧘⨶ⲴFrontierᡀ
ઈDŽ㖞ᦒ ©hi 㔉ࠪҶӾRuleⲴཤࡠ䀓䟺ѝሩᓄ᮷ᆇⲴਈ䟿㓖ᶏDŽ↔㇇⌅俆ݸ䇑㇇ањ㜭֯RuleⲴཤо
LiteralਸаⲴ㖞ᦒ © hl ˈަᯩ⌅ᱟ֯ަо㖞ᦒ © hi а㠤DŽ❦ਾ↔㖞ᦒ © hl 㻛ᓄ⭘Ҿᔪ・ޣҾRuleⲴ
FrontierⲴࡽۿDŽ㇇⌅ѝㅖਧĀˇā઼Āˉā㺘⽪䳶ਸᒦ઼䳶ਸᐞDŽ䇠ਧ{z/y}㺘⽪⭘y㖞ᦒzDŽ㺘ѝ䘈㔉
ࠪҶ࠶↕䘀㹼ⲴֻᆀDŽ
11.2.1.3 ᭯䘑ᖉࢃٽ䇴
11.3 ሯะӄ䀙䠀ⲺᆜҖⲺ䈪᱄
൘สҾ䀓䟺ⲴᆖҐѝᴹаӋⲴޣ㿲⛩ˈਟᴹࣙҾ⨶䀓ަ㜭઼࣋䲀ࡦ˖
x EBL Ѫ⨶ ⨶䇪ᕅሬⲴṧֻ⌋ॆ˄theory-guided generalization of examples˅DŽEBL ֯
⭘㔉ᇊⲴ亶ฏ⨶䇪ԕӾṧֻѝਸ⨶ൠ⌋ॆˈ४࠶઼ࠪޣнⲴޣṧֻᙗˈഐ
↔ਟԕ䚯⭘ݽҾ㓟ᖂ㓣᧘⨶ѝⲴṧᵜ༽ᵲᓖ⭼䲀DŽ䘉ᱟањ䳀ਜ਼൘к䶒᧿䘠Ⲵ
Prolog-BEG ㇇⌅ѝⲴ㿲⛩DŽ
x EBL Ѫṧ ṧֻᕅሬⲴ⨶䇪䟽ᔪ˄example-guided reformulation of theories˅DŽProlog-
EBG ㇇⌅㻛ⴻᱟа䟽ᔪ亶ฏ⨶䇪ࡠаਟᖒᔿⲴᯩ⌅DŽ⺞࠷ൠ䇢ˈ䟽ᔪ
亶ฏ⨶䇪ᱟ䙊䗷ࡋᔪ䘉ṧⲴ㿴ࡉ˖˄a˅㜭Ӿ亶ฏ⨶䇪ѝ╄㓾⍮⭏ˈԕ৺˄b˅൘а
њ᧘⨶↕࠶㊫㿲ሏࡠⲴ䇝㓳ṧֻDŽ䘉ṧˈᆖҐࡠⲴ㿴ࡉਟ㻛ⴻሶ亶ฏ⨶䇪䟽
ᔪѪа㓴⢩↺ᛵߥлⲴ㿴ࡉˈᆳ㜭൘ањ᧘⨶↕ሩⴞḷᾲᘥⲴᇎֻ࠶㊫DŽ
x EBL ѪĀ Āӵӵā䟽䘠ᆖҐಘᐢ㓿Ā⸕䚃āⲴ˄“just” restating what the learner
already “knows”˅DŽ൘Ḁ〻ᓖкˈ൘ SafeToStack ֻᆀѝⲴᆖҐಘᔰҾަⴞḷ
ᾲᘥⲴޘ䜘⸕䇶DŽҏቡᱟ䈤ˈྲ᷌ᆳⲴࡍ亶ฏ⨶䇪࠶ݵ䀓䟺Ҷԫօ䇝㓳ṧֻˈ
䛓Ѹᆳҏ㜭࠶ݵ亴⍻ަ࠶㊫DŽ䛓ѸᆖҐⲴѹ൘ଚݯ˛аഎㆄᱟˈ൘䇨ཊԫ
࣑ѝˈࡉкᐢ⸕Ⲵ઼ᇎ䐥кਟᴹ᭸䇑㇇Ⲵѻ䰤Ⲵ४࡛ᖸབྷˈഐ↔䘉Ā⸕䇶䟽
ᔪāѪᆖҐⲴ䟽㾱ᖒᔿDŽֻྲ൘лỻⲴֻᆀѝˈሩᔸⲴ㿴ࡉᶴᡀҶањᆼ㖾Ⲵ亶
ฏ⨶䇪ˈࡉк䏣ԕ䘋㹼ᆼ㖾ⲴሩᔸDŽণ֯ྲ↔ˈӪԜӽ❦䴰㾱བྷ䟿Ⲵ㓿傼ᶕᆖ
ҐྲօᖸྭൠлỻDŽ䘉↓ᱟ䘉ṧаᛵᖒˈ˄Ӫ㊫Ⲵ˅ᆖҐಘᐢ㓿⸕䚃Ҷᆼ㖾Ⲵ
亶ฏ⨶䇪ˈ㘼䘋а↕ᆖҐਚᱟĀㆰঅൠāሶ↔⸕䇶䟽ᔪѪਖаᖒᔿˈԕ⭘Ҿᴤ
ᴹ᭸Ⲵᤷሬ䘲ᖃⲴ㹼ѪDŽᴹ਼ṧᙗⲴਖањֻᆀᱟᆖҐ⢋亯࣋ᆖ䈮〻˖สᵜⲴ
⢙⨶ᇊᖻᐢ㻛ㆰঅൠ䱸䘠ˈնᆖ⭏ӽᰗ䴰㾱൘ᆖᵏѝ㣡аབྷ䜘࠶ᰦ䰤ᆖҐ䘉а䈮
〻ˈԕᤕᴹᴤਟᖒᔿⲴ⸕䇶ˈ❦ਾቡн䴰㾱൘ᴰਾⲴ㘳䈅ѝ⭘ᴰสᵜⲴᇊᖻ
ᶕ᧘ሬ⇿њ䰞仈Ⲵ䀓DŽProlog-EBG ᢗ㹼Ⲵቡᱟ䘉ᖒᔿⲴ⸕䇶䟽ᔪˈᆳᆖҐࡠⲴ
㿴ࡉਟӾਟ㿲ሏⲴᇎֻ⢩ᖱ᱐ሴࡠޣҾⴞḷᾲᘥⲴ࠶㊫ˈᯩ⌅ᱟ֯ަоสᵜ亶ฏ
⨶䇪а㠤DŽ֯⭘Ⲵ亶ฏ⨶䇪ਟ㜭䴰㾱䇨ཊ᧘⨶↕઼ᖸਟ㿲Ⲵᩌ㍒㜭ሩԫ
ᇎֻ࠶㊫ˈ㘼ᆖҐࡠⲴ㿴ࡉਟ൘ањ᧘⨶↕࠶㊫㿲ሏࡠⲴᇎֻDŽ
11.3.1 ਇ⧦᯦⢯ᖷ
Prolog-EBG ањᴹ䏓Ⲵ㜭࣋ᱟᖒᡀ൘䇝㓳ṧֻⲴ᧿䘠ѝ⋑ᴹᱮᔿࠪ⧠Ⲵᯠ⢩ᖱˈն䘉Ӌ
⢩ᖱᱟ൘᧿䘠䇝㓳ṧֻѝⲴа㡜㿴ࡉᰦᗵ䴰ⲴDŽ䘉㜭࣋൘ࡽа㢲Ⲵ࠶↕㇇⌅઼ᆖࡠⲴ㿴ࡉѝ
ֻ⽪DŽ⺞࠷ൠ䈤ˈᆖࡠⲴ㿴ࡉᯝ䀰ሩ x Ⲵ Volume ઼ Density Ⲵᗵ㾱㓖ᶏѪަ҈〟ሿҾ 5DŽᇎ䱵
кˈ䇝㓳ṧֻᒦнवਜ਼↔҈〟ԕ৺ᆳᓄਆⲴ٬Ⲵ᧿䘠DŽ↔㓖ᶏᱟ⭡ᆖҐಘ㠚ࣘᖒᡀⲴDŽ
⌘↔ᆖҐࡠⲴĀ⢩ᖱā㊫լҾ⭡⾎㓿㖁㔌Ⲵ䳀㯿অݳ㺘⽪Ⲵ⢩ᖱ㊫රDŽҏቡᱟ䈤ˈ䘉њ
⢩ᖱᱟਟ⭡ᐢᴹᇎֻᙗ䇑㇇ࠪⲴǃབྷ䟿▌൘Ⲵ⢩ᖱѻаDŽ઼ਾੁՐ㇇⌅аṧˈProlog-EBG
൘ަቍ䈅ᤏਸ䇝㓳ᮠᦞⲴ䗷〻ѝˈ㠚ࣘᖒᡀ䘉ṧⲴ⢩ᖱDŽ❦㘼ˈн⾎ۿ㓿㖁㔌ѝ֯⭘㔏䇑䗷〻
Ӿཊњ䇝㓳ṧֻѝ᧘ሬࠪ䳀㯿অݳ⢩ᖱˈProlog-EBG ᓄ⭘Ҷањ࠶᷀䗷〻สҾঅњ䇝㓳ṧֻ
Ⲵ ࠶ ᷀ ᧘ ሬ ᯠ Ⲵ ⢩ ᖱ DŽ к 䶒 Ⲵ ֻ ᆀ ѝ Prolog-EBG ⭘ ࠶ ᷀ Ⲵ ᯩ ⌅ ᧘ ሬ ࠪ ⢩ ᖱ
Volume · Density>5 ˈᆳᶕ㠚Ҿ⭘Ҿ䀓䟺অњ䇝㓳ṧֻⲴ亶ฏ⨶䇪Ⲵ⢩ᇊᇎֻॆDŽֻྲˈ
ĀVolumn ઼ Density Ⲵ҈〟ᖸ䟽㾱ā䘉аᾲᘥᱟᶕ㠚Ҿᇊѹ Weight Ⲵ亶ฏ⨶䇪㿴ࡉDŽ䈕҈〟ᗵ
享ሿҾ 5 Ⲵᾲᘥᶕ㠚Ҿਖཆєᶑ亶ฏ⨶䇪㿴ࡉˈᆳԜᯝ䀰 Obj1 ᗵ享∄㥦ࠐ˄EndTable˅ᴤ䖫
˄Lighter˅ˈԕ৺㥦ࠐ˄Endtable˅Ⲵ䟽䟿˄Weight˅ㅹҾ 5DŽഐ↔ˈ↓ᱟ䘉Ӌ亶ฏ⨶䇪ѝⲴ
ᆀ亩Ⲵ⢩ᇊਸᡀ઼ᇎֻॆሬ㠤Ҷ↔ᯠ⢩ᖱⲴᇊѹDŽ
㠚ࣘᆖҐᴹ⭘⢩ᖱԕᢙབྷᇎֻ㺘⽪Ⲵ䰞仈ᱟᵪಘᆖҐⲴањ䟽㾱䰞仈DŽ൘สҾ䀓䟺ⲴᆖҐ
ѝ࠶᷀᧘ሬᯠ⢩ᖱˈ઼൘⾎㓿㖁㔌Ⲵ䳀㯿অݳѝᖂ㓣᧘ሬᯠ⢩ᖱᨀҶєн਼Ⲵ䙄ᖴDŽഐ
↔ˈᆳԜ䎆ⲴؑᶕⓀн਼˄ањᱟ൘䇨ཊṧֻкⲴ㔏䇑㿴ࡉˈਖањᱟ֯⭘亶ฏ⨶䇪Ⲵঅ
њṧֻ࠶᷀˅ˈᴹਟ㜭㔃ਸєᶕⓀ᧒㍒ࠪᯠⲴᯩ⌅DŽ
11.3.2 ╊㔄ᆜҖ
DġBƅh ˄11ˊ2˅
ަѝ䇝㓳ᮠᦞD⭡а㓴䇝㓳ṧֻ㓴ᡀˈxiѪㅜiњ䇝㓳ᇎֻˈf(xi)ѪᆳⲴⴞḷ٬˄fѪⴞḷ࠭
ᮠ˅DŽ⌘ㅜањ㓖ᶏਚᱟㆰঅൠሶᵪಘᆖҐⲴ䙊ᑨⲴ䴰≲ᖒᔿॆˈণٷ䇮h㜭ሩ䇝㓳ᮠᦞѝ
⇿њᇎֻxi↓⺞亴⍻ⴞḷ٬f(xi)*DŽᖃ❦а㡜ᛵߥлᴹཊٷ䇮┑䏣䘉а㓖ᶏDŽㅜҼњ㓖ᶏ᧿䘠
ҶProlog-EBLѝ亶ฏ⨶䇪Ⲵ⭘˖䗃ࠪٷ䇮㻛䘋а↕㓖ᶏԕ֯ަ⍮⭏Ҿ亶ฏ⨶䇪઼ᮠᦞDŽ䘉ㅜ
Ҽњ㓖ᶏ߿ቁҶᆖҐಘ൘ᗵ享䘹ᤙٷ䇮ᰦ䶒ѤⲴ↗ѹᙗDŽഐ↔ˈ亶ฏ⨶䇪Ⲵ⭘ᱟ߿ቁٷ䇮オ
䰤Ⲵᴹ᭸㿴⁑ᒦ䱽վᆖҐⲴṧᵜ༽ᵲᓖDŽ
䘉њሩ亶ฏ⨶䇪 B Ⲵ㓖ᶏ؍䇱Ҷሩ⇿њ↓ֻਟᶴ䙐ࠪ䀓䟺DŽ
*
䘉䟼൘⏥㮤˄ƅ˅Ⲵᇊѹѝवਜ਼ҶPrologṧᔿⲴཡ䍕ᇊˈഐ↔ྲ᷌ṧֻн㜭㻛䇱᰾Ѫ↓ֻˈࡉᆳԜ㻛
⏥㮤Ѫ৽ֻDŽ
11.3.3 ะӄ䀙䠀ⲺᆜҖⲺᖈ㓩څ㖤
എᗶㅜ 2 ㄐⲴਉ䘠ˈањᆖҐ㇇⌅Ⲵᖂ㓣ٿ㖞Ѫа㓴ᯝ䀰ˈᆳԜо䇝㓳ṧֻа䎧╄㓾⏥㮤
ᆖҐಘⲴਾ㔝亴⍻DŽᖂ㓣ٿ㖞Ⲵ䟽㾱ᙗ൘Ҿᆳ⭫ࠪᆖҐಘᱟᘾṧӾ㿲ሏࡠⲴ䇝㓳ṧֻ⌋ॆ
ⲴDŽ
䘉䟼ᴰ䟽㾱Ⲵ㾱⛩൘ҾˈProlog-EBG Ⲵᖂ㓣ٿ㖞˄ণᆳӾ䇝㓳ᮠᦞѝ⌋ॆⲴㆆ⮕˅൘ᖸ
བྷ〻ᓖк⭡䗃Ⲵޕ亶ฏ⨶䇪⺞ᇊDŽᆳоᡁԜᡰ䇘䇪䗷ⲴཊᮠᆖҐ㇇⌅ᆼޘн਼DŽཊᮠᆖҐ㇇⌅
˄ྲ⾎㓿㖁㔌ˈߣㆆṁᆖҐ˅ѝᖂ㓣ٿ㖞ᱟᆖҐ㇇⌅Ⲵањപᇊᙗˈа㡜ᱟ⭡ަٷ䇮㺘⽪Ⲵ
䈝⌅ᡰ⺞ᇊⲴDŽѪӰѸᢺᖂ㓣ٿ㖞Ѫањ䗃ޕ৲ᮠ㘼нᱟᆖҐಘⲴപᇊᙗॱ࠶䟽㾱˛䘉ᱟ
ഐѪˈྲᡁԜ൘ㅜ 2 ㄐ৺ަԆൠᯩ䇘䇪䗷Ⲵˈнᆈ൘ањޘተᴹ᭸Ⲵᖂ㓣ٿ㖞ˈ㘼фᰐٿᆖҐ
ᱟᰐ⭘ⲴDŽഐ↔ԫօᔰਁ䙊⭘ᆖҐᯩ⌅Ⲵቍ䈅ˈ䜭㠣ቁՊݱ䇨ᖂ㓣ٿ㖞㜭ཏ䪸ሩᖵ䀓ߣⲴᆖҐ
䰞仈ᴹᡰн਼DŽ൘ањᴤᇎ䐥ᙗⲴቲ⅑кˈ䇨ཊᆖҐԫ࣑ᴤᐼᵋ䗃ޕ亶ฏ⢩ᇊⲴ⸕䇶˄ྲ
SafeToStack ֻᆀѝⲴᴹ ޣWeight Ⲵ⸕䇶˅ԕᖡ૽ᆖҐಘӾ䇝㓳ᮠᦞѝ⌋ॆⲴᯩ⌅DŽ৽ˈ䙊
䗷䲀ࡦٷ䇮Ⲵ䈝⌅ᖒᔿ˄ྲߣ⸝ྭٿㆆṁ˅ᶕĀᇎ⧠āḀ䘲ᖃⲴٿ㖞ᙗࡉнཚ㠚❦DŽᴰਾˈྲ
᷌㘳㲁ањᴤབྷⲴ䰞仈ˈањ㠚⋫ agent ྲօ䲿⵰ᰦ䰤᭩䘋ᆳⲴᆖҐ㜭࣋ˈ䛓Ѹᴰྭᱟᴹањ
ᆖҐ㇇⌅ˈᆳⲴ⌋ॆ㜭࣋ਟ൘ަ㧧ᗇࡠᴤཊⲴ亶ฏ⸕䇶ਾ໎ᕪDŽ
11.3.4 ⸛䇼ቸ⅗ⲺᆜҖ
ӗ⭏ⲴㅜҼњ䰞仈ᱟˈProlog-EBG ᱟ㜭ᆖҐࡠањ䎵ࠪ䳀ਜ਼൘亶ฏ⨶䇪ѝⲴ⸕䇶Ⲵٷ
䇮˛ᦒ䀰ѻˈᆳᱟ㜭ᆖҐࡠањᇎֻⲴ࠶㊫ˈ䘉њᇎֻн㜭⭘Ⲵ亶ฏ⨶䇪䘋㹼࠶㊫˄ٷ
ᇊᇊ⨶䇱᰾ಘᴹᰐ䲀Ⲵ䇑㇇䍴Ⓚ˅˛нᒨⲴᱟˈᆳн㜭ࡠڊDŽྲ᷌ Bƅhˈ䛓Ѹԫօ⭡ h ⏥㮤
Ⲵ࠶㊫ҏሶ⭡ B ⏥㮤DŽ䘉ᱟᱟ࠶᷀ᆖҐᡆ╄㓾ᆖҐⲴപᴹ㕪䲧˛ᒦ䶎ྲ↔ˈྲлֻᡰ⽪DŽ
(x ) IF((PlayTennis=Yes)ĕ(Humidity=x))
(PlayTennis=Yes) ĕ(Humidityİ0.30)
⸕䇶ቲ⅑Ⲵ࠶᷀ᆖҐⲴਖањֻᆀᱟˈ㘳㲁а㊫රⲴᯝ䀰ˈ䙊ᑨ〠Ѫ determinationˈᆳ
Ⲵ㓶㢲⹄ウ㿱 Russel˄1989˅ԕ৺ަԆаӋᐕDŽDetermination ᯝ䀰ˈᇎֻⲴḀᙗᆼޘਆߣ
ҾḀӋ⢩ᇊᙗˈնнᗵᤷ᰾䘉䎆ᙗⲴ⺞࠷ᙗ䍘DŽֻྲˈ㘳㲁ᆖҐањⴞḷᾲᘥĀ䈤㪑㨴
⢉䈝ⲴӪāˈᒦфٷᇊ亶ฏ⨶䇪Ѫঅњ determination ᯝ䀰ĀḀӪ䈤Ⲵ䈝䀰⭡ԆⲴഭ㉽ߣᇊDŽā
ਚᴹ䘉ᶑ亶ฏ⨶䇪ˈн㜭ཏ⭘ᶕ࠶㊫↓઼ֻ৽ֻDŽ❦㘼ˈྲ᷌ᡁԜ㿲ሏࡠĀJoeˈ23 ˈᐖ᪷
ᆀˈᐤ㾯Ӫˈ䈤㪑㨴⢉䈝āˈ䛓ѸᡁԜቡਟԕ↔↓઼ֻ亶ฏ⨶䇪ѝᗇࡠ˖ĀᡰᴹⲴᐤ㾯Ӫ䜭䈤
㪑㨴⢉䈝āDŽ
䘉Ӌֻᆀ䜭╄⽪Ҷ࠶᷀ᆖҐྲօӗ⭏н㜭⭡亶ฏ⨶䇪অ⤜⏥㮤Ⲵٷ䇮DŽަѝⲴ䗃ࠪٷ䇮 h
䜭┑䏣 DġBƅhˈնн┑䏣 BƅhDŽ൘єᛵߥлˈᆖҐಘ䜭╄㓾˄deduce˅ࠪањਸ⨶Ⲵٷ
䇮ˈᆳᰒн㜭Ӿ亶ฏ⨶䇪ѝঅ⤜⍮⭏ˈҏн㜭Ӿ䇝㓳ᮠᦞѝঅ⤜⍮⭏DŽ
11.4 ᩒ㍘⸛䇼Ⲻะӄ䀙䠀ⲺᆜҖ
ྲк䘠ᤷࠪⲴˈProlog-EBG ㇇⌅Ⲵᇎ䱵㜭࣋ਇ亶ฏ⨶䇪ᗵ享↓⺞фᆼᮤ䘉а㾱≲ᡰ䲀
ࡦDŽ㜭ཏ┑䏣䘉а㾱≲ⲴᆖҐ䰞仈Ⲵањ䟽㾱㊫࡛Ѫ䙊䗷ᆖҐ֯༽ᵲⲴᩌ㍒〻ᒿ䙏ᓖ࣐ᘛDŽᇎ
䱵кˈᓄ⭘สҾ䀓䟺ⲴᆖҐⲴᴰབྷ㿴⁑Ⲵቍ䈅ᐢ㓿ᔰ䀓ߣᆖҐ᧗ࡦᩌ㍒Ⲵ䰞仈ˈᆳᴹᰦ৸㻛
〠ѪĀ࣐䙏ā˄speedup˅ᆖҐDŽֻྲˈۿỻ㊫䘉ṧⲴሩᔸѝˈሩਸ⌅ᩌ㍒Ⲵᇊѹԕ৺ᩌ
㍒ⴞḷⲴᇊѹᨀҶᆖҐᩌ㍒᧗ࡦ⸕䇶Ⲵањᆼᮤф↓⺞Ⲵ亶ฏ⨶䇪DŽ
ྲօ⺞࠷ൠᇊѹᆖҐᩌ㍒᧗ࡦ䰞仈Ⲵᖒᔿԕ֯⭘สҾ䀓䟺ⲴᆖҐ˛㘳㲁ања㡜ᩌ㍒䰞
仈ˈަѝSѪਟ㜭ᩌ㍒⣦ᘱⲴ䳶ਸˈOѪਸ⌅ᩌ㍒㇇ᆀⲴ䳶ਸˈᆳሶаᩌ㍒⣦ᘱ䖜ᦒᡀਖа
ᩌ㍒⣦ᘱˈ㘼фGѪ൘SкᇊѹⲴ䉃䇽ˈᆳ㺘⽪ଚ⣦ᘱѪⴞⲴ⣦ᘱDŽ䰞仈а㡜ᱟራа㌫
ࡇⲴ㇇ᆀˈᆳሶԫࡍ⣦ᘱsi䖜ॆѪḀᴰ㓸⣦ᘱsfˈ֯ⴞⲴ䉃䇽Gᗇࡠ┑䏣DŽᇊѹᆖҐ䰞仈ᖒ
ᔿⲴа࣎⌅ᱟ䇙㌫㔏ሩOѝ⇿њ㇇ᆀᆖҐањ࠶・ⲴⴞḷᾲᘥDŽ⺞࠷ൠ䇢ˈሩOѝ⇿њ㇇ᆀ
oˈᆳਟቍ䈅ᆖҐⴞḷᾲᘥĀ㜭⭘Oሬ㠤ⴞⲴ⣦ᘱⲴ⣦ᘱ䳶ਸāDŽᖃ❦ウㄏ䘹ᤙଚањѪᖵ
ᆖҐⲴⴞḷ⣦ᘱˈ䎆Ҿᗵ享֯⭘↔ᆖҐࡠⲴ⸕䇶Ⲵ䰞仈≲䀓ಘⲴ䜘㔃ᶴˈֻྲˈྲ᷌䰞仈
≲䀓ಘᱟањmeans-ends㿴ࡂ㌫㔏ˈᆳⲴᐕ䗷〻ᱟ䙊䗷ᔪ・઼䀓ߣᆀⴞⲴˈ䛓ѸᡁԜᐼᵋᆖ
ҐⲴⴞḷᾲᘥਟԕᱟĀA㊫රⲴᆀⴞⲴᗵ享൘B㊫රⲴᆀⴞⲴѻࡽ䀓ߣⲴ㿴ࡂ⣦ᘱ䳶ਸDŽā
IF ᖵ䀓ߣⲴᆀⴞḷѻаѪ On(x,y)ˈᒦф
ᖵ䀓ߣⲴᆀⴞḷѻаѪ On(y,z)
ᓄ⭘ EBL ԕᆖҐᩌ㍒᧗ࡦਖањᇎ䐥кⲴ䰞仈൘Ҿˈཊᮠᛵߥлণ֯ሩᐼᵋⲴⴞḷᾲᘥ
ᔪ・䀓䟺ҏᴹᖃབྷⲴ䇑㇇䟿DŽֻྲˈ൘ỻ㊫䰞仈ѝᡁԜਟ㜭ᐼᵋᆖҐањⴞḷᾲᘥ˖Ā
A ሬ㠤ᴰՈ䀓Ⲵ⣦ᘱDŽāнᒨⲴᱟˈѪ䇱᰾ᡆ䀓䟺ѪӰѸ A ሬ㠤ᴰՈ䀓䴰㾱䀓䟺ަԆⲴՊ
ሬ㠤нྲ A Ⲵ䀓DŽ䘉 а㡜䴰㾱ᩌ ㍒␡ᓖⲴᤷ ᮠ㓗Ⲵ䇑㇇ 䟿DŽChien˄1993 ˅઼ Tadepalli
˄1990˅᧒㍒ҶĀ⎸ᶱāᆖҐ઼Ā໎䟿āᆖҐⲴᯩ⌅ˈަѝਁᔿ㿴ࡉ㻛⭘Ҿӗ⭏䜘࠶Ⲵǃ䘁
լⲴǃն᱃䇑㇇Ⲵ䀓䟺DŽо䀓䟺ᱟᆼ㖾ⲴᛵߥаṧˈаӋ㿴ࡉ㻛Ӿ䘉Ӌнᆼ㖾Ⲵ䀓䟺ѝᣭਆࠪ
ᶕDŽᖃ❦䘉ӋᆖࡠⲴ㿴ࡉՊ⭡Ҿ䀓䟺Ⲵнᆼᮤᙗ㘼н↓⺞DŽ㌫㔏䙊䗷ⴁ㿶൘ਾ㔝ᛵߥл㿴ࡉⲴ
ᙗ㜭ᶕ༴⨶↔䰞仈DŽྲ᷌㿴ࡉਾᶕࠪ䭉ˈ䛓ѸⲴ䀓䟺㻛໎䟿ൠᆼழԕ㾶ⴆᯠⲴᛵߥˈᒦф
Ӿ↔䀓䟺ѝᣭਆࠪᴤྭⲴ㿴ࡉDŽ
ަԆᴹ䇨ཊ⹄ウᐕ᧒㍒ҶสҾ䀓䟺ⲴᆖҐⲴᓄ⭘ԕ᭩䘋สҾᩌ㍒Ⲵ䰞仈≲䀓ಘⲴ᭸⦷
˄ֻྲ Mitchell 1981; Silver 1983; Shavlik 1990; Mahadevan et al.1993; Gervasio & Dejong 1994;
Dejong 1994˅DŽBennett & Dejong ˄1996˅⹄ウҶสҾ䀓䟺ᆖҐ൘ᵪಘӪ㿴ࡂ㌫㔏Ⲵᓄ⭘ˈަ
㌫㔏ѝ᧿䘠ަц⭼઼㹼ѪⲴ亶ฏ⨶䇪ᱟнᆼ㖾ⲴDŽDietterich & Flann ˄1995˅᧒㍒ҶสҾ䀓䟺
ᆖҐ઼໎ᕪᆖҐ˄㿱ㅜ 13 ㄐ˅Ⲵ䳶ᡀDŽMitchell & Thrun˄1993˅᧿䘠ҶሶањสҾ䀓䟺Ⲵ⾎
㓿㖁㔌ᆖҐᯩ⌅˄㿱ㅜ 12 ㄐ䇘䇪Ⲵ EBNN ㇇⌅˅ᓄ⭘ࡠ໎ᕪᆖҐ䰞仈ѝDŽ
11.5 ቅ㔉ૂ㺛ݻ䈱⢟
ᵜㄐⲴ㾱⛩वᤜ
x 㓟㋩Ⲵᖂ㓣ᆖҐᯩ⌅ራањٷ䇮ԕᤏਸ䇝㓳ᮠᦞˈо↔н਼ˈ㓟㋩Ⲵ࠶᷀ᆖҐ
ᯩ⌅ᩌራањٷ䇮ᤏਸᆖҐಘⲴݸ傼⸕䇶ᒦ㾶ⴆ䇝㓳ṧֻDŽӪ㊫㓿ᑨ֯⭘ݸ傼⸕
䇶ᤷሬᯠٷ䇮ⲴᖒᡀDŽᵜㄐ㘳ḕҶ㓟㋩Ⲵ࠶᷀ᆖҐᯩ⌅DŽлаㄐӻ㓽ᖂ㓣-࠶᷀ᆖ
ҐⲴ㔃ਸDŽ
x สҾ䀓䟺ⲴᆖҐᱟ࠶᷀ᆖҐⲴаᖒᔿˈަѝᆖҐಘ༴⨶⇿њᯠ䇝㓳ṧֻⲴᯩ⌅
ᱟ˄1˅᤹➗亶ฏ⨶䇪䀓䟺䈕ṧֻѝ㿲ሏࡠⲴⴞḷ٬ˈ˄2˅࠶᷀↔䀓䟺ԕ⺞ᇊ䀓
䟺ᡀ・Ⲵа㡜ᶑԦ˗˄3˅᭩䘋ަٷ䇮ԕਸᒦ䘉Ӌа㡜ᶑԦDŽ
x Prolog-EBG ᱟањสҾ䀓䟺ⲴᆖҐ㇇⌅ˈᆳ֯⭘а䱦 Horn ᆀਕᶕ㺘⽪ަ亶ฏ⨶䇪
઼ᆖࡠⲴٷ䇮DŽ൘ Prolog-EBG ѝˈ䀓䟺ণѪ Prolog 䇱᰾ˈ㘼Ӿ䀓䟺ѝᣭਆⲴٷ䇮
ᱟ↔䇱᰾ⲴᴰᕡࡽۿDŽѪ㔃᷌ˈ⭡ Prolog-EBG 䗃ࠪⲴٷ䇮Ӿަ亶ฏ⨶䇪ѝ╄㓾
⍮⭏DŽ
x ྲ Prolog-EBG 䘉ṧⲴ࠶᷀ᆖҐᯩ⌅ᔪ・ᴹ⭘Ⲵѝ䰤⢩ᖱѪ࠶᷀অ⤜䇝㓳ṧֻⲴ
ањ࢟᭸⭘DŽ䘉⭏ᡀ⢩ᖱⲴ࠶᷀䙄ᖴ㺕ݵҶྲਾੁՐ䘉ṧⲴᖂ㓣ᯩ⌅ѝสҾ
㔏䇑ᯩ⌅Ⲵѝ䰤⢩ᖱ⭏ᡀ˄ྲ䳀㯿অݳ⢩ᖱ˅DŽ
x 㲭❦ Prolog-EBG нՊӗ⭏㜭ᢙኅަ亶ฏ⨶䇪Ⲵ╄㓾䰝वⲴٷ䇮ˈަԆ╄㓾ᆖҐ䗷
〻ᴹ䘉њ㜭࣋DŽֻྲˈањवਜ਼ determination ᯝ䀰˄ྲĀഭ㉽⺞ᇊ䈝䀰ā˅Ⲵ亶
ฏ⨶䇪ਟ㻛⭘Ҿо䇝㓳ᮠᦞа䎧╄㓾᧘⨶䎵ࠪ亶ฏ⨶䇪Ⲵ╄㓾䰝वⲴٷ䇮DŽ
x ਟᓄ⭘↓⺞фᆼᮤⲴ亶ฏ⨶䇪Ⲵа㊫䟽㾱䰞仈Ѫབྷ⣦ᘱオ䰤ᩌ㍒Ⲵ䰞仈DŽྲ
Prodigy ઼ Soar 䘉ṧⲴ㌫㔏ᐢֻ⽪ҶสҾ䀓䟺ⲴᆖҐᯩ⌅Ⲵ᭸⭘ˈᆳԜ㠚ࣘ㧧ਆᴹ
᭸Ⲵᩌ㍒㿴ࡉԕ࣐䙏ਾ㔝Ⲵ䰞仈≲䀓DŽ
x 㲭❦สҾ䀓䟺ⲴᆖҐᯩ⌅ሩӪ㊫ᶕ䈤ᖸᴹ⭘ˈն㓟㋩Ⲵ╄㓾ᇎ⧠˄ྲ Prolog-
EBG˅ᴹа㕪⛩൘Ҿᆳ䗃ࠪⲴٷ䇮Ⲵ↓⺞ᙗਚ൘亶ฏ⨶䇪↓⺞ᰦ㜭؍䇱DŽ൘л
аㄐˈᡁԜ㘳ḕҶ㔃ਸᖂ㓣઼࠶᷀ᆖҐᯩ⌅Ⲵ䙄ᖴԕӾнᆼ㖾Ⲵ亶ฏ⨶䇪઼ᴹ䲀
䇝㓳ᮠᦞѝᴹ᭸ᆖҐDŽ
ᓄ⭘ᑖᴹᆼ㖾亶ฏ⨶䇪Ⲵᴰѕ㚳Ⲵቍ䈅ᱟ൘ᆖҐᩌ㍒᧗ࡦⲴ亶ฏˈᡆĀ࣐䙏āᆖҐDŽ⭡
Laird et al.(1986)ᨀࠪⲴ Soar ㌫㔏઼ Carbonell et al.˄1990˅᧿䘠Ⲵ Prodigy ㌫㔏ᱟ֯⭘สҾ䀓
䟺ⲴᆖҐԕᆖҐ䰞仈≲䀓Ⲵєњᴰᡀ⟏Ⲵ㌫㔏DŽ Rosenbloom & Laird(1986)䇘䇪Ҷ Soar ⲴᆖҐ
ᯩ⌅˄〠Ѫ chunking˅઼ަԆสҾ䀓䟺ᆖҐᯩ⌅ѻ䰤Ⲵ㍗ᇶ㚄㌫DŽᴰ䘁 Dietterich & Flann
˄1995˅᧒㍒Ҷ㔃ਸสҾ䀓䟺ⲴᆖҐ઼໎ᕪᆖҐԕᆖҐᩌ㍒᧗ࡦⲴᯩ⌅DŽ
㲭❦ᡁԜ䘉䟼Ⲵѫ㾱ⴞⲴᱟ⹄ウᵪಘᆖҐ㇇⌅ˈӽ䴰⌘ࡠሩӪ㊫ᆖҐⲴᇎ傼ᙗ⹄ウѪӪ
㊫ᆖҐᱟสҾ䀓䟺䘉а⥌ᜣᨀҶ᭟ᤱDŽֻྲˈAhn et al.˄1987˅઼ Qin et al.˄1992˅ᾲ䘠Ҷ
᭟ᤱӪ㊫ᓄ⭘สҾ䀓䟺ᆖҐ䗷〻䘉а᧘ᜣⲴ䇱ᦞDŽWisniewski & Medin˄1995˅᧿䘠ҶሩӪ㊫
ᆖҐⲴᇎ傼ᙗ⹄ウˈᆳᔪ䇞൘ݸ傼⸕䇶઼㿲ሏᮠᦞѻ䰤䘋㹼ѠᇼⲴӂ⭘ԕᖡ૽ᆖҐ䗷〻DŽ
Kotovsky & Baillargeon˄1994˅᧿䘠Ⲵᇎ傼䈤᰾ণ֯ 11 њᴸབྷⲴႤݯ൘ަᆖҐᰦҏᱟสҾަ
ݸ傼⸕䇶ⲴDŽ
11.1 㘳 㲁 ᆖ Ґ 䰞 仈 Ѫ ᆖ Ґ ⴞ ḷ ᾲ ᘥ Ā ት տ ൘ ਼ а ᡯ ቻ Ⲵ є њ Ӫ ˈ ā 㺘 ⽪ Ѫ 䉃 䇽
HouseMates(x,y)DŽл䶒Ѫ↔ᾲᘥⲴањ↓ֻ˖
HouseMates(Joe, Sue)
Person(Joe) Person(Sue)
Age(Joe, 8) Age(Sue, 6)
HouseMates(x, y)ĕInSameFamily(x, y)
HouseMates(x, y) ĕFraternityBrothers(x, y)
InSameFamily(x, y) ĕMarried(x, y)
Youngster(x) ĕAget(x,a)ġLessThan(a,10)
ᓄ⭘ Prolog-EBG ㇇⌅ࡠ⌋ॆк䘠ᇎֻⲴԫ࣑ѝˈ֯⭘к䶒Ⲵ亶ฏ⨶䇪DŽ⺞࠷ൠ䇢˖
㓟㋩Ⲵᖂ㓣ᆖҐᯩ⌅䙊䗷൘䇝㓳ṧֻѝራ㓿傼ॆⲴ㿴ᖻᶕᖒᡀа㡜ٷ䇮DŽ㓟㋩Ⲵ࠶᷀ᯩ
⌅֯⭘ݸ傼⸕䇶╄㓾᧘ሬа㡜ٷ䇮DŽᵜㄐ㘳㲁ሶᖂ㓣઼࠶᷀Ⲵᵪࡦ㔃ਸ䎧ᶕⲴᯩ⌅ˈԕ㧧ᗇє
㘵ⲴՈ⛩˖ᴹݸ傼⸕䇶ᰦᴤ儈Ⲵ⌋ॆ㋮ᓖˈ઼䎆䇝㓳ᮠᦞݻᴽݸ傼⸕䇶Ⲵн䏣DŽᡰᗇࡠⲴ㔃
ਸⲴᯩ⌅∄㓟㋩Ⲵᖂ㓣ᆖҐᯩ⌅઼㓟㋩Ⲵ࠶᷀ᆖҐᯩ⌅ᙗ㜭䜭㾱儈DŽᵜㄐ㘳㲁Ⲵᖂ㓣-࠶᷀ᆖ
Ґᯩ⌅਼ᰦสҾㅖਧ㺘⽪઼Ӫᐕ⾎㓿㖁㔌㺘⽪DŽ
12.1 ࣞᵰ
൘ࡽࠐㄐᡁԜᐢ㓿㿱ࡠҶє㊫රⲴᵪಘᆖҐ˖ᖂ㓣ᆖҐ઼࠶᷀ᆖҐDŽᖂ㓣ᯩ⌅ྲߣㆆṁ
ᖂ㓣઼⾎㓿㖁㔌৽ੁՐㅹˈᆳራᤏਸ䇝㓳ᮠᦞⲴа㡜ٷ䇮DŽ࠶᷀Ⲵᯩ⌅ྲ Prolog-EBGˈ
ᆳራᤏਸݸ傼⸕䇶Ⲵа㡜ٷ䇮ˈ਼ᰦ֯ᆳ㾶ⴆ䇝㓳ᮠᦞDŽ䘉єᆖҐ㤳රᡰสҾⲴሩᆖҐࡠ
Ⲵٷ䇮Ⲵ䇪䇱ᯩ⌅ᴹṩᵜⲴн਼ˈഐ↔ˈՈ㕪⛩ӂѪ㺕ݵDŽሶᆳԜ㔃ਸ䎧ᶕᴹਟ㜭ᗇࡠᴤᕪᴹ
࣋ⲴᆖҐᯩ⌅DŽ
㓟㋩Ⲵ࠶᷀ᆖҐᯩ⌅Ո⛩൘Ҿˈਟ⭘ݸ傼⸕䇶Ӿ䖳ቁⲴᮠᦞѝᴤ㋮⺞ൠ⌋ॆԕᕅሬᆖҐˈ
❦㘼ᖃݸ傼⸕䇶н↓⺞ᡆн䏣ᰦˈ䘉аᯩ⌅ਟ㜭Պ䘋↗ޕ䙄DŽ㓟㋩Ⲵᖂ㓣ᯩ⌅ާᴹⲴՈ⛩ᱟн
䴰㾱ᱮᔿⲴݸ傼⸕䇶ˈᒦфѫ㾱สҾ䇝㓳ᮠᦞᆖҐࡠ㿴ᖻDŽ❦㘼ˈ㤕䇝㓳ᮠᦞн䏣ᰦᆳ㜭Պཡ
䍕ˈᒦфՊ㻛ަѝ䳀ᔿⲴᖂ㓣ٿ㖞ᡰ䈟ሬˈ㘼ᖂ㓣ٿ㖞ᱟӾ㿲ሏᮠᦞѝ⌋ॆᡰᗵ䴰ⲴDŽ㺘 12-1
ᾲ䘠Ҷє㘵Ⲵӂ㺕ⲴՈ⛩઼㕪䲧DŽᵜㄐ㘳㲁Ⲵ䰞仈ᱟᘾṧሶҼ㘵㔃ਸᡀањঅ⤜Ⲵ㇇⌅ˈԕ㧧
ᗇᆳԜ㠚ⲴՈ⛩DŽ
ᖂ㓣઼࠶᷀ᆖҐᯩ⌅ѻ䰤Ⲵн਼ਟӾᆳԜሩᆖҐࡠⲴٷ䇮䘋㹼Ⲵ䇪䇱˄justification˅Ⲵᙗ
䍘ѝⴻࠪDŽ⭡㓟㋩Ⲵ࠶᷀ᆖҐ˄ྲ Prolog-EBG˅䗃ࠪⲴٷ䇮ᢗ㹼Ⲵᱟ䙫䗁˄logical˅䇪䇱˖䗃
ࠪⲴٷ䇮Ӿ亶ฏ⨶䇪઼䇝㓳ᮠᦞѝ╄㓾⍮⭏DŽሩ㓟㋩Ⲵᖂ㓣ᆖҐᯩ⌅˄ྲ৽ੁՐ˅䗃ࠪⲴٷ
䇮ᢗ㹼Ⲵᱟ㔏䇑䇪䇱˖䗃ࠪⲴٷ䇮Ӿ㔏䇑䇪ᦞѝ⍮⭏ˈᆳ䈤᰾䇝㓳ṧᵜ䏣ཏབྷӾ㘼ਟ㜭ԓ㺘ṧ
ֻⲴส߶࠶ᐳDŽᖂ㓣Ⲵ㔏䇑䇪䇱൘ㅜ 7 ㄐ䇘䇪Ⲵ PAC ᆖҐѝᐢ㻛Რൠ䱀᰾DŽ
ᰒ❦࠶᷀Ⲵᯩ⌅ᨀࠪ䙫䗁䇪䇱Ⲵٷ䇮ˈ㘼ᖂ㓣ᯩ⌅ᨀ㔏䇑䇪䇱Ⲵٷ䇮ˈᖸᇩ᱃ⴻࠪѪӰ
Ѹਟԕሶє㘵㔃ਸ䎧ᶕDŽ䙫䗁Ⲵ䇪䇱ⲴᕪᓖਚᖃҾᆳԜᡰสҾⲴٷᇊᡆݸ傼⸕䇶DŽྲ᷌ݸ傼
⸕䇶н↓⺞ᡆнਟᗇˈ䙫䗁䇪䇱ᱟнਟؑⲴфᰐ࣋ⲴDŽ㔏䇑䇪䇱Ⲵᕪᓖ䎆ҾᆳԜสҾⲴᮠᦞ
઼㔏䇑ٷᇊDŽᖃส߶࠶ᐳнਟؑᡆᮠᦞ〰㕪ᰦˈ㔏䇑䇪䇱ҏᱟнਟؑфᰐ࣋ⲴDŽㆰ㘼䀰ѻˈє
ᯩ⌅䪸ሩн਼Ⲵ㊫රⲴ䰞仈ᰦᴹ᭸DŽ䙊䗷є㘵Ⲵ㔃ਸˈᴹᵋᔰਁࠪᴤ䙊⭘ⲴᆖҐᯩ⌅ˈਟ
ԕ㾶ⴆ䖳ᒯⲴᆖҐԫ࣑DŽ
㺘 12-1 㓟㋩Ⲵ࠶᷀ᆖҐ઼㓟㋩ᖂ㓣ᆖҐⲴ∄䖳
ᖂ㓣ᆖҐ ࠶᷀ᆖҐ
ⴞḷ ᤏਸᮠᦞⲴٷ䇮 ᤏਸ亶ฏ⨶䇪Ⲵٷ䇮
䇪䇱 㔏䇑᧘⨶ ╄㓾᧘⨶
Ո⛩ 䴰㾱ᖸቁݸ傼⸕䇶 Ӿ〰㕪ⲴᮠᦞѝᆖҐ
㕪䲧 〰㕪Ⲵᮠᦞˈн↓⺞Ⲵٿ㖞 нᆼ㖾Ⲵ亶ฏ⨶䇪
插图——原书页码:336
Inductive learning: ᖂ㓣ᆖҐ
Plentiful data: ѠᇼⲴᮠᦞ
No prior knowledge:ᰐݸ傼⸕䇶
Analytical learning: ࠶᷀ᆖҐ
Perfect prior knowledge:ᆼ㖾Ⲵݸ傼⸕䇶
Scarce data: 〰㕪Ⲵᮠᦞ
മ 12-1 ᆖҐԫ࣑Ⲵ࠶ᐳ㤳തDŽ
൘ᴰᐖㄟˈ⋑ᴹਟ⭘Ⲵݸ傼⸕䇶ˈഐ↔䴰㾱㓟㋩Ⲵᖂ㓣ᆖҐᯩ⌅ԕ৺䖳儈Ⲵṧᵜ༽ᵲᓖDŽ൘ᴰਣ
ㄟˈᴹᆼ㖾Ⲵ亶ฏ⨶䇪ˈਟԕ֯⭘ྲ Prolog-EBG 䘉ṧⲴ㓟㋩࠶᷀ᯩ⌅DŽᴤཊⲴᇎ䱵䰞仈սҾ䘉єњᶱ
ㄟѻ䰤DŽ
മ 12-1 ᾲ䘠ҶᆖҐ䰞仈Ⲵ࠶ᐳ㤳തˈᆳ䲿⵰ਟ㧧ᗇⲴݸ傼⸕䇶઼䇝㓳ᮠᦞн਼㘼ਈॆDŽ
൘ањᶱㄟˈᴹབྷ䟿Ⲵ䇝㓳ᮠᦞˈն⋑ᴹݸ傼⸕䇶DŽ൘ਖаᶱㄟˈᴹᖸᕪⲴݸ傼⸕䇶ˈն䇝㓳
ᮠᦞᖸቁDŽཊᮠᇎ䱵ᆖҐ䰞仈սҾ䘉єњᶱㄟѻ䰤DŽֻྲˈ࠶᷀५⯇䇠ᖅⲴᮠᦞᓃԕᆖҐĀ⭘
⋫⯇⇥ x ∄⋫⯇⇥ y ᴤᴹ᭸Ⲵ⯵⯷āˈ䙊ᑨਟԕᔰҾ䘁լⲴݸ傼⸕䇶˄ྲ⯮⯵ѝ൘Ⲵ
ഐ᷌ᵪࡦⲴᇊᙗ⁑ර˅ˈ∄ྲ䇔ᇊᛓ㘵Ⲵփ∄ԆⲴဃᴤޣDŽ㊫լൠˈ൘࠶᷀ањ㛑⾘ᐲ
൪ᮠᦞᓃԕᆖҐⴞḷᾲᘥĀ㛑⾘٬൘ਾ 10 њᴸՊ㘫⮚Ⲵޜਨāѝˈྲ᷌ᐢᴹҶ㓿⍾ᆖⲴབྷᾲ
⸕䇶ˈਟԕᨀࠪޜਨⲴᙫ࡙⏖∄ޜਨḷᘇⲴ仌㢢ᴤޣDŽ൘䘉є䰞仈ѝˈᡁԜⲴݸ傼⸕䇶ᱟ
нᆼᮤⲴˈնᱮ❦ˈᆳᴹࣙҾ४࠶઼ޣнⲴޣ⢩ᖱDŽ
ᵜㄐ㘳㲁Ⲵ䰞仈ᱟ˖ĀᡁԜਟԕ䇮䇑ࠪᘾṧⲴ㇇⌅ˈ֯⭘䘁լⲴݸ傼⸕䇶㔃ਸਟ⭘ᮠᦞᶕ
ᖒᡀа㡜ٷ䇮˛ā⌘ˈণ֯൘֯⭘㓟㋩Ⲵᖂ㓣ᆖҐ㇇⌅ᰦˈӽᴹᵪՊสҾ⢩ᇊᆖҐԫ࣑Ⲵݸ
傼⸕䇶ᶕ䘹ᤙ䇮䇑ᯩṸDŽֻྲˈᖃᓄ⭘৽ੁՐᶕ䀓ߣ䈝丣䇶࡛䘉ṧⲴ䰞仈ᰦˈ䇮䇑㘵ᗵ享䘹
ᤙ䗃઼ޕ䗃ࠪᮠᦞⲴ㕆⸱ᯩᔿǃ൘ởᓖл䱽ѝ㻛ᴰሿॆⲴ䈟ᐞ࠭ᮠǃ䳀㯿অⲴݳᮠ䟿ǃ㖁㔌Ⲵ
ᤃᢁ㔃ᶴǃᆖҐ䙏⦷઼ߢ䟿ㅹDŽ൘ڊ䘉Ӌ䘹ᤙᰦˈ䇮䇑㘵ਟԕሶ亶ฏ⢩ᇊⲴ⸕䇶፼ࡠޕᆖҐ㇇
⌅ѝDŽ❦㘼㔃᷌ӽ❦ᱟ㓟㋩Ⲵᖂ㓣㇇⌅৽ੁՐⲴањᇎ⧠ˈ⭡䇮䇑㘵⢩↺ॆਾ䪸ሩ䈝丣䇶࡛
ԫ࣑DŽᡁԜⲴᝏޤ䏓Ⲵн൘Ҿ↔ˈ㘼൘Ҿањ㌫㔏㜭ሶݸ傼⸕䇶ѪᱮᔿⲴ䗃ޕ㔉ᆖҐಘˈ䇝
㓳ᮠᦞҏ਼ṧѪᱮᔿ䗃ޕDŽ䘉ṧᆳԜӽѪ䙊⭘Ⲵ㇇⌅ˈն࡙⭘Ҷ亶ฏ⢩ᇊⲴ⸕䇶DŽㆰ㾱ൠᾲ
ᤜалˈᡁԜᝏޤ䏓Ⲵᱟ֯⭘ᱮᔿ䗃Ⲵޕ亶ฏ⸕ޣ䇶Ⲵ亶ฏᰐޣ㇇⌅DŽ
ሩҾ㔃ਸҶᖂ㓣઼࠶᷀ᆖҐⲴн਼ᯩ⌅ˈᓄ֯⭘ӰѸṧⲴ߶ࡉᶕ∄䖳ᆳԜ˛⭡ҾᆖҐಘ
а㡜н㜭亴⸕ݸ䚃亶ฏ⨶䇪઼䇝㓳ᮠᦞⲴ䍘䟿DŽᡁԜᝏޤ䏓Ⲵᱟ㜭ሩമ 12-1 ᮤњ䰞仈㌫ࡇ䜭
ਟⲴа㡜ᯩ⌅DŽ䘉ṧⲴᆖҐᯩ⌅ᓄާᴹԕлⲴ⢩↺ᙗ˖
x ྲ᷌⋑ᴹ亶ฏ⨶䇪ˈᆳ㠣ቁ㜭ۿ㓟㋩Ⲵᖂ㓣ᯩ⌅аṧᴹ᭸ᆖҐDŽ
x ྲ᷌ᴹᆼ㖾Ⲵ亶ฏ⨶䇪ˈᆳ㠣ቁ㜭ۿ㓟㋩Ⲵ࠶᷀ᯩ⌅ṧᴹ᭸ᆖҐDŽ
x ྲ᷌亶ฏ⨶䇪઼䇝㓳ᮠᦞ䜭нᆼ㖾ˈᆳᓄ㜭㔃ਸє㘵Ⲵ䮯༴ˈ∄অ㓟Ⲵᖂ㓣ᡆ࠶
᷀ᯩ⌅Ⲵᙗ㜭䜭㾱ྭDŽ
x ᆳᓄ㜭༴⨶䇝㓳ᮠᦞѝᵚ⸕〻ᓖⲴᐞ䭉DŽ
x ᆳᓄ㜭༴⨶亶ฏ⨶䇪ѝᵚ⸕〻ᓖⲴᐞ䭉DŽ
⌘䘉䟼ࡇࠪⲴᵏᵋⴞḷᖸ䳮䗮ࡠDŽֻྲˈ༴⨶䇝㓳ᮠᦞѝⲴᐞ䭉ˈণ֯൘สҾ㔏䇑Ⲵᖂ
㓣ᯩ⌅ѝˈྲ᷌⋑ᴹḀӋݸ傼⸕䇶઼ሩᐞ䭉࠶ᐳⲴٷᇊˈ䘉ӽᱟ٬ᗇ⹄ウⲴ䰞仈DŽ㔃ਸᖂ㓣઼
࠶᷀ᆖҐⲴᯩ⌅ᱟᖃࡽ⍫䏳Ⲵ⹄ウ亶ฏDŽ㲭❦к䶒ࡇࠪⲴᱟᡁԜᐼᵋ㇇⌅㜭䗮ࡠⲴ㖾ྭᙗ䍘ˈ
ⴞࡽ⋑ᴹ㇇⌅㜭ԕᆼޘа㡜ॆⲴᯩᔿ┑䏣ᡰᴹ䘉Ӌ㓖ᶏDŽ
ла㢲ሩ㔃ਸᖂ㓣-࠶᷀ᆖҐⲴ䰞仈ࠪҶᴤ䈖㓶Ⲵ䇘䇪DŽਾ䶒ࠐ㢲᧿䘠Ҷ 3 н਼Ⲵ䙄
ᖴˈ㔃ਸ䘁լⲴݸ傼⸕䇶઼ਟ⭘ᮠᦞᶕᤷሬᆖҐಘᩌ㍒ਸ䘲Ⲵٷ䇮DŽ⇿䙄ᖴ䜭ᐢ൘ཊњ䰞仈
亶ฏѝᱮ⽪ࠪᴹ䎵ࠪ㓟ᖂ㓣ᯩ⌅Ⲵᙗ㜭DŽѪᯩ∄ׯ䖳ˈᡁԜ֯⭘਼аֻᆀᶕ䈤᰾ 3 䙄ᖴDŽ
12.2 ᆜҖⲺᖈ㓩-࠼᷆䙊ᖺ
12.2.1 ᆜҖ䰤从
ᾲ㘼䀰ѻˈᵜㄐ㘳㲁ⲴᆖҐ䰞仈Ѫ˖
ᐢ⸕˖
x ањ䇝㓳ṧֻ䳶ਸ Dˈਟ㜭वਜ਼ᐞ䭉
x ањ亶ฏ⨶䇪 Bˈਟ㜭वਜ਼ᐞ䭉
x ى䘹ٷ䇮Ⲵオ䰤 H
≲䀓˖
x ањᴰྭൠᤏਸ䇝㓳ṧ઼ֻ亶ฏ⨶䇪Ⲵٷ䇮
Āᴰྭൠᤏਸ䇝㓳ṧ઼ֻ亶ฏ⨶䇪ā䘉ਕ䈍⺞࠷ਜ਼ѹᱟӰѸ˛ᡆ㘵䈤ˈᱟՊ䘹ᤙањᤏ
ਸᮠᦞ〻ᓖ䖳ྭ㘼ᤏਸ⨶䇪䖳ᐞⲴٷ䇮ˈᡆ৽ѻ˛ѪҶᴤ㋮⺞䎧㿱ˈ䴰㾱ᇊѹሩᓄᮠᦞ઼ሩᓄ
Ҿ亶ฏ⨶䇪Ⲵٷ䇮䭉䈟⦷ᓖ䟿ˈ❦ਾ⭘䘉Ӌ䭉䈟⦷ᶕ㺘⽪䘉њ䰞仈DŽഎᗶㅜ 5 ㄐѝerrorD(h)ᇊ
ѹѪDѝ㻛h䈟࠶㊫Ⲵṧֻᡰঐ∄ֻDŽਟᇊѹhޣҾ亶ฏ⨶䇪BⲴ䭉䈟⦷errorB(h)ѪˈhоB൘࠶㊫
ањ䲿ᵪᣭਆᇎֻᰦна㠤Ⲵᾲ⦷DŽ᧕лᶕቡਟቍ䈅⭘䘉Ӌ䭉䈟⦷Ⲵᖒᔿ⭫ᡰᐼᵋⲴ䗃ࠪٷ
䇮DŽֻྲˈᡁԜਟԕ㾱≲ٷ䇮֯к䘠䭉䈟⦷ⲴḀ㔬ਸᓖ䟿ᴰሿॆˈྲ˖
㲭❦㋇ⴻ䎧ᶕ䘉ᖸਸ⨶ˈն䘈нᾊᘾṧ⺞ᇊkD઼kBⲴ٬ˈԕᤷᇊᤏਸᮠᦞ઼ᤏਸ⨶䇪є
㘵Ⲵሩ䟽㾱〻ᓖDŽྲ᷌ᴹ䶎ᑨᐞⲴ⨶䇪ˈতᴹབྷ䟿ਟ䶐ᮠᦞˈᴰྭ֯errorD(h)Ⲵᵳ٬ᴤབྷDŽ
ྲ᷌ᴹᖸᕪⲴ⨶䇪ˈ㘼ᮠᦞṧᵜᖸሿфᆈ൘བྷ䟿ಚ༠ˈᢺerrorB(h)Ⲵᵳ٬໎བྷՊᗇࡠᴰྭⲴ㔃
᷌DŽᖃ❦ྲ᷌ᆖҐಘ亴ݸн⸕䚃亶ฏ⨶䇪઼䇝㓳ᮠᦞⲴ䍘䟿ˈᆳቡнᾊ䈕ᘾṧѪ䘉є䜘࠶䭉
䈟⦷࣐ᵳDŽ
ᘾṧ⺞ᇊݸ傼⸕䇶઼ᮠᦞᵳ٬䘉а䰞仈ˈਖа䀓ߣᯩ⌅ᱟ֯⭘䍍ਦᯟⲴ㿲⛩ᶕ㘳㲁DŽഎ
ᗶалㅜ 6 ㄐˈ䍍ਦᯟᇊᖻ᧿䘠Ҷᘾṧ䇑㇇㔉ᇊ䇝㓳ᮠᦞ D ᰦٷ䇮 h Ⲵਾ傼ᾲ⦷ P(h|D)DŽ⺞࠷
ൠ䇢ˈ䍍ਦᯟᇊᖻ䇑㇇↔ਾ傼ᾲ⦷ᱟสҾ㿲ሏࡠⲴᮠᦞ D ԕ৺ݸ傼⸕䇶Ⲵˈԕ P(h)ǃP(D)઼
P(D|h)Ⲵᖒᔿ㺘⽪DŽഐ↔ᡁԜਟᢺ P(h)ǃP(D)઼ P(D|h)ⴻᱟḀᖒᔿⲴ㛼Ჟ⸕䇶ᡆ亶ฏ⨶
䇪ˈ㘼фਟᢺ䍍ਦᯟ⨶䇪ⴻᡀаѪ亶ฏ⨶䇪࣐ᵳⲴᯩ⌅ˈᆳо㿲ሏࡠⲴᮠᦞ D а䎧ˈ䍻Ҹ h
Ⲵਾ傼ᾲ⦷Ѫ P(h|D)DŽ᤹➗䍍ਦᯟⲴ㿲⛩ˈᡰ䘹ᤙⲴٷ䇮ᓄѪਾ傼ᾲ⦷ѝᴰབྷⲴањˈᒦф䍍
ਦᯟޜᔿᨀҶѪ↔ݸ傼⸕䇶઼㿲ሏࡠᮠᦞⲴ䍑⥞࣐ᵳⲴ㢟ྭᯩ⌅DŽнᒨⲴᱟˈ䍍ਦᯟޜᔿ䳀
ਜ਼ٷᇊҶᤕᴹޣҾ P(h)ǃP(D)઼ P(D|h)ᾲ⦷࠶ᐳⲴᆼ㖾Ⲵ⸕䇶DŽᖃ䘉Ӌ䟿ਚᱟ䘁լᐢ⸕ᰦˈঅ
⤜䍍ਦᯟޜᔿ⋑ᴹ㿴ᇊྲօሶަо㿲ሏᮠᦞ㔃ਸ䎧ᶕDŽ˄൘↔ᛵߥлаᯩ⌅ᱟٷᇊᴹ P(h)ˈ
P(D)઼ P(D|h)ѻкⲴݸ傼ᾲ⦷࠶ᐳˈ❦㘼ਾ䇑㇇ਾ傼ᾲ⦷ P(h|D)Ⲵᵏᵋ٬DŽ❦㘼䘉㾱≲ᴹ
P(h)ˈP(D)઼ P(D|h)ѻкⲴݸ傼࠶ᐳᯩ䶒Ⲵ䱴࣐⸕䇶ˈഐ↔ᒦ⋑ᴹⵏ↓䀓ߣ↔䰞仈DŽ˅
ᖃ㘳㲁⢩ᇊ㇇⌅ᰦˈᡁԜՊ⅑㘳㲁Āᴰ֣āᤏਸٷ䇮઼ᮠᦞᱟӰѸਜ਼ѹDŽ⧠൘ˈᡁԜਚ
ᱟㆰঅൠ〠ᆖҐ䰞仈ᱟѪҶ֯ٷ䇮൘ᮠᦞ઼亶ฏ⨶䇪к䭉䈟⦷ⲴḀ㔬ਸᓖ䟿ᴰሿॆDŽ
12.2.2 ٽ䇴グ䰪ᩒ㍘
ྲօሶ亶ฏ⨶䇪઼䇝㓳ᮠᦞᴰྭൠ㔃ਸ䎧ᶕˈԕ䲀ࡦਟ᧕ਇٷ䇮Ⲵᩌ㍒˛䘉൘ᵪಘᆖҐѝ
ӽᱟᖵ⹄ウⲴ䰞仈DŽᵜㄐ㘳ሏҶࠐᐢᨀࠪⲴᯩ⌅ˈަѝ䇨ཊ㾱ሩᐢ䇘䇪䗷Ⲵᖂ㓣ᯩ⌅˄ྲ৽
ੁՐˈFOIL˅䘋㹼ᢙኅDŽ
ѪҶ䀓ਟ㜭䙄ᖴⲴ㤳തˈа࣎⌅ᱟഎࡠࡽ䶒ሩᆖҐⲴⴻ⌅ˈণሶަⴻᱟаᩌ㍒ཊњ
ਟ䘹ٷ䇮オ䰤Ⲵԫ࣑DŽѪҶሶབྷཊᮠᆖҐԫ࣑⭫Ѫᩌ㍒㇇⌅ˈ䴰㾱ᇊѹᖵᩌ㍒Ⲵٷ䇮オ䰤
Hˈᩌ㍒Ⲵᔰ⛩ࡍٷ䇮h0ˈᇊѹঅњᩌ㍒↕Ⲵᩌ㍒㇇ᆀ䳶ਸOˈԕ৺ᤷᇊᩌ㍒ⴞḷⲴⴞⲴ
ࡔᦞGDŽᵜ䰤ѝ᧒㍒Ҷ 3 ᯩ⌅֯⭘ݸ傼⸕䇶ᶕ᭩ਈ㓟ᖂ㓣ᯩ⌅ѝᢗ㹼Ⲵᩌ㍒DŽ
x ֯⭘ݸ傼⸕䇶᧘ሬࠪᩌ㍒䎧↕Ⲵࡍٷ䇮DŽ⭘䘉ᯩ⌅ˈ亶ฏ⨶䇪B㻛⭘Ҿᔪ・а
њоBа㠤Ⲵࡍٷ䇮h0DŽ❦ਾԕ䘉њࡍٷ䇮h0Ѫ䎧⛩ᓄ⭘ḷ߶ᖂ㓣ᯩ⌅DŽֻ
ྲˈл䶒᧿䘠ⲴKBNN㌫㔏ᱟ᤹䘉ᯩ⌅ᆖҐӪᐕ⾎㓿㖁㔌ⲴDŽᆳ֯⭘ݸ傼⸕䇶ᶕ
䇮䇑ࡍ㖁㔌Ⲵӂ㚄㔃ᶴ઼ᵳ٬ˈ䘉ṧˈ↔ࡍ㖁㔌о㔉ᇊⲴ亶ฏ⨶䇪ᆼޘа
㠤DŽ❦ਾ↔ࡍ㖁㔌ٷ䇮֯⭘৽ੁՐ㇇⌅઼䇝㓳ᮠᦞ㻛ᖂ㓣ൠ㋮ॆDŽӾањо
亶ฏ⨶䇪а㠤Ⲵٷ䇮ᔰᩌ㍒ˈ֯ᗇᴰ㓸䗃ࠪٷ䇮ᴤᴹਟ㜭ᤏਸ↔⨶䇪DŽ
x ֯⭘ݸ傼⸕䇶ᶕ᭩ਈٷ䇮オ䰤ᩌ㍒ⲴⴞḷDŽ൘䘉ᯩ⌅ѝˈⴞⲴࡔᦞ G 㻛؞᭩ˈ
ԕ㾱≲䗃ࠪٷ䇮ᤏਸ䇝㓳ṧֻⲴ਼ᰦҏᤏਸ亶ฏ⨶䇪DŽֻྲˈл䶒᧿䘠Ⲵ EBNN
㌫㔏ԕ䘉ᯩ⌅ᆖҐ⾎㓿㖁㔌DŽ⾎㓿㖁㔌Ⲵᖂ㓣ᆖҐᢗ㹼ởᓖл䱽ᶕ֯㖁㔌൘䇝
㓳ᮠᦞкⲴ䈟ᐞᒣᯩᴰሿॆˈ㘼 EBNN ѝᢗ㹼ởᓖл䱽ᶕՈॆਖањࡔᦞDŽ䘉њ
؞᭩Ⲵࡔᦞवਜ਼ањ䱴࣐亩ˈᆳ㺑䟿ҶᆖҐࡠⲴ㖁㔌ሩҾ亶ฏ⨶䇪Ⲵ䈟ᐞDŽ
x ֯⭘ݸ傼⸕䇶᭩ਈਟ⭘Ⲵᩌ㍒↕DŽ൘↔ᯩ⌅ѝˈ亶ฏ⨶䇪؞᭩Ҷᩌ㍒㇇ᆀ䳶ਸ
ODŽֻྲˈл䶒᧿䘠Ⲵ FOCL ㌫㔏ԕ䘉ᯩ⌅ᆖҐ Horn ᆀਕ䳶DŽᆳสҾᖂ㓣㌫㔏
FOILDŽFOIL ൘ਟ㜭Ⲵ Horn ᆀਕオ䰤кᢗ㹼䍚ႚᩌ㍒ˈ⇿↕䙊䗷࣐ޕањᯠ᮷ᆇ
ᶕ↓؞ᖃࡽٷ䇮DŽFOCL ൘ٷ↓؞䇮ѝ֯⭘亶ฏ⨶䇪ᶕᢙኅਟ⭘Ⲵ᮷ᆇ䳶ਸDŽᆳݱ
䇨൘অњᩌ㍒↕ѝ࣐ޕཊњ᮷ᆇˈਚ㾱ᆳԜ㜭⭡亶ฏ⨶䇪؍䇱ަ↓⺞ᙗDŽԕ䘉
ᯩᔿˈFOCL ൘ٷ䇮オ䰤ѝ〫ࣘа↕ᖃҾ֯⭘ᶕⲴ㇇⌅〫ࣘཊ↕DŽ䘉ӋĀᆿ〫
ࣘā˄macro-moves˅ਟᶱབྷൠ᭩ਈᩌ㍒Ⲵᯩੁˈ䘉ṧᴰ㓸Ⲵоᮠᦞа㠤Ⲵٷ䇮о
ਚ֯⭘ᖂ㓣ᩌ㍒↕ᰦࡠⲴٷ䇮н਼DŽ
л䶒ࠐ㢲⅑ӻ㓽Ҷ䘉ࠐᯩ⌅DŽ
12.3 ֵ⭞ݾ僂⸛䇼ᗍࡦࡓခٽ䇴
а֯⭘ݸ傼⸕䇶Ⲵᯩ⌅ᱟˈሶٷ䇮ࡍॆѪᆼ㖾ᤏਸ亶ฏ⨶䇪ˈ❦ਾ᤹➗䴰㾱ᖂ㓣ൠ㋮
ॆ↔ࡍٷ䇮ԕᤏਸ䇝㓳ᮠᦞDŽ䘉ᯩ⌅㻛⭘Ҿ KBANN˄Knowledge-Based Artificial Neural
NetworkˈสҾ⸕䇶ⲴӪᐕ⾎㓿㖁㔌˅㇇⌅ѝDŽ൘ KBANN ѝˈ俆ݸᔪ・ҶањࡍⲴ㖁㔌DŽ
ሩ⇿њਟ㜭ᇎֻˈ㖁㔌䍻ҸᆳⲴ࠶㊫ㅹҾ亶ฏ⨶䇪䍻ҸⲴ࠶㊫DŽ❦ਾᓄ⭘Ҷ৽ੁՐ㇇⌅ᶕ䈳
ᮤࡍ㖁㔌ˈ֯ަᤏਸ䇝㓳ṧֻDŽ
ᖸᇩ᱃ⴻࠪˈ䈕ᢰᵟⲴࣘᵪ൘Ҿ˖ྲ᷌亶ฏ⨶䇪ᱟ↓⺞Ⲵˈࡍٷ䇮ሶ↓⺞࠶㊫ᡰᴹ䇝㓳
ṧֻˈ㘼ᰐ䴰ሩަ↓؞DŽ❦㘼ˈྲ᷌ࡍٷ䇮н㜭ᆼ㖾ൠ࠶㊫䇝㓳ṧֻˈ䛓Ѹᆳ䴰㾱㻛ᖂ㓣
㋮ॆˈԕ᭩䘋ަ൘䇝㓳ṧֻкⲴᤏਸᓖDŽഎᗶ൘㓟㋩ᖂ㓣Ⲵ৽ੁՐ㇇⌅ѝˈᵳ٬а㡜㻛ࡍ
ॆѪሿⲴ䲿ᵪ٬DŽKBANN 㛼ਾⲴⴤ㿲ਜ਼ѹ൘Ҿˈণ֯亶ฏ⨶䇪ᱟ䘁լ↓⺞Ⲵˈሶ㖁㔌ࡍॆ
Ѫᤏਸ亶ฏ⨶䇪ˈ∄ࡍॆѪ䲿ᵪᵳ٬ᴹᴤྭⲴ䘁լᔰㄟDŽ䘉ᓄ䈕ՊᗇࡠᴹᴤྭⲴ⌋ॆ㋮ᓖⲴ
ᴰ㓸ٷ䇮DŽ
12.3.1 KBANN ㇍⌋
ᐢ⸕˖
x а㓴䇝㓳ṧֻ
x ⭡䶎䙂ᖂભ仈ර Horn ᆀਕ㓴ᡀⲴ亶ฏ⨶䇪
≲䀓˖
x ањᤏਸ䇝㓳ṧֻⲴˈ㻛亶ฏ⨶䇪ٿ㖞ⲴӪᐕ⾎㓿㖁㔌
㺘 12-2KBANN ㇇⌅
KBANN(Domain_Theory, Training_Examples)
Domain_Theory: 䶎䙂ᖂભ仈ර Horn ᆀਕ䳶ਸ
Training_Examples:ⴞḷ࠭ᮠⲴ<input, output>ሩⲴ䳶ਸ
࠶᷀↕˖ࡋᔪањㅹԧҾ亶ฏ⨶䇪Ⲵࡍ㖁㔌
1. ሩ⇿њᇎֻᙗࡋᔪањ㖁㔌䗃ޕ
2. ሩ Domain_Theory Ⲵ⇿њ Horn ᆀਕˈྲлࡋᔪањ㖁㔌অݳ
䘎᧕↔অⲴݳ䗃↔ࡠޕᆀਕⲴݸ㹼䇽⍻䈅Ⲵᙗ
ሩᆀਕⲴ⇿њ䶎䍏ݸ㹼䇽ˈ䍻Ҹᵳ٬ W 㔉ሩᓄⲴ sigmoid অݳ䗃ޕ
ሩᆀਕⲴ⇿њ䍏ݸ㹼䇽ˈ䍻Ҹᵳ٬-W 㔉ሩᓄⲴ sigmoid অݳ䗃ޕ
䇮㖞↔অⲴݳ䰸٬w0Ѫ-(n-0.5)WˈަѝnѪᆀਕⲴ䶎䍏ݸ㹼䇽Ⲵᮠⴞ
3. ൘㖁㔌অݳѻ䰤໎࣐䱴࣐Ⲵ䘎᧕ˈ䘎᧕␡ᓖѪ i Ⲵ⇿њ㖁㔌অ␡ࡠݳᓖѪ i+1 Ⲵᡰᴹ㖁㔌অⲴݳ
䗃ޕቲкDŽ䍻Ҹ䘉Ӌ䱴࣐Ⲵ䘎᧕Ѫ᧕䘁 0 Ⲵ䲿ᵪᵳ٬DŽ
ᖂ㓣↕˖㋮ॆ↔ࡍ㖁㔌
4. ᓄ⭘৽ੁՐ㇇⌅ᶕ䈳ᮤࡍ㖁㔌ᵳ٬ԕᤏਸ Training_Examples
KBANN ㇇⌅वਜ਼єњ䱦⇥ˈ俆ݸᆳࡋᔪањᆼ㖾ᤏਸ亶ฏ⨶䇪ⲴӪᐕ⾎㓿㖁㔌ˈ❦ਾ֯
⭘৽ੁՐ㇇⌅ᶕ㋮ॆࡍ㖁㔌ԕᤏਸ䇝㓳ṧֻDŽ㇇⌅Ⲵ㓶㢲ˈवᤜࡋᔪࡍ㖁㔌Ⲵ㇇⌅൘㺘
12-2 ѝࡇࠪˈᒦሶ൘ 12.3.2 㢲䈤᰾DŽ
㺘 12-3Cup ᆖҐԫ࣑
亶ฏ⨶䇪˖
CupĕStable, Liftable, OpenVessel
StableĕBottomIsFlat
LiftableĕGraspable, Light
GraspableĕHasHandle
OpenVesselĕHasConcavity, ConcavityPointsUp
䇝㓳ṧֻ˖
Cups Non-Cups
BottomIsFlat Ĝ Ĝ Ĝ Ĝ Ĝ Ĝ Ĝ Ĝ
ConcavityPointsUp Ĝ Ĝ Ĝ Ĝ Ĝ Ĝ Ĝ
Expensive Ĝ Ĝ Ĝ Ĝ
Fragile Ĝ Ĝ Ĝ Ĝ Ĝ Ĝ
HandleOnTop Ĝ Ĝ
HandleOnSide Ĝ Ĝ Ĝ
HasConcavity Ĝ Ĝ Ĝ Ĝ Ĝ Ĝ Ĝ Ĝ Ĝ
HasHandle Ĝ Ĝ Ĝ Ĝ Ĝ
Light Ĝ Ĝ Ĝ Ĝ Ĝ Ĝ Ĝ Ĝ
MadeOfCeramic Ĝ Ĝ Ĝ Ĝ
MadeOfPaper Ĝ Ĝ
MadeOfStyrofoam Ĝ Ĝ Ĝ Ĝ
12.3.2 жѠ⽰ׁ
插图——原书页码:343
മ 12-2 ањㅹԧҾ亶ฏ⨶䇪Ⲵ⾎㓿㖁㔌
插图——原书页码:344
മ 12-3 ሩࡍ㖁㔌ᖂ㓣㋮ॆਾⲴ㔃᷌
12.3.3 䈪᱄
ᾲᤜൠ䇢ˈKBANN ⭘࠶᷀ⲴᯩᔿࡋᔪҶㅹԧҾ㔉ᇊ亶ฏ⨶䇪Ⲵ㖁㔌ˈ❦ਾᖂ㓣ൠ㋮ॆ↔
ࡍٷ䇮ԕᴤྭൠᤏਸ䇝㓳ᮠᦞDŽ൘↔䗷〻ѝˈᆳѪҶ᭩ਈ亶ฏ⨶䇪઼䇝㓳ᮠᦞна㠤Ⲵᛵߥ
㘼؞᭩㖁㔌ᵳ٬DŽ
о㓟ᖂ㓣Ⲵ৽ੁՐ˄ᆳᔰҾ䲿ᵪⲴᵳ٬˅∄ˈKBANN Ⲵྭ༴൘Ҿˈᆳ൘㔉ᇊ䘁լ
↓⺞亶ฏ⨶䇪ᰦˈ㜭ཏ∄৽ੁՐᴹᴤ儈Ⲵ⌋ॆ㋮ᓖˈ⢩࡛ᱟ൘䇝㓳ᮠᦞ〰㕪ᰦDŽ൘ࠐᇎ䱵
㌫㔏ѝˈKBANN ઼ަԆࡍॆٷ䇮Ⲵ䙄ᖴᐢᱮ⽪ࠪՈҾ㓟ᖂ㓣Ⲵ㌫㔏DŽֻྲˈTowell et al.
˄1990˅᧿䘠Ҷሶ KBANN ᓄ⭘Ҿ࠶ᆀ䚇Ր䰞仈DŽަѝⲴԫ࣑ᱟᆖҐ䇶࡛〠Ѫ◰ਁ४ฏ
˄promoter region˅Ⲵ DNA ⡷ᯝˈᆳᖡ૽สഐⲴ⍫ᙗDŽ൘↔ᇎ傼ѝˈKBANN Ⲵ亶ฏ⨶䇪Ӿа
њ࠶᷀䚇Րᆖᇦ䛓䟼㧧ਆˈ㘼◰ਁ४ฏⲴ䇝㓳ṧֻѝवਜ਼ 53 њ↓઼ֻ 53 њ৽ֻDŽᙗ㜭䇴ՠ֯
⭘ҶĀ⮉а⌅ā˄leave-one-out˅ˈ㌫㔏䘀㹼 106 ⅑DŽ⇿⅑ᗚ⧟ѝ KBANN ⭘ 105 њṧֻ䇝
㓳ˈᒦ൘࢙։Ⲵ 1 њк⍻䈅DŽ䘉 106 ⅑ᇎ傼Ⲵ㔃᷌㻛〟㚊䎧ᶕᨀሩⵏᇎ䭉䈟⦷Ⲵՠ䇑DŽ
KBANN 䭉䈟⦷Ѫ 4ˋ106ˈ㘼ḷ߶Ⲵ৽ੁՐ䭉䈟⦷Ѫ 8ˋ106DŽKBANN Ⲵањਈ⭡ Fu
˄1993˅ᇎ⧠ˈᆳᣕ൘਼ṧᮠᦞкⲴ䭉䈟⦷Ѫ 2ˋ106DŽഐ↔ˈݸ傼⸕䇶൘䘉Ӌᇎ傼ѝᖸབྷ
〻 ᓖ ൠ ߿ ሿ Ҷ 䭉 䈟 ⦷ DŽ ↔ ᇎ 傼 Ⲵ 䇝 㓳 ᮠ ᦞ ਟ ԕ Ӿ з 㔤 㖁 ൰
http://www.ics.uci.edu/~mlearn/MLReository.html кᗇࡠDŽ
插图——原书页码:346
Hypothesis Space˖ ٷ䇮オ䰤
Hypotheses that fit training data equally well˖ԕ਼ṧ〻ᓖᤏਸ䇝㓳ᮠᦞⲴٷ䇮
Initial hypothesis for KBANN˖ KBANN Ⲵࡍٷ䇮
Initial hypothesis for Backpropagation˖ ৽ੁՐⲴࡍٷ䇮
മ 12-4KBANN ѝⲴٷ䇮オ䰤ᩌ㍒
KBANN ࡍॆ㖁㔌֯ަᤏਸ亶ฏ⨶䇪ˈ㘼৽ੁՐሶ㖁㔌ࡍॆѪ䲿ᵪሿᵳ٬DŽ❦ਾᆳԜ֯⭘
਼Ⲵởᓖл䱽㿴ࡉ৽༽㋮ॆᵳ٬DŽᖃࡠཊњ㜭ᤏਸ䇝㓳ᮠᦞⲴٷ䇮ᰦ˄ྲ䱤ᖡ४ฏᡰ⽪˅ˈ
KBANN ઼৽ੁՐਟ㜭ࡠнаṧⲴٷ䇮ˈഐѪᆳԜⲴ䎧⛩н਼DŽ
KBANN ᱟ㔃ਸ࠶઼᷀ᖂ㓣ᆖҐⲴࡍॆٷ䇮䙄ᖴѝⲴаDŽ䘉а䙄ᖴⲴަԆֻᆀवᤜ Fu
˄1993˅˗Gallant(1988)˗Bradshaw et al.˄1989˅˗Yang & Bhargava(1990)˗Lacher et al.
˄1991˅DŽ䘉Ӌ䙄ᖴн਼ѻ༴൘Ҿᔪ・ࡍٷ䇮Ⲵᇎ䱵֯⭘Ⲵᢰᵟǃᵳ٬䈳ᮤⲴ৽ੁՐⲴᓄ
⭘ǃԕ৺Ӿ㋮ॆҶⲴ㖁㔌ѝᣭਆㅖਧ᧿䘠Ⲵᯩ⌅DŽPratt˄1993aˈ1993b˅᧿䘠Ⲵањࡍॆٷ
䇮䙄ᖴѝˈݸ傼⸕䇶ᱟ䙊䗷ࡽݸሩޣԫ࣑ᆖҐࡠⲴ⾎㓿㖁㔌ᶕᨀⲴDŽ䇝㓳䍍ਦᯟ㖞ؑ㖁Ⲵ
٬Ⲵᯩ⌅˄ྲ 6.11 㢲ѝ䇘䇪Ⲵ˅ҏਟ㻛ⴻᱟ⭘ݸ傼⸕䇶ᶕࡍॆٷ䇮DŽ䘉䟼ݸ傼⸕䇶ሩᓄ
Ҿа㓴ᶑԦ⤜・ᙗٷᇊˈᆳ⺞ᇊҶ䍍ਦᯟ㖁Ⲵമ㔃ᶴˈ❦ਾަᶑԦᾲ⦷㺘Ӿ䇝㓳ᮠᦞѝᖂ㓣ᗇ
ࡠDŽ
12.4 ֵ⭞ݾ僂⸛䇼᭯ᩒ㍘ⴤḽ
к䶒Ⲵ䙄ᖴ⭡ањᆼ㖾ᤏਸ亶ฏ⨶䇪Ⲵٷ䇮ᔰởᓖл䱽ᩌ㍒ˈ❦ਾ൘䴰㾱ᰦ᭩ਈ↔ٷ䇮
ԕᴰབྷ〻ᓖൠᤏਸ䇝㓳ᮠᦞDŽ֯⭘ݸ傼⸕䇶Ⲵਖаᯩ⌅ᱟሶᆳਸᒦࡠởᓖл䱽ѝ䴰ᴰሿॆⲴ䈟
ᐞࡔᦞˈ䘉ṧ㖁㔌享ᤏਸⲴᱟ䇝㓳ᮠᦞ઼亶ฏ⨶䇪Ⲵ㓴ਸ࠭ᮠDŽ⺞࠷ൠ䇢ˈᡁԜ㘳㲁Ⲵݸ傼⸕
䇶Ⲵᖒᔿᱟⴞḷ࠭ᮠⲴḀᐢ⸕ⲴሬࠪᔿDŽаӋ㊫රⲴݸ傼⸕䇶ਟԕᖸ㠚❦ൠ⭘↔ᖒᔿ㺘⽪DŽ
ֻྲˈ൘䇝㓳ањ⾎㓿㖁㔌ԕ䇶࡛߉ᆇㅖᰦˈᡁԜਟԕᤷᇊⴞḷ࠭ᮠⲴḀሬᮠˈԕ㺘⽪䘉
Ⲵݸ傼⸕䇶˖ĀᆇㅖⲴ⺞䇔⤜・ҾമⲴۿᗞሿᒣ઼〫䖜DŽā
12.4.1 TangentProp ㇍⌋
ᮠDŽ
ѪҶӾⴤ㿹к⨶䀓൘ᆖҐѝнӵᨀ䇝㓳٬ҏᨀ䇝㓳ሬᮠⲴྭ༴ˈ㘳㲁ањㆰঅⲴԫ
࣑ˈ൘മ 12-5 㺘⽪DŽަѝᖵᆖҐⲴⴞḷ࠭ᮠfᱮ⽪Ҿަѝᴰᐖ䗩ⲴമᖒˈᆳสҾᡰᱮ⽪Ⲵ 3 њ
䇝㓳ṧֻ<x1, f(x1)>ˈ<x2, f(x2)>઼<x3, f(x3)>DŽᴹҶ䘉 3 њṧֻˈ৽ੁՐ㇇⌅ਟᵋᗇࡠањᒣ
━࠭ᮠٷ䇮ˈྲѝ䰤മᱮ⽪Ⲵ࠭ᮠgDŽᴰਣ䗩Ⲵമᱮ⽪Ҷᨀ䇝㓳ሬᮠ˄ᡆᯌ⦷˅Ѫ⇿њ䇝
wf ( x)
㓳ṧֻⲴ䱴࣐ؑ˄ྲ ¢ x1 , f ( x1 ), ² ˅Ⲵ᭸᷌DŽ䙊䗷ᤏਸ䇝㓳٬f(xi)਼ᰦᤏਸ䘉Ӌሬᮠ
wx x1
wf ( x)
ˈᆖҐಘਟԕᴤྭൠӾ〰⮿䇝㓳ᮠᦞѝ↓⺞⌋ॆDŽᾲᤜൠ䈤ˈवਜ਼䇝㓳ሬᮠⲴ᭸᷌ᱟ
wx xi
ѪҶݻᴽ৽ੁՐѝⲴ䈝⌅ᖂ㓣ٿ㖞˄ᆳྭٿ⛩䰤Ⲵᒣ━ᨂ٬˅ˈሶަᴯᦒѪᡰᐼᵋⲴሬᮠ
Ⲵᱮᔿ䗃ؑޕDŽ㔃᷌ٷ䇮hᱮ⽪൘ᴰਣ䗩ⲴമѝˈᆳᨀҶሩⵏᇎⴞḷ࠭ᮠfⲴᴤ㋮⺞ՠ䇑DŽ
插图——原书页码:347
wf ( s (D , xi ))
0
wD
ަѝfѪⴞḷ࠭ᮠˈ㘼s(¢,xi)Ѫᓄ⭘↔ਈᦒsࡠമۿxiᗇࡠⲴമۿDŽ
E ¦ ( f ( x ) fˆ ( x ))
i
i i
2
൘TangentPropѝˈ䈟ᐞ࠭ᮠѝᯠ໎Ҷа亩ԕ㖊䇝㓳ሬᮠ઼ᆖҐࡠⲴ⾎㓿㖁㔌࠭ᮠⲴᇎ䱵
ሬᮠ fˆ ѻ䰤Ⲵ࠶↗DŽа㡜ൠˈTangentPropਟ᧕ਇཊњਈᦒ˄ֻྲˈᡁԜᐼᵋᯝ䀰䖜нਈ
ᙗˈ਼ᰦᯝ䀰ᆇㅖ䇶࡛ѝⲴᒣ〫нਈᙗ˅ˈ⇿њਈᦒᖒᔿᗵ享Ѫsj(¢,x)ˈަѝ¢Ѫ䘎㔝৲ᮠˈ
㘼sj ਟᗞˈ㘼фsj(0,x)=x˄ֻྲሩҾ 0 ᓖⲴ䖜ˈ࠭ᮠণѪᚂㅹ࠭ᮠ˅DŽሩ⇿њ䘉ṧⲴਈᦒ
sj(¢,x)ˈTangentProp㘳㲁ᤷᇊⲴ䇝㓳ሬᮠ઼ᆖҐࡠⲴ⾎㓿㖁㔌Ⲵᇎ䱵ሬᮠ䰤Ⲵ䈟ᐞᒣᯩDŽ؞᭩
ਾⲴ䈟ᐞ࠭ᮠѪ˖
ª § wf ( s (D , x )) wfˆ ( s (D , x )) ·
2
º
¦i ««( f ( xi ) fˆ ( xi )) 2 P ¦j ¨¨ wD ¸ » ˄12ˊ1˅
j i j i
E
wD ¸ »
¬ © ¹ D 0¼
ަѝѪ⭘ᡧᨀⲴᑨ䟿ˈԕ⺞ᇊᤏਸ䇝㓳ᮠᦞ઼ᤏਸ䇝㓳ሬᮠѻ䰤Ⲵሩ䟽㾱ᙗDŽ⌘
E ᇊѹѝㅜа亩ѪᶕⲴ䇝㓳ᮠᦞ਼㖁㔌ѻ䰤Ⲵ䈟ᐞᒣᯩˈ㘼ㅜҼ亩Ѫ䇝㓳ሬᮠ਼㖁㔌ѻ䰤Ⲵ
䈟ᐞᒣᯩDŽ
12.4.2 ⽰ׁ
㺘 12-4TangentProp ઼৽ੁՐⲴ⌋ॆ㋮ᓖˈ䪸ሩ߉ᮠᆇ䇶࡛䰞仈
TangentProp ⌋ॆ㋮ᓖᴤ儈ˈഐѪᆳᴹݸ傼⸕䇶˖ᮠᆇⲴ⺞ᇊᴹᒣ〫нਈᙗDŽ䘉Ӌ㔃᷌ᶕ㠚Ҿ
Simard et al.˄1992˅DŽ
䇝㓳䳶 ൘⍻䈅䳶кⲴ䭉䈟⦷Ⲯ࠶∄
བྷሿ TangentProp ৽ੁՐ
10 34 48
20 17 33
40 7 18
80 4 10
160 0 3
320 0 0
12.4.3 䈪᱄
ᾲᤜൠ䈤ˈTangentProp ֯⭘Ⲵݸ傼⸕䇶ᖒᔿѪⴞḷ࠭ᮠሩᓄަ䗃ޕਈᦒⲴᡰᐼᵋⲴሬ
ᮠDŽᆳ䙊䗷֯ањⴞḷ࠭ᮠᴰሿॆᶕ㔃ਸݸ傼⸕䇶઼㿲ሏࡠⲴ䇝㓳ᮠᦞˈⴞḷ࠭ᮠ਼ᰦᓖ䟿Ҷ
㖁㔌ሩᓄ䇝㓳ṧֻ٬Ⲵ䈟ᐞ˄ᤏਸᮠᦞ˅ˈ઼㖁㔌ሩᓄҾሬᮠⲴ䈟ᐞ˄ᤏਸݸ傼⸕䇶˅DŽⲴ
٬ߣᇊҶ㖁㔌൘ᮤњ䈟ᐞѝᤏਸ䘉є䜘࠶Ⲵ〻ᓖDŽ㇇⌅Ⲵ㹼Ѫሩ٬ᝏˈᆳᱟ⭡䇮䇑㘵䘹ᤙ
ⲴDŽ
㲭❦ TangentProp ᡀ࣏ൠ㔃ਸҶݸ傼⸕䇶઼䇝㓳ᮠᮠᦞԕᤷሬ⾎㓿㖁㔌ᆖҐˈնᆳሩҾݸ
傼⸕䇶ѝⲴ䭉䈟励ἂᙗнᕪDŽᖃݸ傼⸕䇶н↓⺞ᰦˈণ䗃ࡠޕᆖҐಘⲴ䇝㓳ሬᮠн㜭↓⺞৽᱐
ⵏᇎⴞḷ࠭ᮠⲴሬᮠᰦˈ㇇⌅ሶ䈅മᤏਸн↓⺞ⲴሬᮠˈӾ㘼ሬ㠤⌋ॆ㋮ᓖнྲᆼޘᘭ⮕ݸ傼
⸕䇶֯⭘㓟৽ੁՐ㇇⌅Ⲵ㋮ᓖDŽྲ᷌ᡁԜ亴⸕ݸ䚃䇝㓳ሬᮠѝ䭉䈟ࠪ⧠〻ᓖˈᡁԜਟ⭘䘉а
ؑ䘹ᤙᑨ䟿ˈԕ⺞ᇊᤏਸ䇝㓳٬઼ᤏਸ䇝㓳ሬᮠⲴሩ䟽㾱〻ᓖDŽ❦㘼ˈ䘉аؑнཚਟ
㜭亴⸕ݸ䚃DŽ൘ла㢲ᡁԜ䇘䇪Ҷ EBNN ㇇⌅ˈᆳਟ㠚ࣘṩᦞ example-by-example Ⲵส䘹ᤙ
Ⲵ٬ˈԕ䀓ߣн↓⺞Ⲵݸ傼⸕䇶Ⲵ䰞仈DŽ
插图——原书页码:351
Hypothesis Space˖ ٷ䇮オ䰤
Hypotheses that maximize fit to data and prior knowledge: ሩᮠᦞ઼ݸ傼⸕䇶䜭ᴹᴰབྷᤏ
ਸᓖⲴٷ䇮
Hypotheses that maximize fit to data ሩᮠᦞᤏਸᓖᴰབྷⲴٷ䇮
TangentProp Search TangentProp ᩌ㍒
Backpropagation Search ৽ੁՐᩌ㍒
മ 12-6TangentProp ѝⲴٷ䇮オ䰤ᩌ㍒
TangentProp ሶ㖁㔌ࡍॆѪ䲿ᵪሿᵳ٬ˈྲ৽ੁՐѝаṧDŽ❦㘼ˈᆳ֯⭘н਼Ⲵ䈟ᐞ࠭ᮠᶕ
ᕅሬởᓖл䱽ᩌ㍒DŽTangentProp ѝ֯⭘Ⲵ䈟ᐞवᤜҶ亴⍻䇝㓳٬Ⲵ䈟ᐞˈҏवᤜ亴⍻⭡ݸ傼⸕䇶ᨀ
Ⲵ䇝㓳ሬᮠⲴ䈟ᐞDŽ
⌘ˈሩⴞḷ࠭ᮠⲴ䇝㓳ሬᮠᤏਸⲴਖаᯩ⌅ᱟˈㆰঅൠሶ㿲ሏࡠⲴ䇝㓳ṧֻ䱴䘁Ⲵ䱴
࣐䇝㓳ṧֻ㔬ਸ䎧ᶕˈ֯⭘ᐢ⸕Ⲵ䇝㓳ሬᮠᶕՠ䇑䘉Ӌ䱴䘁ⲴᇎֻⲴ䇝㓳٬DŽֻྲˈ൘к䶒Ⲵ
ᆇㅖ䇶࡛ԫ࣑ѝˈਟԕਆањ䇝㓳മˈۿሩަቁ䟿Ⲵᒣ〫ˈ❦ਾᯝ䀰ᒣ〫ਾⲴമۿоᶕⲴṧ
ֻҾ਼а㊫DŽਟԕᵏᵋ֯⭘৽ੁՐ઼䘉Ӌ㔬ਸⲴṧֻˈ㜭ᗇࡠլҾ TangentProp ѝ֯⭘
ṧ઼ֻሬᮠᡰᗇࡠⲴ㔃᷌DŽSimard et al.˄1992˅Ⲵᇎ傼ᱮ⽪єᛵߥлᴹ䘁լㅹⲴ⌋
ॆ䭉䈟⦷ˈն TangentProp 㜭ᴤѪᴹ᭸ൠ᭦ᮋDŽᴹᙍⲴᱟㅜ 4 ㄐᨀࡠⲴᆖҐ傮傦⊭䖖Ⲵ
ALVINN ㌫㔏ˈ֯⭘ҶᖸլⲴ䙄ᖴԕ㔬ਸ䱴࣐䇝㓳ṧֻDŽᆳ֯⭘ᴹྲޣօṩᦞ䮌ཤമ≤Ⲵۿ
ᒣᒣ〫ᶕ᭩ਈ傮傦ᯩੁⲴݸ傼⸕䇶ˈᶕࡋᔪཊњ㔬ਸⲴ䇝㓳ṧֻԕᢙ⇿ݵњ㿲ሏࡠⲴ䇝㓳ṧ
ֻDŽ
12.4.4 EBNN ㇍⌋
EBNNⲴ䗃ޕवᤜ˄1˅ᖒᔿѪ<xi,f(xi)>Ⲵа㓴䇝㓳ṧֻˈнवਜ਼䇝㓳ሬᮠ˗˄2˅а㓴亶
ฏ⨶䇪ˈ㊫լҾสҾ䀓䟺ⲴᆖҐ˄ㅜ 11 ㄐ˅઼KBANNѝ֯⭘Ⲵˈնᆳ㺘⽪Ѫа㓴亴ݸ䇝㓳䗷
Ⲵ⾎㓿㖁㔌ˈ㘼нᱟHornᆀਕDŽEBNNⲴ䗃ࠪᱟањ㜭䙬䘁ⴞḷ࠭ᮠfⲴᯠⲴ⾎㓿㖁㔌DŽ↔ᆖҐ
ࡠⲴ㖁㔌㜭ཏᤏਸ䇝㓳ṧֻ<xi,f(xi)>ˈԕ৺Ӿ亶ฏ⨶䇪ѝᣭਆⲴfⲴ䇝㓳ሬᮠDŽሩ䇝㓳ṧֻ
<xi,f(xi)>ⲴᤏਸᶴᡀҶᆖҐⲴᖂ㓣ᡀ࠶ˈ㘼ሩ亶ฏ⨶䇪ѝᣭਆⲴ䇝㓳ሬᮠⲴᤏਸᶴᡀҶᆖҐⲴ
࠶᷀ᡀ࠶DŽ
EBNNⲴⴞⲴᱟᆖҐањ᧿䘠ⴞḷ࠭ᮠⲴᯠ⾎㓿㖁㔌DŽᡁԜሶ↔ᯠ㖁㔌〠Ѫⴞḷ㖁㔌
˄target network˅DŽ൘മ 12-7 Ⲵֻᆀѝˈⴞḷ㖁㔌Cuptargetᱮ⽪൘മⲴᓅ䜘ˈᆳⲴ䗃ޕѪԫ
Ⲵᇎֻ᧿䘠ˈ䗃ࠪѪ㺘⽪↔ሩ䊑ᱟѪCupⲴ٬DŽ
EBNN䙊䗷ᢗ㹼ࡽа㢲᧿䘠ⲴTangentProp㇇⌅ᶕᆖҐⴞḷ㖁㔌ˈഎᗶалˈTangentProp䇝
㓳 㖁 㔌 ԕ ᤏ ਸ 䇝 㓳 ٬ ઼ 䇝 㓳 ሬ ᮠ DŽ EBNN ᢺ ᆳ ᧕ ᭦ ࡠ Ⲵ 䗃 ޕ䇝 㓳 ٬ <xi,f(xi)> Ր 䙂 㔉
TangentPropDŽ↔ཆˈEBNN䘈ᢺᆳӾ亶ฏ⨶䇪ѝ䇑㇇ࠪⲴሬᮠᨀ㔉TangentPropDŽѪ⨶䀓
EBNNᱟྲօ䇑㇇䘉Ӌ䇝㓳ሬᮠⲴˈ⅑㘳㲁മ 12-7DŽമкᯩᱮ⽪Ҷሩа⢩ᇊ䇝㓳ᇎֻxiˈ亶
ฏ⨶䇪ࠪⲴⴞḷ࠭ᮠ٬亴⍻DŽEBNNሩᓄҾ䗃ޕᇎֻⲴ⇿ањ⢩ᖱ䇑㇇↔亴⍻ⲴሬᮠDŽֻ
ྲˈ൘മѝˈᇎֻxi ᧿䘠Ѫࠐњ⢩ᖱྲMadeOfStyrofoam=0.2˄ণѪˈ˅ٷ㘼亶ฏ⨶䇪亴⍻Ѫ
Cup˙0.8˄ণⵏ˅DŽEBNNሩᓄҾ⇿њᇎֻ⢩ᖱ䇑㇇↔亴⍻Ⲵٿሬˈᗇࡠл䶒Ⲵٿሬ䳶ਸ˖
插图——原书页码:353
Explanation of training example in terms of domain theory: ṩᦞ亶ฏ⨶䇪ᗇࡠⲴ䇝㓳ṧֻ
Ⲵ䀓䟺
Target network: ⴞḷ㖁㔌
↔䀓䟺⭡亶ฏ⨶䇪㖁㔌˄к䜘˅ࠪⲴⴞḷ࠭ᮠ٬亴⍻ᶴᡀDŽ䇝㓳ሬᮠӾ↔䀓䟺ѝᣭਆࠪᶕˈԕ
䇝㓳࠶Ⲵⴞḷ㖁㔌DŽ⇿њ⸙ᖒඇ㺘⽪ањঅ⤜Ⲵཊቲ⾎㓿㖁㔌DŽ
䘉㓴ሬᮠᱟ亶ฏ⨶䇪亴⍻࠭ᮠሩ䗃ޕᇎֻⲴởᓖDŽлḷ㺘⽪䘉Ӌሬᮠ൘x=xiк䇑㇇DŽ൘ᴤ
а㡜Ⲵᛵߥлˈⴞḷ࠭ᮠᴹཊњ䗃ࠪঅˈݳởᓖሩ⇿њ䗃ࠪ䘋㹼䇑㇇DŽ䘉њởᓖ⸙䱥㻛〠Ѫⴞ
ḷ࠭ᮠⲴ䳵ਟ∄㹼ࡇᔿ˄Jacobian˅DŽ
wCup
Ѫ⨶䀓䘉Ӌ䇝㓳ሬᮠ൘ᑞࣙᆖҐⴞḷ㖁㔌Ⲵ䟽㾱ᙗˈ㘳㲁ሬᮠ DŽྲ᷌亶ฏ⨶
wExpensive
wCup
䇪㕆⸱Ⲵ⸕䇶ѝExpensive⢩ᖱоⴞḷ࠭ᮠCupᰐˈޣ䛓ѸӾ↔䀓䟺ѝᣭਆⲴሬᮠ
wExpensive
Ⲵ٬Ѫ 0DŽѪ 0 Ⲵሬᮠ㺘⽪䘉ṧⲴᯝ䀰ˈ⢩ᖱExpensiveкⲴ᭩ਈሩCup٬Ⲵ亴⍻⋑ᴹᖡ૽DŽਖ
аᯩ䶒ˈᖸབྷⲴ↓ሬᮠᡆ䍏ሬᮠ㺘⽪ᯝ䀰˖↔⢩ᖱоⴞḷ٬䶎ᑨޣDŽഐ↔ˈӾ亶ฏ⨶䇪䀓䟺
ѝᣭਆⲴሬᮠᨀҶ४࠶઼ޣнޣ⢩ᖱⲴ䟽㾱ؑDŽᖃ䘉ӋᣭਆࠪⲴሬᮠ㻛ᨀѪ
TangentPropⲴ䇝㓳ሬᮠԕᆖҐⴞḷ㖁㔌Cuptarget ˈᆳԜᨀҶᤷሬ⌋ॆ䗷〻Ⲵᴹ⭘Ⲵٿ㖞
˄bias˅DŽ䙊ᑨ⾎㓿㖁㔌ѝⲴ䈝⌅ᖂ㓣ٿ㖞൘䘉䟼㻛ᴯᦒѪӾ亶ฏ⨶䇪ѝᗇࡠⲴሬᮠᡰӗ⭏Ⲵ
ٿ㖞DŽ
к䶒ᡁԜ᧿䘠Ҷ亶ฏ⨶䇪亴⍻ྲօ㻛⭘Ҿ⭏ᡀа㓴䇝㓳ሬᮠDŽ㋮⺞ൠ䇢ˈᆼᮤⲴEBNN㇇
⌅ྲл˖㔉ᇊ䇝㓳ṧ઼ֻ亶ฏ⨶䇪ˈEBNN俆ࡋݸᔪањᯠⲴޘ䘎᧕ࡽ侸㖁㔌ԕ㺘⽪↔ⴞḷ࠭
ᮠDŽ䈕ⴞḷ㖁㔌㻛ࡍॆѪ䲿ᵪሿᵳ٬ˈྲ൘৽ੁՐѝ䛓ṧDŽ❦ਾˈEBNNሩ⇿њ䇝㓳ṧֻ
<xi,f(xi)>⺞ᇊᓄⲴ䇝㓳ሬᮠˈԕє↕僔ᇎ⧠DŽㅜа↕⭘亶ฏ⨶䇪ᶕ亴⍻ᇎֻxi Ⲵⴞḷ࠭ᮠ
٬DŽԔA(xi)ԓ㺘↔亶ฏ⨶䇪ሩᇎֻxi亴⍻DŽᦒ䀰ѻˈA(xi)ѪᖒᡀxiⲴ䀓䟺Ⲵ亶ฏ⨶䇪㓴ਸ㖁㔌ᇊ
ѹⲴ࠭ᮠDŽㅜҼ↕ˈ࠶᷀亶ฏ⨶䇪Ⲵᵳ٬઼◰⍫⣦ᘱԕᣭਆࠪሩᓄxi⇿њ࠶䟿ⲴA(xi)ⲴሬᮠDŽ
˄ণ൘x=xi 䇑㇇ⲴA(x)Ⲵ䳵ਟ∄㹼ࡇᔿ˅DŽᣭਆሬᮠⲴ䗷〻㊫լҾ৽ੁՐ㇇⌅ѝ䇑㇇ ¥ 亩
˄㿱Ґ仈 12.5˅DŽᴰਾˈEBNN֯⭘ҶTangentPropⲴᗞሿਈරᶕ䇝㓳ⴞḷ㖁㔌ԕᤏਸл䶒Ⲵ䈟
ᐞ࠭ᮠDŽ
ª § wA( x ) wfˆ ( x) ·
2
º
E ¦i ««( f ( xi ) fˆ ( xi )) P i ¦j ¨¨ wx j wx j ¸¸
2
»
»
˄12.2˅
¬ © ¹ (x xi ) ¼
ަѝ
A( xi ) f ( xi )
Pi { 1 ˄12ˊ3˅
c
䘉䟼xiԓ㺘ㅜiњ䇝㓳ᇎֻˈA(x)ԓ㺘䗃ޕxⲴ亶ฏ⨶䇪亴⍻DŽкḷㅖਧxjԓ㺘ੁ䟿xⲴㅜjњ
࠶䟿˄ণ⾎㓿㖁㔌Ⲵㅜjњ䗃ޕ㔃⛩˅DŽ㌫ᮠcѪањᖂаॆᑨ䟿ˈᆳⲴ٬ᱟѪҶ؍䇱ሩᡰᴹiˈ
0 d Pi d 1DŽ
12.4.5 䈪᱄
ᾲᤜൠ䈤ˈEBNN㇇⌅֯⭘Ⲵ亶ฏ⨶䇪㻛㺘⽪Ѫа㓴亴ݸᆖҐࡠⲴ⾎㓿㖁㔌ˈ❦ਾ亶ฏ⨶
䇪о䇝㓳ṧֻа䎧䇝㓳ަ䗃ࠪٷ䇮˄ⴞḷ㖁㔌˅DŽሩ⇿њ䇝㓳ṧֻˈEBNN֯⭘ަ亶ฏ⨶䇪ᶕ
䀓䟺ᆳˈ❦ਾӾ↔䀓䟺ѝᣭਆ䇝㓳ሬᮠDŽሩᇎֻⲴ⇿њᙗ䇑㇇ࠪањ䇝㓳ሬᮠˈԕ᧿䘠˖᤹
➗亶ฏ⨶䇪ˈⴞḷ࠭ᮠ٬ᱟᘾṧ⭡ަᙗ٬Ⲵᗞሿਈॆᖡ૽ⲴDŽ䘉њ䇝㓳ሬᮠ㻛ᨀ㔉
TangentPropⲴањਈփˈަѝ֯ⴞḷ㖁㔌ᤏਸ䘉Ӌሬᮠ઼䇝㓳ṧֻ٬DŽᤏਸሬᮠ䲀ࡦҶᆖҐࡠ
㖁㔌ᗵ享ᤏਸ亶ฏ⨶䇪㔉ࠪⲴ䎆ޣ㌫ˈ㘼ᤏਸ䇝㓳٬䲀ࡦҶ㖁㔌ᗵ享ᤏਸ㿲ሏࡠⲴᮠᦞᵜ
䓛DŽᤏਸሬᮠⲴᵳ٬i ᱟ⭡⇿њ䇝㓳ṧֻ⤜・⺞ᇊⲴˈᆳสҾ亶ฏ⨶䇪亴⍻↔ṧֻ䇝㓳٬Ⲵ
㋮⺞〻ᓖDŽ
൘ ཊ њ 亶 ฏ ˈ EBNN ᐢ 㻛 䇱 ᰾ ᱟ Ӿ 䘁 լ 亶 ฏ ⨶ 䇪 ѝ ᆖ Ґ Ⲵ а ᴹ ᭸ ᯩ ⌅ DŽ Thrum
˄1996˅᧿䘠Ҷᆳ൘к䘠䇘䇪Ⲵ Cup ᆖҐԫ࣑ⲴਈփкⲴᓄ⭘ˈᒦфᣕ䈤ᆳ∄ḷ߶৽ੁՐ
㇇⌅⌋ॆᴤѪ㋮⺞ˈ⢩࡛ᱟ൘䇝㓳ᮠᦞ㕪ቁⲴᛵߥлDŽֻྲˈ൘㓿䗷 30 њṧֻ䇝㓳ਾˈ
EBANN ൘ਖа⍻䈅ᮠᦞ䳶кᗇࡠⲴ൷ᯩṩ䈟ᐞѪ 5.5ˈ㘼৽ੁՐⲴ䈟ᐞѪ 12.0DŽMitchell &
Thrun˄1993a˅᧿䘠Ҷᓄ⭘ EBNN ԕᆖҐ᧗ࡦ⁑ᤏⲴ〫ࣘᵪಘӪˈަѝ亶ฏ⨶䇪⭡⾎㓿㖁㔌ᶴ
ᡀˈᆳԜ亴⍻Ҷн਼ᵪಘӪሩཆ⭼⣦ᘱⲴࣘⲴ᭸᷌DŽަѝ EBNN ҏ֯⭘Ҷ䘁լⲴ亴ݸᆖҐ
Ⲵ亶ฏ⨶䇪ˈᒦ㧧ᗇҶ∄৽ੁՐᴤྭⲴᙗ㜭DŽ䘉䟼৽ੁՐ䴰㾱㓖 90 њ䇝㓳һԦ㜭䗮ࡠ
EBNN ѝ 25 њ䇝㓳һԦਾⲴᙗ㜭DŽO'Sullivan et al.˄1997˅઼ Thrun˄1996˅᧿䘠Ҷ EBNN ᓄ
⭘ࡠަԆࠐⵏᇎц⭼ᝏ⸕઼᧗ࡦԫ࣑ˈަѝ亶ฏ⨶䇪⭡㖁㔌㓴ᡀˈᆳ֯⭘༠㓣ǃ㿶㿹઼◰ݹ
㤳തՐᝏಘ亴⍻Ҷᇔ〫ࣘᵪಘӪⲴࣘ᭸᷌DŽ
12.5 ֵ⭞ݾ僂⸛䇼ᶛᢟኋᩒ㍘㇍ᆆ
ࡽ䶒є㢲㘳ḕҶݸ傼⸕䇶൘ᆖҐѝⲴєн਼䀂㢢DŽࡍॆᆖҐಘⲴٷ䇮ǃ઼᭩ਈⴞⲴ࠭
ᮠԕᕅሬٷ䇮オ䰤кⲴᩌ㍒DŽᵜ㢲ᡁԜ㘳㲁֯⭘ݸ傼⸕䇶ᶕ᭩ਈٷ䇮オ䰤ᩌ㍒Ⲵㅜйᯩ⌅˖
ণ᭩ਈᩌ㍒ѝᇊѹਸ⌅ᩌ㍒↕Ⲵ㇇ᆀ䳶ਸDŽ䘉а䙄ᖴ㻛⭘Ҿ FOCL˄Pazzani et al. 1991ˈ
Pazzani & Kibler 1992˅ԕ৺ ML-SMART˄Bergadano & Giordanna 1990˅ㅹ㌫㔏DŽ䘉䟼ᡁԜ⭘
FOCL ᶕ䈤᰾䘉а䙄ᖴDŽ
12.5.1 FOCL ㇍⌋
插图——原书页码:358
മ 12-8FOCL ѝⲴٷ䇮オ䰤ᩌ㍒
ѪᆖҐањ㿴ࡉˈFOCL Ӿа㡜Ⲵٷ䇮ᔰˈᩌ㍒䙀⑀⢩↺Ⲵٷ䇮DŽᴹє㇇ᆀ⭘Ҿ⭏ᡀᖃࡽٷ
䇮Ⲵ⢩ॆᔿDŽаᱟ໎࣐ањᯠⲴ᮷ᆇ˄മѝⲴᇎ㓯˅DŽਖа㇇ᆀᱟ䙊䗷໎࣐а㓴᮷ᆇ⢩ॆ↔㿴
ࡉDŽ䘉㓴᮷ᆇ᤹➗亶ฏ⨶䇪ᶴᡀҶⴞḷᾲᘥⲴ䙫䗁࠶ݵᶑԦ˄മѝ㲊㓯˅DŽFOCL ൘ᡰᴹ䘉Ӌى䘹ॆ
ᔿѝสҾᆳԜ൘ᮠᦞкⲴᙗ㜭䘋㹼䘹ᤙDŽഐ↔ˈнᆼ㖾Ⲵ亶ฏ⨶䇪ਚՊ൘ᴹ䇱ᦞ᭟ᤱ⨶䇪ᰦՊᖡ૽
ٷ䇮DŽ䈕ֻสҾࡽ䶒 KBANN ֻᆀ਼Ⲵ䇝㓳ᮠᦞ઼亶ฏ⨶䇪DŽ
൘ަа㡜ࡠ⢩↺ᩌ㍒Ⲵ⇿а⛩ˈFOCL ֯⭘л䶒є㇇ᆀᢙኅަᖃࡽٷ䇮 h˖
2ˊ᤹➗亶ฏ⨶䇪ˈࡋᔪањරⲴˈᒦфᱟⴞḷᾲᘥⲴ䙫䗁࠶ݵᶑԦDŽሶ䘉㓴᮷ᆇ࣐
ࡠޕh ⲴᖃࡽࡽԦѝ৫DŽᴰਾ ࢚؞h ⲴࡽԦˈ〫৫ሩҾ䇝㓳ᮠᦞн䴰㾱Ⲵ᮷ᆇDŽമ 12-8 ѝ㲊
㇝ཤ㺘⽪Ҷ↔㊫රⲴ⢩ॆDŽ
ᡰ䘹ᆀਕⲴࡽԦᖒᡀҶⴞḷᾲᘥⲴањ䙫䗁࠶ݵᶑԦDŽ൘䘉Ӌ࠶ݵᶑԦѝˈ⅑֯⭘亶ฏ
⨶䇪ˈ⇿њ䶎ර᮷ᆇ㻛ᴯᦒᦹˈᒦфሶᆀਕࡽԦԓࡠޕᆀਕਾԦѝDŽֻྲˈ亶ฏ⨶䇪ᆀਕ
StableĕBottomIsFlat 㻛⭘ҾሶරⲴ BottomIsFlat ԓᦒ䶎රⲴ StableDŽ䘉њĀኅᔰā
˄ unfolding˅亶ฏ⨶䇪Ⲵ䗷〻ᤱ㔝ⴤࡠ࠶ݵᶑԦᐢ㻛㺘䘠Ѫර᮷ᆇDŽྲ᷌ᴹཊњਟ䘹Ⲵ亶
ฏ⨶䇪ӗ⭏н਼Ⲵ㔃᷌ˈ䛓Ѹ൘↔ኅᔰ䗷〻Ⲵ⇿а↕⭘䍚ႚⲴᯩ⌅䘹ᤙᴹᴰབྷؑ໎⳺ањDŽ
䈫㘵ਟԕ傼䇱൘䘉њֻᆀѝˈ㔉ᇊᮠᦞ઼亶ฏ⨶䇪ˈᴰ㓸Ⲵර࠶ݵᶑԦѪ˖
Ѫ⭏ᡀى䘹⢩ॆᔿⲴᴰਾа↕ˈ↔࠶ݵᶑԦ㻛࢚؞DŽሩ㺘䗮ᔿѝⲴ⇿њ᮷ᆇˈ䲔䶎᮷ᆇ
Ⲵ〫䲔Պ䱽վ䇝㓳ֻкⲴ࠶㊫㋮ᓖˈࡉᆳ㻛〫৫DŽवਜ਼䘉а↕僔ᱟѪҶӾ䗷⢩ॆ
(overspecialization)Ⲵᛵߥлᚒ༽ˈ䘉ᰦнᆼ㖾Ⲵ亶ฏ⨶䇪ѝवਜ਼нⲴޣ᮷ᆇDŽ൘ᡁԜⲴֻᆀ
ѝˈк䘠Ⲵ᮷ᆇ䳶ਸ३䝽єњ↓઼ֻєњ৽ֻDŽ〫˄࢚؞৫˅᮷ᆇ HasHandle Պ֯ᙗ㜭᭩䘋DŽ
ഐ↔ˈᴰ㓸Ⲵ࢚؞䗷Ⲵර࠶ݵᶑԦѪ˖
֯⭘Ҷк䶒єਾˈаնᖃࡽٷ䇮Ⲵى䘹⢩ॆᔿᐢ㓿⭏ᡀҶˈᴹᴰབྷؑ໎⳺Ⲵى䘹
㘵㻛䘹ᤙDŽ൘മ 12-8 ѝᱮ⽪Ⲵֻᆀѝˈ൘ᩌ㍒ṁⲴㅜаቲ䘹ᤙⲴى䘹㘵Ѫ亶ฏ⨶䇪⭏ᡀⲴ䛓
ањDŽᩌ㍒䗷〻㔗㔝㘳㲁䘉њ亶ฏ⨶䇪᧘ѮⲴࡽԦⲴᴤ䘋а↕Ⲵ⢩ॆᔿˈ䘉ṧᆖҐⲴᖂ㓣ᡀ࠶
ਟԕ㋮ॆ亶ฏ⨶䇪ѝሬࠪⲴࡽԦDŽ൘↔ֻѝˈ亶ฏ⨶䇪ݸᖡ૽ᩌ㍒ⲴㅜаቲDŽ❦㘼ˈᛵߥᒦ䶎
ᙫᱟྲ↔DŽྲ᷌൘ㅜаቲሩަԆى䘹ᴹᴤᕪⲴ㓿傼ॆⲴ᭟ᤱˈ亶ฏ⨶䇪᧘ѮⲴ᮷ᆇӽਟ㜭൘ᩌ
㍒Ⲵਾ㔝↕僔ѝ㻛࣐ޕDŽᾲᤜൠ䈤ˈFOCL ᆖҐԕлᖒᔿⲴ Horn ᆀਕ˖
c m oi o b o f
ަѝcѪⴞḷᾲᘥˈoi ѪࡍⲴර᮷ᆇⲴਸਆˈᆳ⭡ㅜањ䈝⌅㇇ᆀ⇿⅑࣐ޕањ᮷
ᆇˈobᱟสҾ亶ฏ⨶䇪অ↕࣐Ⲵޕර᮷ᆇਸਆˈ㘼ofѪㅜањ䈝⌅㇇ᆀ⇿⅑࣐ޕањⲴ
ර᮷ᆇⲴਸਆDŽ䘉йњ᮷ᆇ䳶ਸ䜭ਟ㜭ѪオDŽ
12.5.2 䈪᱄
插图——原书页码:361
ᾲᤜൠ䈤ˈFOCL ֯⭘䈝⌅⭏ᡀⲴى䘹⢩ॆᔿⲴ਼ᰦˈ䘈֯⭘Ҷ亶ฏ⨶䇪傡ࣘⲴ൘ᩌ㍒ѝ
⇿↕Ⲵى䘹⢩ॆ⭏ᡀDŽ䈕㇇⌅䘹ᤙ䘉Ӌى䘹ѫ㾱ᱟสҾᆳԜ൘䇝㓳ᮠᦞкⲴ㓿傼ॆ᭟ᤱDŽഐ
↔ˈ亶ฏ⨶䇪֯⭘ᯩᔿᱟ֯ᆖҐಘٿ㖞ˈն䇙ᆳสҾަ൘䇝㓳ᮠᦞкⲴᙗ㜭䘋㹼ᴰ㓸Ⲵ䘹ᤙDŽ
⭡亶ฏ⨶䇪ᕅⲴޕ䘉ٿ㖞㺘⧠ᖒᔿѪ˖Ոݸ䘹ᤙ䘉ṧⲴ Horn ᆀਕˈᆳᴰլҾ亶ฏ⨶䇪⏥
㮤˄entail˅ⲴරⲴ䙫䗁࠶ݵᶑԦDŽ↔ٿ㖞о㓟ᖂ㓣Ⲵ FOIL 〻ᒿⲴٿ㖞㔃ਸ൘а䎧DŽਾ䶒
ањٿ㖞Ոݸ䘹ᤙ⸝Ⲵٷ䇮DŽ
12.6 ⹊ガ⧦⣬
ᵜㄐኅ⽪Ⲵᯩ⌅ਚᱟ㔃ਸ࠶઼᷀ᖂ㓣ᆖҐⲴਟ㜭䙄ᖴѝⲴࠐњֻᆀDŽަѝ⇿њᯩ⌅䜭㻛䇱
᰾൘ᡰ䘹亶ฏѝᙗ㜭䎵ࠪ㓟ᖂ㓣ⲴᆖҐᯩ⌅ˈն⋑ᴹањ൘བྷ㤳തⲴ䰞仈亶ฏѝ㻛ᖫᓅ⍻䈅ᡆ
䇱᰾DŽ㔃ਸᖂ㓣઼࠶᷀ᆖҐⲴѫ仈ӽᱟањ䶎ᑨ⍫䏳Ⲵ⹄ウ亶ฏDŽ
12.7 ቅ㔉ૂ㺛ݻ䈱⢟
ᵜㄐⲴ㾱⛩वᤜ˖
x 䘁լⲴݸ傼⸕䇶˄ᡆ亶ฏ⨶䇪˅൘䇨ཊᇎ䱵ᆖҐ䰞仈ѝᱟਟ࡙⭘ⲴDŽߣㆆṁ઼⾎
㓿㖁㔌৽ੁՐ䘉ṧⲴ㓟ᖂ㓣ᯩ⌅н㜭࡙⭘䘉ṧⲴ亶ฏ⨶䇪ˈഐ↔൘ᮠᦞ〰㕪ᰦ
ᙗ㜭䖳ᐞDŽProlog-EBG 䘉ṧⲴ㓟࠶᷀ᆖҐᯩ⌅㜭ཏ࡙⭘䘉ṧⲴ亶ฏ⨶䇪ˈն൘㔉
ᇊнᆼ㖾ݸ傼⸕䇶ᰦՊӗ⭏н↓⺞Ⲵٷ䇮DŽ㔃ਸᖂ㓣઼࠶᷀ᆖҐⲴᯩ⌅ਟԕ㧧ᗇ
є㘵ⲴՈ⛩ˈ߿ሿṧᵜ༽ᵲᓖˈᒦфߣн↓⺞Ⲵݸ傼⸕䇶DŽ
x ⴻᖵ㔃ਸᖂ㓣઼࠶᷀ᆖҐ㇇⌅Ⲵаᯩ⌅ᱟˈ㘳㲁亶ฏ⨶䇪ᱟྲօᖡ૽ٷ䇮オ䰤
ᩌ㍒ⲴDŽᵜㄐᡁԜ㘳ḕҶࠐᯩ⌅ˈᆳԜ֯⭘нᆼ㖾Ⲵ亶ฏ⨶䇪DŽ˄1˅ࡋᔪᩌ㍒
ѝⲴࡍٷ䇮ˈ˄2˅ᢙݵᖃࡽٷ䇮Ⲵᩌ㍒㇇ᆀ䳶ਸˈ˄3˅᭩ਈᩌ㍒ⴞⲴDŽ
x ֯⭘亶ฏ⨶䇪ᶕࡍॆٷ䇮Ⲵањ㌫㔏ᱟ KBANNDŽ↔㇇⌅֯⭘а྇㕆⸱Ѫભ仈㿴
ࡉⲴ亶ฏ⨶䇪ᶕ࠶᷀ൠࡋᔪㅹԧҾ亶ฏ⨶䇪Ⲵ⾎㓿㖁㔌DŽ❦ਾ↔㖁㔌㻛৽ੁՐ
㇇⌅ᖂ㓣ൠ㋮ॆˈԕ᭩䘋ަ൘䇝㓳ᮠᦞкⲴᙗ㜭DŽ㔃᷌ᱟањ㻛亶ฏ⨶䇪ٿ
㖞Ⲵ㖁㔌ˈަᵳ٬㻛สҾ䇝㓳ᮠᦞᖂ㓣㋮ॆDŽ
x TangentProp ֯⭘Ⲵݸ傼⸕䇶㻛㺘⽪Ѫⴞḷ࠭ᮠⲴᡰᐼᵋⲴሬᮠDŽ൘ḀӋ亶ฏᰦˈ
ྲമۿ༴⨶ˈ䘉ṧ㺘⽪ݸ傼⸕䇶Ⲵањᖸ㠚❦Ⲵᯩ⌅DŽTangentProp 䙊䗷᭩ਈⴞⲴ
࠭ᮠ֯⭘䘉а⸕䇶ˈ↔࠭ᮠ൘ᩌ㍒ٷ䇮オ䰤Ⲵởᓖл䱽ѝ㻛ᴰሿॆDŽ
x EBNN ֯⭘亶ฏ⨶䇪᭩ਈӪᐕ⾎㓿㖁㔌ᩌ㍒Ⲵٷ䇮オ䰤ⲴⴞḷDŽᆳ֯⭘Ⲵ亶ฏ⨶䇪
⭡亴ݸᆖҐⲴ⾎㓿㖁㔌㓴ᡀˈަ⭘ᱟᇎ⧠ањ⾎㓿㖁㔌ˈԕ⁑ᤏㅖਧⲴสҾ䀓
䟺ᆖҐDŽྲ൘ㅖਧⲴสҾ䀓䟺ⲴᆖҐѝаṧˈ亶ฏ⨶䇪㻛⭘Ҿ䀓䟺অњṧֻˈ㧧
ᗇн਼ṧֻ⢩ᖱⲴޣ〻ᓖⲴؑDŽ❦㘼൘⾎㓿㖁㔌㺘⽪ѝˈᴹޣޣᙗⲴؑ
㻛㺘⽪Ѫⴞḷ࠭ᮠሩᓄҾᇎֻ⢩ᖱⲴሬᮠDŽ㖁㔌ٷ䇮Ⲵ䇝㓳֯⭘Ҷ TangentProp ㇇
⌅Ⲵањਈˈަѝ㻛ᴰሿॆⲴ䈟ᐞнӵवਜ਼Ҷ㖁㔌䗃ࠪ٬Ⲵ䈟ᐞˈ䘈वਜ਼ҶӾ
䀓䟺ѝ㧧ᗇⲴ㖁㔌ሬᮠⲴ䈟ᐞDŽ
x FOCL ֯⭘亶ฏ⨶䇪ᶕᢙኅ⇿↕ᩌ㍒ѝ㘳㲁ⲴⲴى䘹䳶DŽᆳ֯⭘㺘⽪Ѫа䱦 Horn
ᆀਕⲴ䘁լ亶ฏ⨶䇪ᶕᆖҐа㓴䙬䘁ⴞḷ࠭ᮠⲴ Horn ᆀਕDŽFOCL ᓄ⭘Ҷᒿࡇ㾶
ⴆ㇇⌅ˈ䙊䗷а㡜ࡠ⢩↺ᩌ㍒䗷〻ᶕᆖҐ⇿њ Horn ᆀਕDŽ亶ฏ⨶䇪㻛⭘Ҿᢙབྷ↔
ᩌ㍒ѝ⇿↕㘳㲁Ⲵлањᴤ⢩↺ى䘹ٷ䇮䳶DŽ❦ਾى䘹ٷ䇮สҾަ൘䇝㓳ᮠᦞк
Ⲵᙗ㜭㻛䇴ՠDŽԕ䘉ᯩ⌅ˈFOCL 㔃ਸҶ FOIL Ⲵ䍚ႚⲴǃа㡜ࡠ⢩↺ᩌ㍒ㆆ
⮕ˈԕ৺࠶᷀ᯩ⌅ѝⲴ㿴ࡉ䬮࠶᷀᧘⨶DŽ
x ྲօᴰྭൠ㶽ਸݸ傼⸕䇶ࡠᯠ㿲ሏһ⢙ѝⲴ䰞仈ˈӽᱟᵪಘᆖҐѝѫ㾱Ⲵᖵ䀓ߣ
䰞仈ѻаDŽ
䘈ᴹ䇨ཊ㇇⌅䈅മ㔃ਸᖂ㓣઼࠶᷀ᆖҐDŽֻྲˈㅜ 6 ㄐ䇘䇪ⲴᆖҐ䍍ਦᯟ㖞ؑ㖁Ⲵᯩ⌅
ᨀҶਖа䙄ᖴDŽᵜㄐᵛቮⲴ৲㘳᮷⥞ᨀҶ䘋а↕䰵䈫ⲴֻᆀᶕⓀDŽ
Ґ仈
GoodCreditRiskĕEmpolyed, LowDebt
EmployedĕIsStudent
LowDebtĕHasStudentLoan, HasSavingsAccount
h(x)=w0+w1x+w2x2
˄a˅᧘ሬањởᓖл䱽⌅ࡉˈᆳᴰሿॆ৽ੁՐѝ਼Ⲵࡔᦞ˖ণ൘ٷ䇮઼䇝㓳ᮠᦞⴞ
ḷ٬ѻ䰤Ⲵ䈟ᐞᒣᯩ઼DŽ
12.5 EBNNӾ䀓䟺ѝᣭਆ䇝㓳ሬᮠⲴᯩ⌅ᱟˈ㘳㲁ᶴᡀ䀓䟺Ⲵ⾎㓿㖁㔌Ⲵᵳ٬઼◰⍫⣦
ᘱDŽ㘳㲁ањㆰঅⲴֻᆀˈަѝ䀓䟺ⲴᖒᔿѪᴹnњ䗃ⲴޕঅњsigmoidঅݳDŽ᧘ሬањ䗷〻ԕ
wfˆ ( x)
ᣭਆሬᮠ ˈަѝxiѪ䗃↔ࡠޕঅⲴݳ⢩ᇊ䇝㓳ᇎֻˈ fˆ ( x ) Ѫsigmoidঅݳ䗃ࠪˈᒦф
wx j x xi
x ԓ㺘sigmoidঅݳㅜjњ䗃ޕDŽҏਟԕ֯⭘䇠ਧxijԓ㺘xiⲴㅜjњ࠶䟿DŽᨀ⽪˖䈕ሬᮠо৽ੁՐ
j
䇝㓳⌅ࡉѝⲴሬᮠլDŽ
12.6 ⅑㘳㲁മ 12-8 ѝᱮ⽪Ⲵ FOCL Ⲵᩌ㍒↕僔DŽྲٷ൘ᩌ㍒Ⲵㅜаቲ䘹ᤙⲴٷ䇮᭩
Ѫ˖
CupĕHasHandle
໎ᕪᆖҐ㾱䀓ߣⲴᱟ䘉ṧⲴ䰞仈˖ањ㜭ཏᝏ⸕⧟ຳⲴ㠚⋫ agentˈᘾṧᆖҐ䘹ᤙ㜭䗮ࡠ
ަⴞḷⲴᴰՈࣘDŽ䘉њᖸާᴹᲞ䙽ᙗⲴ䰞仈ᓄ⭘ҾᆖҐ᧗ࡦ〫ࣘᵪಘӪǃ൘ᐕলѝᆖҐ䘋㹼
ᴰՈᐕᒿǃԕ৺ᆖҐỻ㊫ሩᔸㅹDŽᖃ agent ൘ަ⧟ຳѝࠪ⇿њࣘᰦˈᯭᮉ㘵Պᨀ྆
䍿ᡆ㖊ؑˈԕ㺘⽪㔃᷌⣦ᘱⲴ↓⺞оDŽֻྲˈ൘䇝㓳 agent 䘋㹼ỻ㊫ሩᔸᰦˈᯭᮉ㘵ਟ
൘⑨ᠿ㜌࡙ᰦ㔉ࠪ↓എᣕˈ㘼൘⑨ᠿཡ䍕ᰦ㔉ࠪ䍏എᣕˈަԆᰦىѪ䴦എᣕDŽAgent Ⲵԫ࣑ቡ
ᱟӾ䘉њ䶎ⴤ᧕Ⲵǃᴹᔦ䘏ⲴഎᣕѝᆖҐˈԕׯਾ㔝Ⲵࣘӗ⭏ᴰབྷⲴ㍟〟എᣕDŽᵜㄐ⵰䟽ӻ
㓽ањ〠Ѫ Q ᆖҐⲴ㇇⌅ˈᆳਟӾᴹᔦ䘏Ⲵഎᣕѝ㧧ਆᴰՈ᧗ࡦㆆ⮕ˈণ֯ agent ⋑ᴹᴹަޣ
ࣘՊሩ⧟ຳӗ⭏ᘾṧⲴ᭸᷌Ⲵݸ傼⸕䇶DŽ໎ᕪᆖҐоࣘᘱ㿴ࡂ˄dynamic programming˅㇇⌅
ᴹˈޣਾ㘵ᑨ㻛⭘Ҿ䀓ߣᴰՈॆ䰞仈DŽ
13.1 ԁ㔃
㘳㲁ᔪ䙐ањਟᆖҐᵪಘӪDŽ䈕ᵪಘӪ˄ᡆ agent˅ᴹаӋՐᝏಘਟԕ㿲ሏަ⧟ຳⲴ⣦ᘱ
˄state˅ᒦ㜭ࠪڊа㓴ࣘ˄action˅ᐢ᭩ਈ䘉Ӌ⣦ᘱDŽֻྲˈ〫ࣘᵪಘӪާᴹ䮌ཤ઼༠㓣ㅹ
ՐᝏಘˈᒦਟԕࠪڊĀⴤ䎠ā઼Ā䖜ᕟāㅹࣘDŽᆖҐⲴԫ࣑ᱟ㧧ᗇањ᧗ࡦㆆ⮕
˄policy˅ˈԕ䘹ᤙ㜭䗮ࡠⴞⲴⲴ㹼ѪDŽֻྲˈ↔ᵪಘӪⲴԫ࣑ᱟ൘ަ⭥⊐⭥䟿䖜վᰦࡠݵ
⭥ಘ䘋㹼⭥ݵDŽ
插图——原书页码:368
Agent: Agent
State: ⣦ᘱ
Reward: എᣕ
Action: ࣘ
Environment: ⧟ຳ
Goal:Learn to choose actions that maximize˖ ⴞḷ˖ᆖҐ䘹ᤙࣘ֯лᔿᴰབྷॆ
where: ަѝ
മ 13-1 ањо⧟ຳӔӂⲴ agent
↔agent⭏ᆈⲴ⧟ຳ㻛᧿䘠ѪḀਟ㜭Ⲵ⣦ᘱ䳶ਸSDŽᆳਟᢗ㹼ԫⲴਟ㜭ࣘ䳶ਸADŽ⇿⅑൘Ḁ⣦
ᘱstлᢗ㹼аࣘatˈ↔agentՊ᭦ࡠањᇎ٬എᣕrtˈᆳ㺘⽪↔⣦ᘱ-ࣘ䖜ᦒⲴ・ণ٬DŽྲ↔ӗ⭏Ҷа
㌫ࡇⲴ⣦ᘱsiˈࣘai઼・ণഎᣕriⲴ䳶ਸˈྲമᡰ⽪DŽAgentⲴԫ࣑ᱟᆖҐањ᧗ࡦㆆ⮕±:SėAˈᆳ
֯䘉ӋഎᣕⲴ઼Ⲵᵏᵋ٬ᴰབྷॆˈަѝਾ䶒Ⲵ≷ᣕ٬䲿⵰ԆԜⲴᔦ䘏ᤷᮠ߿ሿDŽ
മ 13-1 ѝਟᾊൠⴻࡠˈᆖҐ᧗ࡦㆆ⮕ԕ֯㍟〟എᣕᴰབྷॆ䘉њ䰞仈䶎ᑨᲞ䙽ˈᆳ㾶ⴆ
ҶᵪಘӪᆖҐԫ࣑ԕཆⲴ䇨ཊ䰞仈DŽа㡜ൠˈ↔䰞仈ᱟањ䙊䗷ᆖҐᶕ᧗ࡦᒿࡇ䗷〻Ⲵ䰞仈DŽ
ֻྲ⭏ӗՈॆ䰞仈ˈަѝ㾱䘹ᤙа㌫ࡇⲴ⭏ӗࣘˈ㘼֯⭏ӗࠪⲴ䍗⢙߿৫ަᡀᵜ䗮ࡠᴰབྷ
ॆDŽྲаӋᒿࡇ䈳ᓖ䰞仈ˈۿ൘ањབྷᐲѝ䘹ᤙࠪ』䖖䘀䖭҈ᇒˈަѝഎᣕ࠭ᮠѪ҈ᇒㅹ
ᖵⲴᰦ䰤઼ࠪ』䖖䱏Ⲵᮤփ⋩㙇DŽа㡜ᶕ䈤ˈᡁԜᝏޤ䏓Ⲵ䰞仈㊫රᱟ˖ањ agent 䴰㾱䙊䗷
ᆖҐ઼䘹ᤙࣘᶕ᭩ਈ⧟ຳ⣦ᘱˈ㘼ަѝ֯⭘Ҷањ㍟〟എᣕ࠭ᮠᶕᇊѹԫࣘᒿࡇⲴ䍘
䟿DŽ൘↔㊫䰞仈ѝDŽᡁԜ㘳㲁ࠐ⢩↺ⲴṶᷦ˖वᤜࣘᱟާᴹ⺞ᇊᙗⲴ䗃ࠪ˗agent ᱟ
ᴹަࣘሩ⧟ຳⲴ᭸᷌Ⲵݸ傼⸕䇶DŽ
ᆖҐ᧗ࡦㆆ⮕ԕ䘹ᤙࣘⲴ䰞仈൘Ḁ〻ᓖк㊫լҾަԆㄐ䇘䇪䗷Ⲵ࠭ᮠ䙬䘁䰞仈DŽ䘉䟼
ᖵᆖҐⲴⴞḷ࠭ᮠѪ᧗ࡦㆆ⮕±:SėADŽᆳ൘㔉ᇊᖃࡽ⣦ᘱ S 䳶ਸѝⲴ s ᰦˈӾ䳶ਸ A ѝ䗃ࠪ
ањਸ䘲Ⲵࣘ aDŽ❦㘼ˈ໎ᕪᆖҐ䰞仈оަԆⲴ࠭ᮠ䙬䘁䰞仈ᴹࠐњ䟽㾱н਼˖
x ᔦ䘏എᣕ˄delayed reward˅DŽ Agent Ⲵԫ࣑ᱟᆖҐањⴞḷ࠭ᮠ±DŽᆳᢺᖃࡽ⣦
ᘱ s ᱐ሴࡠᴰՈࣘ a=±(s)DŽ൘ࡽ䶒ㄐ㢲ѝˈᡁԜᙫᱟٷᇊ൘ᆖҐ±䘉ṧⲴⴞḷ
࠭ᮠᰦˈ⇿њ䇝㓳ṧֻᱟᒿⲴڦᖒᔿ<s, ±(s)>DŽ❦㘼൘໎ᕪᆖҐѝˈ䇝㓳ؑн
㜭ԕ䘉ᖒᔿᗇࡠDŽ৽ˈᯭᮉ㘵ਚ൘ agent ᢗ㹼ަᒿࡇࣘᰦᨀањᒿࡇ・ণ
എᣕ٬ˈഐ↔ agent 䶒Ѥањᰦ䰤ؑ⭘࠶䝽˄temporal credit assignment ˅Ⲵ䰞仈˖
⺞ᇊᴰ㓸എᣕⲴ⭏ᡀᓄᖂ࣏ҾަᒿࡇѝଚањࣘDŽ
x ᧒㍒˄exploration ˅DŽ൘໎ᕪᆖҐѝˈagent 䙊䗷ަ䘹ᤙⲴࣘᒿࡇᖡ૽䇝㓳ṧֻ
Ⲵ࠶ᐳDŽ䘉ӗ⭏Ҷањ䰞仈˖ଚᇎ傼ㆆ⮕ਟӗ⭏ᴰᴹ᭸ⲴᆖҐDŽᆖҐಘ䶒ѤⲴ
ᱟањᣈѝⲴ䰞仈˖ᱟ䘹ᤙ᧒㍒ᵚ⸕Ⲵ⣦ᘱ઼ࣘ˄ԕ᭦䳶ᯠؑ˅ˈ䘈ᱟ䘹ᤙ
ᆳᐢ㓿ᆖҐ䗷ǃՊӗ⭏儈എᣕⲴ⣦ᘱ઼ࣘ˄ԕ֯㍟〟എᣕᴰབྷॆ˅DŽ
x 䜘࠶ਟ㿲ሏ⣦ᘱ˄partially observable states˅DŽ㲭❦ѪҶᯩׯ䎧㿱ˈਟԕٷᇊ agent
Րᝏಘ൘⇿а↕ਟᝏ⸕ࡠ⧟ຳⲴޘ䜘⣦ᘱˈն൘ᇎ䱵ⲴᛵߥлՐᝏಘਚ㜭ᨀ䜘
࠶ؑDŽֻྲ˖ᑖᴹࡽੁ䮌ཤⲴᵪಘӪн㜭ⴻࡠᆳਾ䶒ⲴᛵߥDŽ൘↔ᛵߥлਟ㜭
䴰㾱㔃ਸ㘳㲁ަԕࡽⲴ㿲ሏԕ৺ᖃࡽⲴՐᝏಘᮠᦞԕ䘹ᤙࣘˈ㘼ᴰ֣Ⲵㆆ⮕ᴹ
ਟ㜭ᱟ䘹ᤙ⢩ᇊⲴࣘԕ᭩䘋⧟ຳਟ㿲ሏᙗDŽ
x 䮯ᵏᆖҐ˄life-long learning˅DŽн䊑࠶Ⲵ࠭ᮠ䙬䘁ԫ࣑ˈᵪಘӪᆖҐ䰞仈㓿ᑨ㾱
≲↔ᵪಘӪ൘਼Ⲵ⧟ຳл֯⭘਼ⲴՐᝏಘᆖҐཊњޣԫ࣑DŽᘾṧ൘ゴሿⲴ
䎠ᓺѝ㹼䎠ˈԕ৺ᘾṧӾ◰ݹᢃঠᵪѝਆᗇᢃঠ㓨ㅹDŽ䘉֯ᗇᴹਟ㜭֯⭘ࡽݸ㧧
ᗇⲴ㓿傼ᡆ⸕䇶൘ᆖҐᯠԫ࣑ᰦ߿ሿṧᵜ༽ᵲᓖDŽ
13.2 ᆜҖԱࣗ
൘ᵜ㢲ѝˈᡁԜᢺᆖҐᒿࡇ᧗ࡦㆆ⮕Ⲵ䰞仈ᴤ㋮⺞ൠᖒᔿॆDŽᴹ䇨ཊᯩ⌅ਟԕࡠڊDŽֻ
ྲ˖ਟٷᇊ agent Ⲵ㹼Ѫᱟ⺞ᇊᙗᡆ䶎⺞ᇊᙗⲴ˗ٷᇊ agent ਟԕ亴⍻⇿ањ㹼Ѫᡰӗ⭏Ⲵ⣦
ᘱˈᡆн㜭亴⍻˗ٷᇊ agent ᱟ⭡ཆ䜘уᇦ䙊䗷⽪ֻᴰՈࣘᒿࡇᶕ䇝㓳ˈᡆᗵ享䙊䗷ᢗ㹼㠚
ᐡ䘹ᤙⲴࣘᶕ䇝㓳DŽ䘉䟼ᡁԜสҾ傜ቄਟཛߣㆆ䗷〻ᇊѹ䈕䰞仈Ⲵа㡜ᖒᔿDŽ䘉䰞仈ᖒᔿ
䚥ᗚമ 13-1 ⽪ֻⲴ䰞仈DŽ
AgentⲴԫ࣑ᱟᆖҐањㆆ⮕±:SėAˈԕสҾᖃࡽ㿲ሏࡠⲴ⣦ᘱst䘹ᤙлⲴа↕ࣘat˗ণ
±(st)=atDŽྲօ㋮⺞ᤷᇊ↔agent㾱ᆖҐⲴㆆ⮕±˛ањ᰾ᱮⲴᯩ⌅ᱟ㾱≲↔ㆆ⮕ሩᵪಘӪӗ
⭏ᴰབྷⲴ〟㍟എᣕDŽѪ㋮⺞ൠ㺘䘠䘉њ㾱≲ˈᡁԜᇊѹ˖䙊䗷䚥ᗚањԫㆆ⮕±Ӿԫࡍ
±
⣦ᘱst㧧ᗇⲴ㍟〟٬V (st)Ѫ˖
V S ( st ) { rt Jrt 1 J 2 rt 2 ...
f
{ ¦ J i rt i ˄13.1˅
i 0
ަѝഎᣕᒿࡇrt+iⲴ⭏ᡀᱟ䙊䗷⭡⣦ᘱstᔰᒦ䟽༽֯⭘ㆆ⮕±ᶕ䘹ᤙк䘠Ⲵࣘ˄ྲat=±
(st)ˈat+1=±(st+1)ㅹ˅DŽ䘉䟼 0ݤ<1 Ѫаᑨ䟿ˈᆳ⺞ᇊҶᔦ䘏എᣕо・ণഎᣕⲴሩ٬DŽ⺞
࠷ൠ䇢ˈ൘ᵚᶕⲴㅜiᰦ䰤↕᭦ࡠⲴഎᣕ㻛ഐᆀ¤iԕᤷᮠ㓗ᣈ㇇DŽ⌘ྲ᷌䇮㖞¤=0ˈ䛓Ѹਚ
㘳㲁・ণഎᣕDŽᖃ¤㻛䇮㖞Ѫ᧕䘁 1 Ⲵ٬ᰦˈᵚᶕⲴഎᣕሩҾ・ণഎᣕᴹᴤབྷⲴ䟽㾱〻ᓖDŽ
±
⭡ᔿ 13.1 ᇊѹⲴ䟿V (s)ᑨ㻛〠Ѫ⭡ㆆ⮕±Ӿࡍ⣦ᘱs㧧ᗇⲴᣈ㇇㍟〟എᣕ˄discounted
cumulative reward˅DŽᢺᵚᶕⲴഎᣕሩҾ・ণഎᣕ䘋㹼ᣈ㇇ᱟਸ⨶ⲴˈഐѪ൘䇨ཊⲴᛵߥ
лˈᡁԜ㾱ᐼᵋ㧧ᗇᴤᘛⲴഎᣕDŽн䗷ˈަԆⲴᮤփഎᣕᇊѹҏ㻛⹄ウ䗷DŽֻྲ˖ᴹ䲀≤ᒣഎ
¦
h
ᣕ˄finite horizon reward ˅ᇊѹѪ r
i 0 t i
ˈᆳ䇑㇇ᴹ䲀Ⲵh↕എᣕⲴ䶎ᣈ㇇઼DŽਖаᇊ
1 h
ѹᯩᔿᱟᒣ൷എᣕ˄average raward ˅ lim hof ¦ rt i DŽᆳ㘳㲁Ⲵᱟagentᮤњ⭏ભᵏ⇿ᰦ
h i0
䰤↕Ⲵᒣ൷എᣕDŽᵜㄐਚ䲀ࡦҾ㘳㲁ᔿ 13.1 ᇊѹⲴᣈ㇇എᣕDŽMahadevan˄1996˅䇘䇪ҶᖃՈ
ॆ߶ࡉѪᒣ൷എᣕᰦⲴ໎ᕪᆖҐDŽ
⧠൘ਟԕ㋮⺞䱸䘠agentⲴᆖҐԫ࣑DŽᡁԜ㾱≲agentᆖҐࡠањㆆ⮕±ˈ֯ᗇሩҾᡰᴹ⣦
±
ᘱsˈV (s)ѪᴰབྷDŽ↔ㆆ⮕㻛〠ѪᴰՈㆆ⮕˄optimal policy ˅ˈᒦ⭘±*ᶕ㺘⽪DŽ
S*
Ѫㆰॆ㺘⽪ˈᡁԜሶ↔ᴰՈㆆ⮕Ⲵ٬࠭ᮠ V ( s ) 䇠V*(s)DŽV*(s)㔉ࠪҶᖃagentӾ⣦ᘱsᔰ
ᰦਟ㧧ᗇⲴᴰབྷᣈ㇇㍟䇑എᣕˈণӾ⣦ᘱsᔰ䚥ᗚᴰՈㆆ⮕ᰦ㧧ᗇⲴᣈ㇇㍟〟എᣕDŽ
ᡁԜᐢ㓿ᇊѹҶ⣦ᘱǃ઼ࣘ・ণഎᣕˈਚ㾱䘹ᤙᣈ㇇ഐᆀ¤Ⲵ٬ˈቡਟԕ⺞ᇊᴰՈㆆ
⮕±*઼ᆳⲴ٬࠭ᮠV*(s)ҶDŽ൘䘉䟼ᡁԜ䘹ᤙ¤=0.9DŽമ 13-2 Ⲵлᯩᱮ⽪Ҷ൘↔䇮ᇊлⲴа
ᴰՈㆆ⮕˄䘈ᴹަԆⲴᴰՈㆆ⮕˅DŽоԫㆆ⮕аṧˈ䈕ㆆ⮕⺞࠷ൠᤷᇊҶagent൘ԫ㔉ᇊ
⣦ᘱлᓄ䘹ᤙⲴањࣘDŽྲᡰᜣ䊑Ⲵ䛓ṧˈ䈕ᴰՈㆆ⮕ᢺagentԕᴰ⸝䐟ᖴሬੁ⣦ᘱGDŽ
插图——原书页码:372
(immediate reward)values˖ ・ণഎᣕ٬
values: ٬
values: ٬
One optimal policy˖ањᴰՈㆆ⮕
മ 13-2 䈤᰾ Q-ᆖҐⲴสᵜᾲᘥⲴањㆰঅⲴ⺞ᇊᙗц⭼
⇿њᯩṬԓ㺘ањн਼Ⲵ⣦ᘱˈ⇿њ㇝ཤԓ㺘ањн਼ⲴࣘDŽ・ণഎᣕ࠭ᮠᢺ䘋ⴞޕḷ⣦ᘱG
Ⲵഎᣕ䍻Ҹ 100ˈަԆⲴ䍻Ҹ 0DŽV*(s)઼Q(s, a)Ⲵ٬ᶕ㠚Ҿr(s, a)ԕ৺ᣈ㇇ഐᆀ¤=0.9DŽሩᓄҾᴰབྷQ٬
ⲴࣘⲴањᴰՈㆆ⮕ҏᱮ⽪൘മѝDŽ
മ 13-2 Ⲵਣ䗩Ⲵമᱮ⽪⇿⣦ᘱⲴV*٬DŽֻྲ˖㘳㲁↔മⲴਣл䀂Ⲵ⣦ᘱDŽ↔⣦ᘱⲴV*٬
Ѫ 100ˈഐѪ൘↔⣦ᘱлᴰՈㆆ⮕Պ䘹ᤙĀੁкāⲴࣘˈӾ㘼ᗇࡠ・ণഎᣕ 100DŽ❦ਾˈ
agentՊ⮉൘੨᭦⣦ᘱѝˈн᧕ࡠᴤཊⲴഎᣕDŽ㊫լⲴˈѝлᯩⲴ⣦ᘱⲴV*٬Ѫ 90DŽ䘉ᱟഐ
ѪᴰՈㆆ⮕Պ֯agentӾ䘉䟼ੁਣ〫ࣘ˄ᗇࡠѪ 0 Ⲵ・ণഎᣕ˅ˈ❦ਾੁк˄⭏ᡀѪ 100 Ⲵ・ণ
എᣕ˅DŽ䘉ṧˈ↔⣦ᘱⲴᣈ㇇䗷ⲴഎᣕѪ˖
0+¤100+¤20+¤30+...=90
എᗶ V*Ⲵᇊѹѝˈᆳᱟ൘ᰐ䲀ᵚᶕкⲴᣈ㇇എᣕ઼DŽ൘䘉њ⢩ᇊⲴ⧟ຳлˈаն agent ࡠ
䗮Ҷ੨᭦⣦ᘱ Gˈަᰐ䲀ᵚᶕሶ⮉൘↔⣦ᘱѝᒦ㧧ᗇ 0 എᣕDŽ
13.3 Q ᆜҖ
ањagent൘ԫⲴ⧟ຳѝྲօ㜭ᆖࡠᴰՈⲴㆆ⮕±*˛ⴤ᧕ᆖҐ࠭ᮠ±*: SėAᖸഠ䳮ˈഐ
Ѫ䇝㓳ᮠᦞѝ⋑ᴹᨀ<s, a>ᖒᔿⲴ䇝㓳ṧֻDŽѪᴯԓˈᜏаਟ⭘Ⲵ䇝㓳ؑᱟ・ণഎᣕ〻
ᒿࡇr(si,ai)ˈi=0,1,2...DŽྲᡁԜሶⴻࡠⲴˈ㔉ᇊҶ䘉㊫රⲴ䇝㓳ؑˈᴤᇩ᱃ⲴᱟᆖҐањ
ᇊѹ൘⣦ᘱ઼ࣘкⲴᮠ٬䇴ՠ࠭ᮠˈ❦ਾԕ↔䇴ՠ࠭ᮠⲴᖒᔿᇎ⧠ᴰՈㆆ⮕DŽ
Agentᓄቍ䈅ᆖҐӰѸṧⲴ䇴ՠ࠭ᮠ˛ᖸ᰾ᱮⲴањ䘹ᤙᱟV* DŽਚ㾱ᖃV*(s1)>V*(s2)ᰦˈ
agent䇔Ѫ⣦ᘱs1ՈҾs2ˈഐѪӾs1ѝਟᗇࡠ䖳བྷⲴ・ণഎᣕDŽᖃ❦agentⲴㆆ⮕㾱䘹ᤙⲴᱟࣘ
㘼䶎⣦ᘱDŽ❦㘼൘ਸ䘲Ⲵ䇮ᇊѝ֯⭘V* ҏਟ䘹ᤙࣘDŽ൘⣦ᘱsлⲴᴰՈࣘᱟ֯・ণഎᣕ
r(s,a)࣐к・ণਾ㔗⣦ᘱⲴV*٬˄㻛¤ᣈ㇇˅ᴰབྷॆⲴࣘaDŽ
˄എᗶ¥(s,a)ԓ㺘ᓄ⭘ࣘaࡠ⣦ᘱsⲴ㔃᷌⣦ᘱ˅DŽഐ↔ˈagentਟ䙊䗷ᆖҐV*㧧ᗇᴰՈㆆ
⮕ⲴᶑԦᱟ˖ᆳާᴹ・ণഎᣕ࠭ᮠr઼⣦ᘱ䖜ᦒ࠭ᮠ¥Ⲵᆼ㖾⸕䇶DŽᖃagentᗇ⸕Ҷཆ⭼⧟ຳ⭘
ᶕ૽ᓄࣘⲴ࠭ᮠr઼¥Ⲵᆼ㖾⸕䇶ˈᆳቡਟ⭘ᔿ 13.3 ᶕ䇑㇇ԫ⣦ᘱлⲴᴰՈࣘDŽ
нᒨⲴᱟˈਚ൘agentާᴹr઼¥ᆼ㖾⸕䇶ᰦˈᆖҐV*ᱟᆖҐᴰՈㆆ⮕Ⲵᴹ᭸ᯩ⌅DŽ䘉㾱
≲ᆳ㜭ᆼ㖾亴⍻ԫ⣦ᘱ䖜ᦒⲴ・ণ㔃᷌˄ণ・ণഎᣕ઼・ণਾ㔝˅DŽ൘䇨ཊᇎ䱵Ⲵ䰞仈ѝˈ
∄ྲᵪಘӪ᧗ࡦˈagentԕ৺ᆳⲴ〻ᒿ䇮䇑㘵䜭нਟ㜭亴⸕ݸ䚃ᓄ⭘ԫࣘࡠԫ⣦ᘱⲴ⺞
࠷䗃ࠪDŽֻྲˈሩҾањ⭘㟲䬢൏ⲴᵪಘӪˈᖃ㔃᷌⣦ᘱवਜ਼൏ඇⲴ⣦ᘱᰦˈྲօ᧿䘠¥࠭
ᮠ˛ഐ↔ᖃ¥ᡆr䜭ᵚ⸕ᰦˈᆖҐV*ᱟᰐࣙҾ䘹ᤙᴰՈࣘⲴˈഐѪagentн㜭⭘ᔿ 13-3 䘋㹼䇴
ՠDŽ൘ᴤа㡜Ⲵ䘹ᤙѝˈagentᓄ֯⭘ӰѸṧⲴ䇴ՠ࠭ᮠ˛ла㢲ᇊѹⲴ䇴ՠ࠭ᮠQᨀҶㆄ
ṸDŽ
13.3.1 Q ࠳ᮦ
Q( s, a ) { r ( s, a ) JV * (G ( s, a )) (13.4)
⌘ Q(s,a)↓ᱟᔿ 13.3 ѝѪ䘹ᤙ⣦ᘱ s кⲴᴰՈࣘ a ᓄᴰབྷॆⲴ䟿ˈഐ↔ਟሶᔿ 13.3 䟽
߉Ѫ Q(s,a)Ⲵᖒᔿ˖
䟽߉䈕ᔿѪӰѸᖸ䟽㾱˛ഐѪᆳᱮ⽪Ҷྲ᷌agentᆖҐQ࠭ᮠ㘼нᱟV*࠭ᮠˈণ֯൘㕪ቁ࠭
ᮠr઼¥Ⲵ⸕䇶ᰦˈagentҏਟ䘹ᤙᴰՈࣘDŽᔿ 13.5 ᾊൠᱮ⽪ࠪˈagentਚ享㘳㲁ަᖃࡽⲴ⣦
ᘱsл⇿њਟ⭘Ⲵࣘaˈᒦ䘹ᤙަѝ֯Q(s,a)ᴰབྷॆⲴࣘDŽ
䘉а⛩ᔰⴻ䎧ᶕԔӪཷˈਚ享ሩᖃࡽⲴ⣦ᘱⲴ Q Ⲵተ䜘٬䟽༽৽ࠪڊᓄˈቡਟ䘹ᤙ
ࡠޘተᴰՈॆⲴࣘᒿࡇˈ䘉ણ⵰ agent н享䘋㹼ࡽⷫᙗᩌ㍒ˈн享᰾⺞ൠ㘳㲁Ӿ↔ࣘᗇ
ࡠⲴ⣦ᘱˈቡਟ䘹ᤙᴰՈࣘDŽQ ᆖҐⲴ㖾࿉ѻ༴а䜘࠶൘Ҿަ䇴ՠ࠭ᮠⲴᇊѹ㋮⺞ൠᤕᴹ↔
ᙗ˖ᖃࡽ⣦ᘱ઼ࣘⲴ Q ٬൘অњⲴᮠ٬ѝᾲᤜҶᡰᴹ䴰㾱Ⲵؑˈԕ⺞ᇊ൘⣦ᘱ s л䘹ᤙ
ࣘ a ᰦ൘ሶᶕՊ㧧ᗇⲴᣈ㇇㍟䇑എᣕDŽ
Ѫ䈤᰾䘉а⛩ˈ㿱മ 13-2DŽަѝ൘ㆰঅⲴṬᆀц⭼ѝᱮ⽪Ҷ⇿њ⣦ᘱ઼ࣘⲴQ٬DŽ⌘
⇿њ⣦ᘱࣘⲴ䖜ᦒⲴQ٬ㅹҾ↔䖜ᦒⲴr٬࣐к㔃᷌⣦ᘱⲴV*٬˄⭘¤ᣈ㇇˅DŽ䘈㾱⌘മѝ
ᱮ⽪ⲴᴰՈㆆ⮕ሩᓄҾ䘹ᤙᴹᴰབྷⲴQ٬ⲴࣘDŽ
13.3.2 ᆜҖ Q ⲺжѠ㇍⌋
ᆖҐ Q ࠭ᮠሩᓄҾᆖҐᴰՈㆆ⮕DŽQ ᘾṧ㜭㻛ᆖҐࡠ˛
ޣ䭞൘Ҿ㾱ࡠањਟ䶐Ⲵᯩ⌅ˈ൘ਚᴹᰦ䰤кኅᔰⲴ・ণഎᣕᒿࡇⲴᛵߥлՠ䇑䇝㓳
٬DŽ䘉ਟ䙊䗷䘝ԓ䙬䘁Ⲵᯩ⌅ᆼᡀDŽѪ⨶䀓ᘾṧᆼᡀ䘉а䗷〻ˈ⌘Q઼V*ѻ䰤Ⲵᇶ࠷㚄㌫˖
V * ( s) max Q( s, a c)
ac
ᆳਟ㻛⭘Ҿ䟽߉ᔿ 13.4 Ѫ
Qˆ ( s, a) m r J max Qˆ ( s c, a c) ˄13.7˅
ac
⌘↔䇝㓳٬֯⭘ agent ሩᯠ⣦ᘱ s´Ⲵᖃࡽ Qˆ ٬ᶕ㋮ॆަሩࡽа⣦ᘱ s Ⲵ Qˆ (s,a)ՠ䇑DŽ↔
䇝㓳㿴ࡉᱟӾᔿ 13.6 ѝᗇࡠⲴˈн䗷↔䇝㓳٬㘳㲁 agent Ⲵ䘁լ Q̂ ˈ㘼ᔿ 13.6 ᓄ⭘ࡠᇎ䱵Ⲵ Q
࠭ᮠDŽ⌘㲭❦ᔿ 13.6 ԕ࠭ᮠ¥(s,a)઼ r(s,a)Ⲵᖒᔿ᧿䘠 Qˈagent н䴰⸕䚃䘉Ӌа㡜࠭ᮠᶕᓄ
⭘ᔿ 13.7 Ⲵ䇝㓳㿴ࡉDŽ৽ˈᆳ൘ަ⧟ຳѝᢗ㹼ࣘˈᒦ㿲ሏ㔃᷌⣦ᘱ s´઼എᣕ rDŽ䘉ṧˈᆳ
ਟ㻛ⴻᱟ൘ s ઼ a Ⲵᖃࡽ٬к䟷ṧDŽ
ᣈ㇇ഐᆀJѪԫᑨ䟿┑䏣 0dJ<1DŽ
Q ᆖҐ㇇⌅
ˆ (s,a)Ѫ 0
ሩ⇿њ s,aˈࡍॆ㺘亩 Q
㿲ሏᖃࡽ⣦ᘱ s
аⴤ䟽༽˖ڊ
䘹ᤙањࣘ a ᒦᢗ㹼ᆳ
᧕᭦ࡠ・ণഎᣕ r
㿲ሏᯠ⣦ᘱ s´
ˆ (s,a)᤹➗лᔿᴤᯠ㺘亩˖
ሩQ
Qˆ ( s, a) m r J max Qˆ ( s c, a c)
ac
sĕs´
13.3.3 ⽰ׁ
插图——原书页码:376
Initial state: ࡍ⣦ᘱ
Next state: ла⣦ᘱ
ᐖ 䗩 Ⲵ മ ᱮ ⽪ Ҷ ᵪ ಘ Ӫ R Ⲵ ࡍ ⣦ ᘱ s1 ˈ ԕ ৺ ࡍ ٷ䇮 ѝ ࠐ њ Ⲵ ޣ Q̂ ٬ DŽ ֻ ྲ ˈ
Qˆ ( s1 , a right ) =72.9ˈަѝarightᤷԓRੁਣ〫ࣘⲴࣘDŽᖃᵪಘӪᢗ㹼ࣘarightਾˈᆳ᭦ࡠ・ণഎᣕr=
0ˈᒦ䖜ᦒࡠ⣦ᘱs2DŽ❦ਾᆳสҾަሩᯠ⣦ᘱs2Ⲵ Q̂ ՠ䇑ᴤᯠަ Q ˆ ( s , a ) ՠ䇑DŽ䘉䟼¤=0.9DŽ
1 right
(s, a, n)Qˆ n 1 ( s, a ) t Qˆ n ( s, a )
(s, a, n)0 d Qˆ n ( s, a ) d Q ( s, a )
13.3.4 ᭬ᮑᙝ
ሩ᭦ᮋᙗ䇱᰾Ⲵޣ䭞ᙍ䐟൘Ҿˈᴹᴰབྷ䈟ᐞⲴ㺘亩 Q̂ (s,a)ᗵ享൘ަᴤᯠᰦሶ䈟ᐞ᤹ഐᆀ¤
߿ሿDŽഐ൘ҾᆳⲴᯠ٬Ⲵа䜘࠶䎆Ҿᴹ䈟ᐞ ⲴੁٮQ̂ ՠ䇑ˈަ։Ⲵ䜘࠶䎆Ҿᰐ䈟ᐞⲴ㿲
ሏࡠⲴ・ণഎᣕ rDŽ
ᇊ⨶ 13.1DŽ⺞ ᇊᙗ傜ቄਟཛߣㆆ䗷〻ѝⲴQᆖҐⲴ᭦ᮋᙗDŽ㘳㲁ањQᆖҐagentˈ൘ањ⺞ᇊᙗ
MDPѝˈᒦфᴹᴹ⭼എᣕ (s , a ) r ( s , a ) d c DŽQᆖҐagent֯⭘ᔿ 13.7 Ⲵ䇝㓳㿴ࡉˈሶ㺘 Q̂ (s,a)ࡍ
ྲ᷌⇿њ⣦ᘱ-ࣘሩ䜭㻛ᰐ䲀仁㑱Ⲵ䇯䰞ˈ䛓ѸሩᡰᴹsˈaˈᖃnėĞᰦ Q̂ n(s,a)᭦ᮋࡠQ(s,a)DŽ
䇱᰾˖ഐѪ⇿њ⣦ᘱ-ࣘ䖜ᦒᰐ䲀仁㑱ਁ⭏ˈ㘳㲁䘎㔝Ⲵ४䰤ˈަѝ⇿њ⣦ᘱ-ࣘ䖜ᦒ㠣ቁਁ⭏
䗷а⅑DŽᡰ䴰㾱䇱᰾Ⲵᱟˈ൘ Q̂ 㺘ѝᡰᴹ㺘亩кⲴᴰབྷ䈟ᐞ൘⇿њ䘉ṧⲴ䘎㔝४䰤㠣ቁ᤹ഐᆀ ¤߿
ቁDŽ Q̂ nѪn⅑ᴤᯠਾagentՠ䇑ⲴQ٬㺘DŽԔnѪ Q̂ nѝᴰབྷ䈟ᐞˈণ˖
' n { max Qˆ n ( s, a ) Q ( s, a )
s ,a
Q̂ n+1(s,a)ѝⲴ䈟ᐞ䟿Ѫ˖
J max Qˆ n ( s c, a c) max Q( s c, a c)
ac ac
d J max Qˆ n ( s c, a c) Q( s c, a c)
ac
Qˆ n 1 ( s, a) Q( s, a) d J' n
к䶒Ⲵㅜй㹼ӾㅜҼ㹼ѝሬࠪˈഐᱟሩԫєњ࠭ᮠf1઼f2ᴹлࡇнㅹᔿᡀ・˖
13.3.5 ᇔ僂ㆌ⮛
ˆ
k Q ( s ,ai )
P(ai | s )
¦
Qˆ ( s , a j )
j
k
ަѝP(ai|s)Ѫagent൘⣦ᘱsᰦ䘹ᤙࣘaiⲴᾲ⦷ˈk>0 Ѫаᑨ䟿ˈᆳ⺞ᇊ↔䘹ᤙՈݸ㘳㲁儈
Q̂ ٬Ⲵ〻ᓖDŽ䖳བྷⲴk٬Պሶ䖳儈Ⲵᾲ⦷䍻Ҹ䎵ࠪᒣ൷ Q̂ Ⲵࣘˈ㠤֯agent࡙⭘ᆳᡰᆖҐࡠⲴ
⸕䇶ᶕ䘹ᤙᆳ䇔ѪՊ֯എᣕᴰབྷⲴࣘDŽ৽ˈ䖳ሿⲴk٬Պ֯ަԆࣘᴹ䖳儈Ⲵᾲ⦷ˈሬ㠤
agent᧒㍒䛓Ӌᖃࡽ Q̂ ٬䘈н儈ⲴࣘDŽ൘ḀӋᛵߥлˈkᱟ䲿⵰䘝ԓ⅑ᮠ㘼ਈॆⲴDŽԕ֯agent
൘ᆖҐⲴᰙᵏਟ⭘᧒㍒රㆆ⮕ˈ❦ਾ䙀↕䖜ᦒࡠ࡙⭘රⲴㆆ⮕DŽ
13.3.6 ᴪ᯦ᓅࡍ
к䶒᭦ᮋᙗᇊ⨶ањ䟽㾱ᙗ᳇⽪൘ҾˈQ ᆖҐн䴰㾱⭘ᴰՈࣘ䘋㹼䇝㓳ˈቡਟԕ᭦ᮋࡠ
ᴰՈㆆ⮕DŽᇎ䱵кˈਚ㾱⇿↕Ⲵ䇝㓳ࣘᆼޘ䲿ᵪ䘹ᤙˈ֯ᗇ㔃᷌䇝㓳ᒿࡇᰐ䲀仁㑱Ⲵ䇯䰞⇿
њ⣦ᘱ-ࣘ䖜ᦒˈቡਟԕᆖҐࡠ Q ࠭ᮠ˄ԕ৺ᴰՈㆆ⮕˅DŽ䘉аһᇎᔪ䇞᭩ਈ䇝㓳䖜ᦒṧֻ
Ⲵᒿࡇˈԕ᭩䘋䇝㓳᭸⦷㘼нড৺ᴰ㓸Ⲵ᭦ᮋᙗDŽѪ䈤᰾䘉а⛩ˈ⅑㘳㲁൘ањ MDP ѝᴹ
অњ੨᭦ⴞḷ⣦ᘱⲴᆖҐ䗷〻ˈྲ਼ 13-1 ѝᡰ⽪DŽྲԕࡽ䛓ṧˈٷᇊ֯⭘ᒿࡇॆⲴᛵ㢲
˄episode˅ᶕ䇝㓳 agentDŽሩ⇿њᛵ㢲ˈagent 㻛᭮㖞൘ањ䲿ᵪࡍ⣦ᘱˈ❦ਾᢗ㹼ࣘԕᴤ
ᯠަ Q̂ 㺘ˈⴤࡠᆳࡠ䗮੨᭦⣦ᘱDŽ❦ਾᔰањᯠⲴ䇝㓳ᛵ㢲ˈ䙊䗷ሶ agent Ӿⴞḷ⣦ᘱ䖜ᦒ
ࡠањᯠⲴ䲿ᵪࡍ⣦ᘱDŽྲࡽ䶒ᤷࠪⲴˈྲ᷌ᔰᡰᴹ Q̂ ٬ⲴࡍॆѪ 0ˈࡉ൘ㅜањᛵ㢲
ਾˈagent Ⲵ Qˆ 㺘ѝਚᴹањ㺘亩᭩ਈ˖ণሩᓄҾᴰਾ䖜ᦒࡠⴞḷ⣦ᘱⲴ㺘亩DŽྲ᷌൘ㅜҼњ
ᛵ㢲ѝˈagent ᚠྭӾ਼Ⲵ䲿ᵪࡍ⣦ᘱ⋯⵰਼ࣘᒿࡇ〫ࣘˈࡉਖа㺘亩ਈѪ䶎 0ˈ↔
㊫᧘DŽྲ᷌䟽༽ൠԕ਼Ⲵᯩᔿ䘀㹼ᛵ㢲ˈ䶎 0 Qˆ ٬Ⲵ䗩㕈䙀⑀ੁਣ〫ࣘˈӾⴞḷ⣦ᘱᔰˈ
⇿њᛵ㢲〫ࣘࡠањᯠⲴ⣦ᘱ-ࣘ䖜ᦒDŽ⧠൘㘳㲁൘䘉Ӌ਼Ⲵ⣦ᘱ-ࣘ䖜ᦒкⲴ䇝㓳ˈն
ሩ⇿њᛵ㢲ԕ৽ੁⲴᰦᒿDŽণሩ⇿њ㘳㲁Ⲵ䖜ᦒᓄ⭘ᔿ 13-7 ѝ਼Ⲵᴤᯠ㿴ࡉˈնԕ䘶ᒿᢗ
㹼䘉ӋᴤᯠDŽ䘉ṧˈ൘ㅜањᛵ㢲ਾˈagent Պᴤᯠ䗮ࡠⴞḷ䐟ᖴк⇿њ䖜ᦒⲴ Q̂ ՠ䇑DŽ↔䇝
㓳䗷〻ᱮ❦Պ൘ᴤቁⲴᗚ⧟⅑ᮠ᭦ᮋˈ㲭❦ᆳ㾱≲ agent ൘ᔰ↔ᛵ㢲䇝㓳ࡽ֯⭘ᴤཊⲴ
ᆈᶕᆈۘᮤњᛵ㢲DŽ
᭩䘋᭦ᮋ䙏⦷ⲴㅜҼњㆆ⮕ᱟᆈۘ䗷৫Ⲵ⣦ᘱ-ࣘ䖜ᦒˈԕ৺ᓄ᭦ࡠⲴ・ণഎᣕˈ❦
ਾઘᵏᙗൠ൘ަк䟽ᯠ䇝㓳DŽᔰਟ㜭Պ䇔Ѫ⭘਼Ⲵ䖜ᦒ䟽ᯠ䇝㓳ᱟڊᰐ⭘࣏DŽն⌘ࡠᴤ
ᯠⲴ Qˆ (s,a)٬ᱟ⭡ਾ㔗⣦ᘱ s´= ¥ (s,a)Ⲵ Qˆ (s´,a)٬⺞ᇊⲴDŽഐ↔ˈྲ᷌ਾ㔝Ⲵ䇝㓳᭩ਈҶ
Q̂ (s,a)٬ަѝањˈ൘䖜ᦒ<s,a>к䟽䇝㓳Պᗇࡠ Q̂ (s,a)Ⲵн਼٬DŽа㡜ൠˈᡁԜᐼᵋ䟽᭮ᰗ
Ⲵ䖜ᦒ∄ҾӾ⧟ຳѝ㧧ᗇᯠ䖜ᦒⲴ〻ᓖਆߣҾ䘉є൘⢩ᇊ䰞仈亶ฏѝሩᔰ䬰DŽֻྲ
൘ᵪಘӪሬ㡚ࣘⲴ亶ฏˈަࣘᢗ㹼䴰㾱ᮠ。Ⲵᰦ䰤ˈӾཆ䜘ц⭼᭦䳶ᯠⲴ⣦ᘱ-ࣘ䖜ᦒ
Ⲵᔦ䘏Պ∄൘䜘䟽᭮ԕࡽ㿲ሏ䗷Ⲵ䖜ᦒⲴᔰ䬰㾱བྷ㤕ᒢᮠ䟿㓗DŽ⭡Ҿ Q ᆖҐ䙊ᑨ㾱≲ᡀॳ
кзⲴ䇝㓳ᗚ⧟᭦ᮋˈ䘉ᐞ࡛ᱮᗇॱ࠶䟽㾱ⲴDŽ
13.4 䶔⺤ᇐᙝഔᣛૂࣞ֒
к䶒ᡁԜ㘳㲁Ҷ⺞ᇊᙗ⧟ຳлⲴ Q ᆖҐDŽ䘉䟼ᡁԜ㘳㲁䶎⺞ᇊᙗᛵߥˈަѝഎᣕ࠭ᮠ
r(s,a)઼ࣘ䖜ᦒ࠭ᮠ¥(s,a)ਟ㜭ᴹᾲ⦷Ⲵ䗃ࠪDŽֻྲˈ൘ Tesauro˄1995˅Ⲵ㾯⌻ৼ䱶ỻሩᔸ
〻ᒿѝˈ䗃ࠪⲴࣘᱟާᴹപᴹⲴᾲ⦷ᙗⲴˈഐѪ⇿⅑〫ࣘ䴰㾱᧧僠ᆀߣᇊDŽ㊫լⲴˈ൘ᴹಚ
༠ⲴՐᝏಘ઼᭸ᓄಘⲴᵪಘӪѝˈሶ઼ࣘഎᣕᔪ᪨Ѫ䶎⺞ᇊᙗ䗷〻䖳Ѫਸ䘲DŽ൘䘉ṧⲴᛵߥ
лˈ࠭ᮠ¥(s,a)઼ r(s,a)ਟ㻛ⴻᱟ俆ݸสҾ s ઼ a ӗ⭏䗃ࠪⲴᾲ⦷࠶ᐳˈ❦ਾ᤹↔࠶ᐳᣭਆ䲿
ᵪⲴ䗃ࠪDŽᖃ䘉Ӌᾲ⦷࠶ᐳѫ㾱䎆Ҿ s ઼ a ᰦ˄ֻྲˈᆳԜн䎆ԕࡽⲴ⣦ᘱ઼ࣘ˅ˈᡁ
Ԝਟ〠䘉њ㌫㔏Ѫ䶎⺞ᇊᙗ傜ቄਟཛߣㆆ䗷〻DŽ
൘䶎⺞ᇊᙗᛵߥлˈᡁԜᗵ享ݸ䟽ᯠਉ䘠ᆖҐಘⲴⴞḷˈԕ㘳㲁ࣘⲴ䗃ࠪнᱟ⺞ᇊᙗ
±
ⲴᛵߥDŽᖸ᰾ᱮˈаа㡜ॆⲴᯩ⌅ᱟᢺањㆆ⮕±Ⲵ٬V 䟽ᇊѹѪᓄ⭘↔ㆆ⮕ᰦ᭦ࡠᣈ㇇㍟
〟എᣕⲴᵏᵋ٬˄൘䘉Ӌ䶎⺞ᇊᙗ䗃ࠪк˅DŽ
ªf º
V S ( st ) { E «¦ J i rt i »
¬i 0 ¼
±
ྲԕࡽ䛓ṧˈᡁԜᇊѹᴰՈㆆ⮕±*Ѫᡰᴹ⣦ᘱsѝ֯V (s)ᴰབྷॆⲴㆆ⮕±DŽла↕ᡁԜᢺ
ࡽݸᔿ 13.4 ѝሩQⲴᇊѹа㡜ॆˈа⅑䘀⭘ަᵏᵋ٬DŽ
Q( s, a) { E[r ( s, a) JV * (G ( s, a))]
ަѝP(s´|s,a)Ѫ൘⣦ᘱs䟷ਆࣘaՊӗ⭏лањ⣦ᘱѪs´Ⲵᾲ⦷DŽ⌘ᡁԜ൘䘉䟼ᐢ㓿֯⭘
ҶP(s´|s,a)ᶕ᭩߉V*(¥(s,a))Ⲵᵏᵋ٬ˈᖒᔿѪоᾲ⦷ᙗⲴ¥Ⲵਟ㜭䗃ࠪޣ㚄Ⲵᾲ⦷DŽ
ྲԕࡽˈਟሶ Q 䟽ᯠ㺘䗮Ѫ䙂ᖂⲴᖒᔿ˖
ᡁԜᐢ㓿ᢺQⲴᇊѹа㡜ॆԕ䘲ᓄ䶎⺞ᇊᙗ⧟ຳлⲴ࠭ᮠr઼¥ˈ⧠൘ᡰ䴰㾱Ⲵᱟањᯠ䇝
㓳⌅ࡉDŽࡽ䶒ሩ⺞ᇊᙗᛵᖒ᧘ሬⲴ䇝㓳⌅ࡉ˄ᔿ 13.7˅н㜭ཏ൘䶎⺞ᇊᙗᶑԦл᭦ᮋDŽֻྲˈ
㘳㲁ањ䶎⺞ᇊᙗഎᣕ࠭ᮠr(s,a)ˈ⇿⅑䟽༽<s,a>䖜ᦒᰦӗ⭏н਼ⲴഎᣕDŽ䘉ṧˈণ֯ Q̂ 㺘٬
㻛ࡍॆѪ↓⺞ⲴQ࠭ᮠˈ䇝㓳㿴ࡉӽՊнᯝⲴ᭩ਈ Q̂ (s,a)Ⲵ٬DŽㆰ㾱Ⲵ䈤ˈ↔䇝㓳㿴ࡉн᭦
ᮋDŽ↔䳮仈Ⲵ䀓ߣਟ䙊䗷؞᭩䇝㓳㿴ࡉˈԔަ֯⭘ᖃࡽ Qˆ ٬઼Ⲵ↓؞ՠ䇑Ⲵањ㺠߿Ⲵ࣐ᵳᒣ
൷DŽ⭘ Qˆ nᶕԓ㺘ㅜn⅑ᗚ⧟ѝagentⲴՠ䇑ˈл䶒؞᭩ਾⲴ䇝㓳㿴ࡉ䏣ԕ؍䇱 Qˆ ᭦ᮋࡠQDŽ
ަѝ
1
Dn ˄13.11˅
1 visits n ( s, a)
ަѝs઼aѪㅜn⅑ᗚ⧟ѝᴤᯠⲴ⣦ᘱ઼ࣘˈ㘼фvisitsn(s,a)Ѫ↔⣦ᘱ-ࣘሩ൘䘉n⅑ᗚ⧟
˄वᤜㅜn⅑ᗚ⧟˅㻛䇯䰞Ⲵᙫ⅑ᮠDŽ
൘↔↓؞ҶⲴ㿴ࡉѝޣ䭞ᙍᜣ൘Ҿሩ Q̂ Ⲵᴤᯠ∄⺞ᇊᙗᛵߥлᴤѪᒣ㕃DŽ⌘ˈྲ᷌൘ᔿ
13.10 ѝᢺ¢n䇮㖞Ѫ 1ˈਟᗇࡠ⺞ᇊᙗᛵᖒлⲴ䇝㓳㿴ࡉDŽ֯⭘䖳ሿⲴ¢٬ˈ䈕亩ਟԕ㻛ᖃࡽ
Ⲵ Q̂ (s,a)൷ॆԕӗ⭏ᯠⲴᴤᯠ٬DŽ൘ᔿ 13.11 ѝ¢nⲴ٬䲿nⲴ໎䮯㘼߿ሿˈഐ↔ᖃ䇝㓳䘋㹼ᰦ
ᴤᯠ〻ᓖ䙀⑀ਈሿDŽ൘䇝㓳ѝԕаᇊ䙏⦷߿ሿ¢ˈਟԕ䗮ࡠ᭦ᮋࡠ↓⺞Q࠭ᮠⲴⴞⲴDŽк䶒㔉
ࠪⲴ¢nⲴ䘹ᤙᱟ┑䏣᭦ᮋᙗᶑԦⲴ䘹ᤙѻаˈᆳ᤹➗л䶒Ⲵᇊ⨶˄㿱Watkn & Danyan 1992˅
ᇊ⨶ 13.2 ሩ䶎⺞ᇊᙗ傜ቄਟཛߣㆆ䗷〻ⲴQᆖҐ᭦ᮋᙗDŽ㘳㲁ањQᆖҐagent൘а䶎⺞ᇊᙗMDP
ѝˈᒦфᴹᴹ⭼Ⲵഎᣕ (s, a ) | r ( s, a ) |d c DŽ↔QᆖҐagent֯⭘ᔿ 13.10 Ⲵ䇝㓳㿴ࡉˈࡍॆ㺘 Q̂ (s,a)
Ѫԫᴹ䲀٬ˈᒦф֯⭘ᣈ㇇ഐᆀ 0ݤ<1ˈԔn(i,s,a)Ѫሩᓄࣘaㅜi⅑ᓄ⭘Ҿ⣦ᘱsⲴ䘝ԓDŽྲ᷌⇿њ
⣦ᘱ-ࣘሩ㻛ᰐ䲀仁㑱䇯䰞ˈ0İ¢n<1ˈᒦф
f f
¦ D n (i ,s ,a )
i 1
f, ¦ [D
i 1
n (i , s ,a ) ]2 f
㲭❦ Q ᆖҐ઼ᴹⲴޣ໎ᕪ㇇⌅ਟ㻛䇱᰾൘аᇊᶑԦл᭦ᮋˈ൘֯⭘ Q ᆖҐⲴᇎ䱵㌫㔏
ѝˈ䙊ᑨ䴰㾱ᮠԕॳ䇑Ⲵ䇝㓳ᗚ⧟ԕ᭦ᮋDŽֻྲˈTesauro Ⲵ㾯⌻ৼ䱶ỻሩᔸ֯⭘ 150 зњሩ
ᔸỻተ䘋㹼䇝㓳ˈ⇿⅑वᤜᮠॱњ⣦ᘱ-ࣘ䖜ᦒDŽ
Ѫ䘋а↕᧒䇘䘉а䰞仈ˈഎᗶалQᆖҐˈᆳⲴ䇝㓳㿴ࡉ䇑㇇ࠪⲴ Q̂ (st,at)Ⲵ䇝㓳٬ᱟԕ
Q̂ (st+1,at+1)㺘⽪Ⲵˈަѝst+1ᱟᓄ⭘ࣘatࡠ⣦ᘱstⲴ㔃᷌DŽԔQ(1)(st,at)Ѫ↔অ↕ࡽⷫ䇑㇇Ⲵ䇝㓳
٬˖
Q (1) ( st , at ) { rt J max Qˆ ( st 1 , a)
a
䇑㇇Q(st,at)䇝㓳٬Ⲵਖаᯩ⌅ᱟสҾє↕Ⲵ㿲ሏࡠⲴഎᣕ˖
Q ( 2 ) ( st , at ) { rt Jrt 1 J 2 max Qˆ ( st 2 , a)
a
ԕ৺൘а㡜Ⲵᛵߥл n ↕Ⲵഎᣕ˖
> @
Q O ( st , at ) { (1 O ) Q (1) ( st , at ) OQ ( 2) ( st , at ) O2 Q (3) ( st , at )
¬
Q ⲴањㅹԧⲴ䙂ᖂᇊѹѪ˖
Q O ( st , at ) rt J [(1 O ) max Qˆ ( s t , at ) OQ O ( st 1 , at 1 )]
a
⌘ྲ᷌ᡁԜ䘹ᤙ¬=0ˈࡉᗇࡠᶕⲴ䇝㓳ՠ䇑Q(1)ˈᆳਚ㘳㲁 Q̂ ՠ䇑ѝⲴঅ↕ᐞᔲDŽᖃ
¬໎བྷᰦˈ↔㇇⌅䟽⛩䙀⑀䖜〫ࡠᴤ䘌Ⲵࡽⷫ↕ѝDŽ൘ᶱㄟᛵߥ¬=1 ᰦˈਚ㘳㲁㿲ሏࡠⲴrt+i
¬
٬ˈᖃࡽⲴ Q̂ ՠ䇑ሩަ⋑ᴹ䍑⥞DŽ⌘ᖃ Q̂ =Qᰦˈ⭡Q 㔉ࠪⲴ䇝㓳٬ሩҾ 0ݬİ1 Ⲵᡰᴹ
¬٬䜭਼DŽ
TD(¬)Ⲵࣘᵪᱟˈ൘ḀӋᶑԦлˈྲ᷌㘳㲁ᴤ䘌Ⲵࡽⷫˈ䇝㓳Պᴤᴹ᭸DŽֻྲˈᖃagent
¬
䚥ᗚᴰՈㆆ⮕䘹ᤙࣘᰦˈ¬=1 ⲴQ ሶᨀሩⵏᇎQ٬Ⲵᆼ㖾ՠ䇑ˈн䇪 Q̂ ᴹཊѸн㋮⺞DŽ
ਖаᯩ䶒ˈྲ᷌ࣘᒿࡇⲴ䘹ᤙᱟ⅑ՈⲴˈ䛓ѸሩᵚᶕⲴ㿲ሏrt+iਟ㜭ᴹ䈟ሬᙗDŽ
¬
Peng & Williams˄1994˅ᨀҶ䘋а↕Ⲵ䇘䇪઼ᇎ傼㔃᷌ˈᱮ⽪ҶQ ൘ањ䰞仈亶ฏкⲴ
ঃ䎺ᙗ㜭DŽDayan(1992)ᱮ⽪Ҷ൘аᇊᶑԦл㿱㊫լⲴTD(¬)ᯩ⌅ᓄ⭘ࡠᆖҐV*࠭ᮠѝˈሩҾ 0
ݬİ1 Ⲵԫ¬٬䜭ਟ↓⺞᭦ᮋDŽTesauro(1995) ൘ަTD-Gammon〻ᒿ㾯⌻ৼ䱶ỻሩᔸѝ֯
⭘ҶTD(¬)ᯩ⌅DŽ
13.6 Ԅṭׁѣ⌑ौ
㠣↔ˈ൘ Q ᆖҐѝਟ㜭ᴰާᴹ㓖ᶏᙗⲴٷᇊᱟަⴞḷ࠭ᮠ㻛㺘⽪ѪањᱮᔿⲴḕ㺘ˈ
ሩ⇿њн਼䗃ޕ٬˄ণ⣦ᘱ-ࣘሩ˅ᴹањ㺘亩DŽഐ↔ᡁԜⲴ䇘䇪Ⲵ㇇⌅ᢗ㹼аᵪỠⲴᆖ
Ґᯩ⌅ ˈᒦфнՊቍ䈅䙊䗷ӾᐢⴻࡠⲴ⣦ᘱ-ࣘሩѝ⌋ॆԕՠ䇑ᵚⴻࡠⲴ⣦ᘱ-ࣘሩⲴ Q
٬DŽ䘉њᵪỠᆖҐٷᇊ൘᭦ᮋᙗ䇱᰾ѝ৽᱐ࠪᶕˈᆳ䇱᰾Ҷਚᴹ⇿њਟ㜭Ⲵ⣦ᘱ-ࣘ㻛ᰐ䲀
仁㑱Ⲵ䇯䰞ˈᆖҐ䗷〻Պ᭦ᮋDŽ൘བྷⲴᡆᰐ䲀Ⲵオ䰤ѝˈᡆ㘵ᢗ㹼ࣘⲴᔰ䬰ᖸབྷᰦˈ䘉ᱮ
❦ᱟн࠷ᇎ䱵ⲴٷᇊDŽѪ㔃᷌ˈᴤᇎ䱵Ⲵ㌫㔏䙊ᑨਸᒦҶަԆㄐ䇘䇪Ⲵ࠭ᮠ䙬䘁ᯩ⌅ԕ৺䘉
䟼䇘䇪Ⲵ Q ᆖҐ䇝㓳㿴ࡉDŽ
ᖸᇩ᱃ᢺ৽ੁՐ䘉ṧⲴ࠭ᮠ䙬䘁㇇⌅㔃ਸࡠ Q ᆖҐ㇇⌅ѝˈ䙊䗷⭘⾎㓿㖁㔌ᴯԓḕ
㺘ˈᒦфᢺ⇿њ Q̂ (s,a)ᴤᯠѪ䇝㓳ṧֻDŽֻྲˈᡁԜਟᢺ⣦ᘱ s ઼ࣘ a 㕆⸱Ѫ㖁㔌䗃ˈޕ
ᒦф䇝㓳㖁㔌ԕ䗃ࠪ Q̂ Ⲵⴞḷ٬ˈ൘㔉ᇊᔿ 13.7 ઼ᔿ 13.10 Ⲵ䇝㓳㿴ࡉⲴᶑԦлˈਖаᴹᰦ
൘ᇎ䐥ѝᴤᡀ࣏Ⲵᯩ⌅ᱟሩ⇿њࣘ䇝㓳ањঅ⤜Ⲵ㖁㔌ˈ֯⭘⣦ᘱѪ䗃 ˈޕQ̂ Ѫ䗃ࠪDŽ䘈
ᴹа䙊ᑨ֯⭘Ⲵᯩ⌅ᱟ䇝㓳ањ㖁㔌ˈᆳԕ⣦ᘱѪ䗃ˈޕնሩ⇿њࣘ䗃ࠪањ Q̂ ٬DŽഎ
ᗶㅜ 1 ㄐѝᡁԜ䇘䇪Ҷ൘ỻⴈ⣦ᘱк֯⭘㓯ᖒ࠭ᮠ઼ LMS ㇇⌅ᶕ䙬䘁ՠ䇑࠭ᮠDŽ
൘ᇎ䐥ѝˈᐢᔰਁࠪҶ䇨ཊᡀ࣏Ⲵ໎ᕪᆖҐ㌫㔏ˈᆳԜ䙊䗷㔃ਸ䘉ṧⲴ࠭ᮠ䙬䘁㇇⌅ᶕԓ
ᴯḕ㺘DŽTesauro Ⲵᡀ࣏Ⲵ TD-Gammon 〻ᒿ֯⭘Ҷ⾎㓿㖁㔌઼৽ੁՐ㇇⌅ˈо TD(¬)䇝
㓳㿴ࡉ㔃ਸDŽZhang & Dietterich(1996)֯⭘լⲴ৽ੁՐо TD(¬)Ⲵ㔃ਸ⭘Ҿ job-shop 䈳
ᓖԫ࣑DŽ Crites & Barto˄1996˅᧿䘠Ҷањ⾎㓿㖁㔌໎ᕪᆖҐᯩ⌅ˈ⭘Ҿ⭥ở䈳ᓖԫ࣑DŽ
Thrun(1996)ᣕҶањสҾ⾎㓿㖁㔌Ⲵ Q ᆖҐˈᆳਟᆖҐᑖᴹ༠㓣઼ᩴۿཤՐᝏಘⲴ〫ࣘᵪ
ಘӪⲴสᵜ᧗ࡦ䗷〻DŽMahadevan & Connell(1991)᧿䘠ҶањสҾ㚊㊫⣦ᘱⲴ Q ᆖҐᯩ⌅ˈᓄ
⭘ҾㆰঅⲴ〫ࣘᵪಘӪ᧗ࡦ䰞仈DŽ
㲭❦䘉Ӌ㌫㔏㧧ᗇҶᡀ࣏ˈሩҾަԆⲴԫ࣑ˈаնᕅޕҶ⌋ॆ࠭ᮠ䙬䘁ಘˈ໎ᕪᆖҐሶн
㜭᭦ᮋDŽ䘉ṧⲴᴹ䰞仈Ⲵԫ࣑⭡Boyan & Moore(1995)ˈBaird(1995)઼Gordon(1995)ӻ㓽DŽ⌘
ᵜㄐࡽ䶒䇘䇪Ⲵ᭦ᮋᙗᇊ⨶ਚᓄ⭘Ҿ Qˆ 㺘⽪Ѫ᰾⺞Ⲵ㺘ᖒᔿᰦˈѪҶⴻࡠഠ䳮ᡰ൘ˈ㘳㲁֯⭘
ањ⾎㓿㖁㔌㘼нᱟ᰾⺞Ⲵ㺘ᶕ㺘⽪ Q̂ DŽྲ᷌ᆖҐಘᴤᯠ㖁㔌ԕᴤྭൠ३䝽⢩ᇊ䖜ᦒⲴ<si,ai>
Ⲵ䇝㓳Q٬ˈਈॆҶⲴ㖁㔌ᵳ٬ҏՊ؞᭩ަԆⲴԫ䖜ᦒⲴ Q̂ ՠ䇑DŽഐѪ䘉Ӌᵳ٬ਈॆՊ໎࣐
ަԆ䖜ᦒⲴ Q̂ ՠ䇑Ⲵ䈟ᐞˈᶕᇊ⨶ѝⲴ䇱᰾↕僔нᡀ・DŽޣҾᑖᴹ⌋ॆ࠭ᮠ䙬䘁ಘⲴ໎ᕪ
ᆖҐⲴ⨶䇪࠶᷀⭡Gordon(1995)઼Tsitsiklis(1994)ࠪDŽBaird(1995)ᨀࠪҶสҾởᓖⲴᯩ⌅ˈᆳ
䙊䗷ⴤ᧕ᴰሿॆሩ䛫⣦ᘱⲴՠ䇑ѝⲴᐞᔲᒣᯩ઼ᶕ䀓ߣ䘉а䳮仈˄ҏ㻛〠ѪBellman↻⮉䈟
ᐞBellman residual error˅DŽ
13.7 фࣞᘷ㿺ࡈⲺ㚊㌱
ۿQ ᆖҐ䘉ṧⲴ໎ᕪᆖҐᯩ⌅ˈо䮯ᵏ⹄ウⲴ⭘Ҿ䀓ߣ傜ቄਟཛߣㆆ䗷〻Ⲵࣘᘱ㿴ࡂᯩ
⌅ᴹ⵰㍗ᇶⲴ㚄㌫DŽ䘉ӋᰙᵏⲴᐕ䙊䗷ٷᇊ agent ᤕᴹᆳᡰ༴⧟ຳⲴ࠭ᮠ¥(s,a)઼ r(s,a)Ⲵᆼ
㖾⸕䇶DŽഐ↔ˈᆳѫ㾱䀓ߣⲴ䰞仈ᱟ⭘ᴰሿⲴ䇑㇇䟿ᗇࡠᴰՈㆆ⮕ˈٷᇊ⧟ຳਟ㻛ᆼ㖾ൠ⁑
ᤏˈн䴰㾱ⴤ᧕ⲴӔӂDŽQ ᆖҐⲴ፝ᯠѻ༴൘Ҿᆳٷᇊнާᴹ¥(s,a)઼ r(s,a)Ⲵ⸕䇶ˈᆳн㜭
൘䜘⁑ᤏⲴ⣦ᘱオ䰤ѝ〫ࣘˈ㘼ᗵ享൘⧠ᇎц⭼ѝ〫ࣘᒦ㿲ሏਾ᷌DŽ൘ਾаᛵߥлᡁԜѫ
㾱㘳㲁Ⲵᱟ agent Ѫ᭦ᮋࡠањਟ᧕ਇⲴㆆ⮕ᗵ享ᢗ㹼Ⲵⵏᇎц⭼ࣘᮠ䟿ˈ㘼нᱟ享㣡䍩Ⲵ
䇑㇇䘝ԓ⅑ᮠDŽഐᱟ൘䇨ཊᇎ䱵Ⲵ亶ฏѝˈ∄ྲ⭏ӗ䰞仈ˈ൘ཆ䜘ц⭼ѝᢗ㹼ࣘⲴᰦ䰤઼
䍩⭘ᔰ䬰∄䇑㇇ᔰ䬰ᴤ٬ᗇ⌘ޣDŽ൘ⵏᇎ⧟ຳѝ〫ࣘ䘋㹼ᆖҐˈᒦф㿲ሏަ㔃᷌Ⲵ㌫㔏䙊ᑨ〠
Ѫ൘㓯(online)㌫㔏ˈ㘼ѫ㾱䙊䗷⁑ර⁑ᤏࣘⲴᆖҐ㻛〠Ѫ㓯˄offline˅㌫㔏DŽ
13.8 ቅ㔉ૂ㺛ݻ䈱⢟
ᵜㄐⲴ㾱⛩वᤜ˖
x ໎ᕪᆖҐ䀓ߣ㠚⋫ agent ᆖҐ᧗ࡦㆆ⮕Ⲵ䰞仈DŽᆳٷᇊ䇝㓳ؑⲴᖒᔿѪሩ⇿њ⣦
ᘱ-ࣘ䖜ᦒ㔉ࠪⲴᇎ٬എᣕؑਧDŽagent ⲴⴞḷᱟᆖҐањ㹼ࣘㆆ⮕ˈᆳ֯ agent
Ӿԫ䎧⣦ᘱ᭦ࡠⲴᙫഎᣕѪᴰབྷDŽ
x ᵜㄐӻ㓽Ⲵ໎ᕪᆖҐ㇇⌅䘲ਸа㊫㻛〠Ѫ傜ቄਟཛߣㆆ䗷〻Ⲵ䰞仈DŽ൘傜ቄਟཛ
ߣㆆ䗷〻ѝˈᓄ⭘ԫࣘࡠԫ⣦ᘱкⲴ䗃ࠪਚਆߣҾ↔઼ࣘ⣦ᘱ˄оԕࡽ
Ⲵࣘᡆ⣦ᘱᰐ˅ޣDŽ傜ቄਟཛߣㆆ䗷〻㾶ⴆҶ㤳തᖸᒯⲴ䰞仈ˈवᤜ䇨ཊᵪಘ
Ӫ᧗ࡦˈᐕল㠚ࣘॆ઼䈳ᓖ䰞仈DŽ
x Q ᆖҐᱟ໎ᕪᆖҐⲴаᖒᔿDŽަѝ agent ᆖҐⲴᱟа㓴⣦ᘱ઼ࣘкⲴՠ䇑࠭
ᮠDŽ⺞࠷ൠ䇢ˈՠ䇑࠭ᮠ Q(s,a)㻛ᇊѹѪ agent ᓄ⭘ࣘ a ࡠ⣦ᘱ s кਟ㧧ᗇⲴᴰ
བྷᵏᵋᣈ㇇〟㍟എᣕDŽQ ᆖҐⲴՈ⛩ᱟˈণ֯൘ᆖҐಘнާᴹަࣘᘾṧᖡ૽⧟ຳ
Ⲵݸ傼⸕䇶ᛵߥлˈ↔㇇⌅ӽਟᓄ⭘DŽ
x ਟԕ䇱᰾ˈ൘䘲ᖃٷᇊлˈྲ᷌ᆖҐಘⲴٷ䇮 Q̂ (s,a)㻛㺘⽪Ѫањḕ㺘ˈфሩ⇿
њ<s,a>ሩᴹঅ⤜Ⲵ㺘亩ˈ䛓Ѹ Q ᆖҐਟԕ᭦ᮋࡠ↓⺞Ⲵ Q ࠭ᮠDŽ൘⺞ᇊᙗ઼䶎⺞
ᇊᙗⲴ MDP л↔㇇⌅䜭ਟ᭦ᮋDŽ൘ᇎ䐥ѝ Q ᆖҐণ֯൘㿴⁑䘲ѝⲴ䰞仈ѝҏ䴰㾱
ᮠॳ⅑Ⲵ䇝㓳ᗚ⧟DŽ
x Q ᆖҐᱟа㊫ᴤᒯ⌋Ⲵ〠Ѫᰦ䰤ᐞᔲ㇇⌅ѝⲴаDŽа㡜䈤ᶕˈᰦ䰤ᐞᔲ㇇⌅䙊䗷
нᯝ߿ሿ agent ൘н਼ᰦ䰤ӗ⭏Ⲵՠ䇑Ⲵᐞᔲᶕ䘋㹼ᆖҐDŽ
x ໎ᕪᆖҐоᓄ⭘Ҿ傜ቄਟཛߣㆆ䗷〻Ⲵࣘᘱ㿴ࡂᴹ㍗ᇶ㚄㌫DŽަᐞᔲޣ䭞൘Ҿˈ
শਢк䘉Ӌࣘᘱ㿴ࡂᯩ⌅ٷᇊ agent ᤕᴹ⣦ᘱ䖜ᦒ࠭ᮠ¥(s,a)઼എᣕ࠭ᮠ r(s,a)Ⲵ⸕
䇶DŽ৽ˈQ ᆖҐ䘉ṧⲴ໎ᕪᆖҐ㇇⌅ٷᇊᆖҐಘ㕪ቁ䘉Ӌ⸕䇶DŽ
൘໎ᕪᆖҐᯩ䶒䇨ཊᐕѝˈ䙊ᑨⲴѫ仈ᱟ䘝ԓൠ߿ሿⲴਾ㔗⣦ᘱⲴՠ䇑ѻ䰤ⲴᐞᔲDŽ֯
⭘䘉ᯩ⌅ⲴḀӋᴰᰙⲴᐕਟ㿱 Samuel(1959)ˈᆳⲴ㾯⌻ৼ䱶ỻᆖҐ〻ᒿ䈅മ䙊䗷ਾ㔗⣦ᘱ
Ⲵՠ䇑ᶕ⭏ᡀࡽݸ⣦ᘱⲴ䇝㓳٬ˈӾ㘼ᆖࡠ㾯⌻ৼ䱶ỻⲴՠ䇑࠭ᮠDŽࠐѾ਼ᰦˈBellman-Ford
ⲴঅⴞⲴᴰ⸝䐟ᖴ㇇⌅㻛ᔰਁࠪᶕ˄Bellman 1958; Ford & Fulkerson 1962˅ˈᆳᢺࡠⴞⲴⲴ䐍
٬Ӿ㔃⛩ՐࡠᆳⲴ䛫ትDŽ൘ᴰՈ᧗ࡦᯩ䶒Ⲵ⹄ウሬ㠤Ҷ֯⭘լᯩ⌅ᶕ䀓ߣ傜ቄਟཛߣㆆ
䗷〻˄Bellman1961; Blackwell 1965˅DŽHolland˄1986˅ⲴᆖҐ࠶㊫㌫㔏Ⲵ㓴Ầᔿ˄bucket
brigade˅ᯩ⌅֯⭘Ҷ㊫լⲴᯩ⌅൘ᔦ䘏എᣕⲴᛵߥлՐؑ⭘DŽBarto et al.˄1983˅䇘䇪а
ᰦ䰤ؑ⭘࠶䝽Ⲵᯩ⌅ˈሬ㠤Ҷ Sutton˄1988˅Ⲵ䇪᮷ˈަѝᇊѹҶ TD(¬)ᯩ⌅ᒦ䇱᰾Ҷ൘¬
=0 ᰦᆳⲴ᭦ᮋᙗDŽDayan(1992)ᢺ䘉њ㔃᷌ᢙኅࡠ¬Ⲵԫ٬DŽWatkin˄1989˅ӻ㓽Ҷ⭘ Q ᆖ
Ґ൘എᣕ઼ࣘ䖜ᦒ࠭ᮠᵚ⸕Ⲵᛵߥл㧧ਆᴰՈㆆ⮕DŽ൘䘉Ӌᯩ⌅кⲴ᭦ᮋᙗ䇱᰾ᴹࠐњਈ
DŽ䲔Ҷᵜㄐኅ⽪Ⲵ᭦ᮋᙗ䇱᰾ཆˈਟ㿱˄Baird 1995; Bertsekas 1987; Tsitsiklis 1994, Singh ઼
Sutton 1996˅DŽ
໎ᕪᆖҐӽᱟањ⍫䏳Ⲵ⹄ウ亶ฏDŽֻྲ McCallum(1995)઼ Littman˄1996˅䇘䇪Ҷ໎ᕪ
ᆖҐⲴᢙኅˈԕ䘲ᓄᴹ䳀㯿⣦ᘱਈ䟿ൿ傜ቄਟཛٷᇊⲴᛵߥDŽ䇨ཊᖃࡽⲴ⹄ウ㠤࣋Ҿᢺ䘉Ӌ
ᯩ⌅ॷ㓗ࡠᴤᓎབྷᴤᇎ䱵Ⲵ䰞仈ѝDŽֻྲ Maclin ઼ Shavlik˄1996˅᧿䘠Ҷаᯩ⌅ˈަѝ໎
ᕪᆖҐ agent ਟ᧕ਇᯭᮉ㘵Ⲵнᆼ㖾ᔪ䇞ˈสҾ KBANN ㇇⌅˄ㅜ 12 ㄐ˅ⲴањᢙኅDŽLin
˄1992˅㘳㲁Ҷ䙊䗷ᨀᔪ䇞ࣘᒿࡇᶕᯭᮉⲴ⭘DŽSingh˄1993˅઼ Lin˄1993˅ᔪ䇞֯⭘
ቲ⅑ॆⲴࣘᶕॷ㓗䘉Ӌ㇇⌅DŽDietterich & Flann˄1995˅᧒㍒ҶสҾ䀓䟺Ⲵᯩ⌅઼໎ᕪᆖҐ
Ⲵ䳶ᡀˈMitchell & Thrun˄1993˅᧿䘠Ҷᓄ⭘ EBNN ㇇⌅˄ㅜ 12 ㄐ˅ࡠ Q ᆖҐѝDŽRing
˄1994˅㘳㲁Ҷ agent ൘ཊњԫ࣑ѝⲴᤱ㔝ᆖҐDŽ
(a)㔉ࠪṬᆀц⭼ѝ⇿њ⣦ᘱⲴV* ٬DŽ㔉ࠪ⇿њ䖜ᦒⲴQ(s,a)٬DŽᴰਾˈ߉ࠪањᴰՈㆆ
⮕ˈ֯⭘¤=0.8DŽ
(b)䈅᭩ਈഎᣕ࠭ᮠr(s,a)ˈ֯Q(s,a)ਈॆˈնн᭩ਈᴰՈㆆ⮕DŽ䈅؞᭩r(s,a)ˈ֯Q(s,a)ਈ
ॆˈնн᭩ਈV*(s,a)DŽ
插图——原书页码:388
(b)ྲ᷌ሩᇦ䘹ᤙᴰՈⲴ䎠ỻ㘼нᱟ䲿ᵪ䎠ỻˈⲴ〻ᒿ㜭㜌࡙˛
13.4 ൘䇨ཊMDPѝˈᴹਟ㜭ࡠєњㆆ⮕±1઼±2ˈྲ᷌agentᔰҾ⣦ᘱs1ˈࡉ±1ՈҾ
± 2 ˗ ྲ ᷌ agent ᔰ Ҿ ਖ а ⣦ ᘱ s2 ˈ ࡉ ± 2 Ո Ҿ ± 1 DŽ ᦒ 䀰 ѻ V S 1 ( s1 ) ! V S 2 ( s1 ) ն
V S 2 ( s 2 ) ! V S 1 ( s 2 ) DŽ䀓䟺ѪӰѸᙫᆈ൘ањㆆ⮕ˈ㜭ሩҾԫањࡍ⣦ᘱs֯V±(s)ᴰབྷॆ
˄ ণ ᴰ Ո ㆆ ⮕ ± * ˅ DŽ ᦒ 䀰 ѻ ˈ 䀓 䟺 Ѫ Ӱ Ѹ а њ MDP ᙫ ᴹ а њ ㆆ ⮕ ± * ˈ ֯
(S , s )V S ( s ) t V S ( s ) DŽ
*