Պատկերի մշակման հիմնական ալգորիթմներ. Պատկերի նախնական մշակման ալգորիթմներ Պատկերի նախնական մշակում

Թվային աղմուկը պատկերի թերություն է, որը պատահականորեն տեղակայված տարածքներ է, որոնք մոտ են պիքսելի չափին և տարբերվում են սկզբնական պատկերից պայծառությամբ կամ գույնով: Աղմուկի նվազեցումը կարևոր դեր է խաղում տեսանյութերի հաջորդականությունների և պատկերների փոխանցման, մշակման և սեղմման գործում:

Տեսանյութի աղմուկը կարող է առաջանալ մի քանի պատճառներով.

1. Անկատար տեսագրման սարքավորում:

2. Նկարահանման վատ պայմաններ՝ օրինակ՝ գիշերային ֆոտո/վիդեո նկարահանումներ, անբարենպաստ եղանակային պայմաններում նկարահանումներ:

3. Անալոգային կապուղիներով հաղորդման ժամանակ միջամտություն - էլեկտրամագնիսական դաշտերի աղբյուրների միջամտություն, էլեկտրահաղորդման գծի ակտիվ բաղադրիչների (ուժեղացուցիչների) ներքին աղմուկ: Օրինակը հեռուստատեսային ազդանշանն է:

4. Անճշտությունների զտում անալոգային կոմպոզիտային ազդանշանից լուսավորության և գույնի տարբերության ազդանշաններ հանելիս և այլն:

Պատկերում աղմուկի քանակությունը կարող է տատանվել լավ լույսի ներքո արված թվային լուսանկարի գրեթե աննկատ կետից մինչև աստղագիտական լուսանկարներ, որոնցում աղմուկը թաքցնում է օգտակար տեղեկատվության մեծ մասը, որը կարելի է ստանալ միայն աշխատատար պատկերի մշակման միջոցով:

Աղմուկը կարող է լինել տարբեր տեսակի՝ կախված նկարում աղմուկի պատահական բաշխման բնույթից: Գործնականում ամենատարածված տեսակներն են.

Սպիտակ Գաուսի աղմուկ

Ամենատարածված աղմուկներից մեկը հավելյալ Գաուսի աղմուկն է, որը բնութագրվում է պատկերի յուրաքանչյուր պիքսելին նորմալ բաշխմամբ և զրոյական միջին արժեքներով արժեքների ավելացմամբ: «Հավելում» տերմինը նշանակում է, որ այս տեսակի աղմուկը ավելացվում է օգտակար ազդանշանին: Առաջանում է ազդանշանի ընդունման վատ պայմանների դեպքում:

թվային աղմուկ

Թվային աղմուկի պատճառն առավել հաճախ կապված է նկարահանման համար օգտագործվող սարքավորումների առանձնահատկությունների հետ, սովորաբար մատրիցայի լույսի անբավարար զգայունության հետ: Այս տեսակի աղմուկը բնութագրվում է պատկերի որոշ պիքսելների փոխարինմամբ ֆիքսված կամ պատահական փոփոխականի արժեքներով: Եթե կետերի պայծառությունը մոտավորապես հավասար է, թվային աղմուկը կոչվում է նաև «իմպուլսիվ»: Եթե կետերի ինտենսիվությունը կարող է փոխվել սևից սպիտակի, ապա այս աղմուկը կոչվում է աղի և պղպեղի աղմուկ:

Սովորաբար, այս տեսակի աղմուկը ազդում է պատկերի միայն փոքր թվով պիքսելների վրա:

Համակցված աղմուկ

Շատ ավելի հազվադեպ են լինում դեպքեր, երբ պատկերը հավասար ծավալով աղմկոտ է գաուսյան աղմուկով և պատահական իմպուլսներով։ Այս հավաքածուն կոչվում է համակցված աղմուկ:

Պատկերի սկանավորման թերություններ

Պատկերի վրա կարող են հայտնվել նաև կողմնակի ազդեցություններ, ինչպիսիք են ճաքերը, քերծվածքները, կապտուկները: Այս արտեֆակտները չունեն միատարր կառուցվածք, դրանց ձևի և գտնվելու վայրի որոշումը հիմնականում մաթեմատիկական վերլուծությունից դուրս է: Այս տեսակի թերությունների դեմ կարելի է պայքարել միայն ձեռքով պատկերի մշակման օգնությամբ, հետևաբար, դրանք չեն դիտարկվում այս հոդվածում:

Աղմուկի հեռացման ալգորիթմներ

Պատկերներից աղմուկը հեռացնելու մեծ թվով ալգորիթմներ կան, և դրանք կարող են օգտագործվել ոչ միայն մշակման հատուկ ծրագրերի, այլ նաև որոշ ֆոտո և տեսախցիկների կողմից։ Չնայած դրան, դեռևս չկա համընդհանուր զտման ալգորիթմ, քանի որ պատկերը մշակելիս միշտ անհրաժեշտ է ընտրել անցանկալի էֆեկտների վերացման աստիճանի և աղմուկի նման բնութագրիչներ ունեցող մանր մանրամասների պահպանման միջև: Բացի այդ, ալգորիթմը, որը հեշտությամբ հաղթահարում է մեկ տեսակի աղմուկը, կարող է միայն փչացնել պատկերը մեկ այլ տեսակի աղմուկով:

Դիտարկենք պատկերի աղմուկի նվազեցման ամենահայտնի ալգորիթմներից մի քանիսը:

Գծային պիքսելային միջինացում

Աղմուկի հեռացման ամենապարզ գաղափարը տարածական հարևանությամբ պիքսելների արժեքների միջինացումն է: Քանի որ աղմուկը տարբեր պիքսելներից անկախ տարբերվում է, հարակից պիքսելների աղմուկը կզրկվի միմյանցից, երբ գումարվում է: Սահմանված է ուղղանկյուն պատուհան, որը հերթով դրվում է պատկերի յուրաքանչյուր պիքսելի վրա: Կենտրոնական պիքսելի արժեքը հաշվարկվում է բոլոր հարևան պիքսելների վերլուծության հիման վրա, որոնք ընկնում են պատուհանի տարածքում: Համապատասխանաբար, որքան մեծ է վերցված պատուհանը, այնքան ավելի միջին արժեք կստացվի վերջում, ինչը հանգեցնում է ուժեղ լղոզման էֆեկտի:

Ամենապարզ տարբերակում հարևան պիքսելների վերլուծությունը նրանց թվաբանական միջինը գտնելն է: Որպեսզի նվազեցնել պիքսելների ազդեցությունը, որոնք չեն պատկանում նույն տարածքին, ինչ դիտարկվողը (օրինակ՝ մուգ ուրվագիծը բաց ֆոնի վրա), կարող եք ներմուծել որոշակի թվային շեմ և հաշվի առնել միայն այն հարևանները, որոնց տարբերությունը կենտրոնական պիքսելը չի գերազանցում այս շեմը: Որքան մեծ է շեմային արժեքը, այնքան ավելի ուժեղ կլինի միջինացումը: Դիտարկվող տարբերակը կարող է բարդանալ՝ յուրաքանչյուր հարևան պիքսելի համար քաշային գործակիցներ ներմուծելով՝ կախված դիտարկվող տարածքի կենտրոնից դրանց հեռավորությունից:

Այս մեթոդը կարող է կիրառվել նաև ժամանակի տիրույթում՝ յուրաքանչյուր պիքսելը միջինացնելով վիդեո հոսքի հարակից կադրերի վրա (յուրաքանչյուր պիքսելը միջինացված կլինի պիքսելների նկատմամբ, որոնք գտնվում են հարակից կադրերում նույն դիրքում):

Այս ալգորիթմը շատ պարզ է, բայց լավ արդյունք չի տալիս՝ միևնույն ժամանակ հանգեցնելով պատկերի մանրամասների ուժեղ լղոզման։

Գաուսի ֆիլտր

Այն ունի գործողության սկզբունք, որը նման է նախորդ մեթոդին և նույնպես պատկանում է հակաալիզինգային ֆիլտրերի թվին: Այնուամենայնիվ, գծային միջինացման ֆիլտրի միջոցով աղմուկի նվազեցումը զգալի թերություն ունի. մշակված պիքսելի բոլոր հարևանները նույն ազդեցությունն ունեն արդյունքի վրա, անկախ նրանից նրանց հեռավորությունից: Գաուսի ֆիլտրը նաև միջինացնում է կենտրոնական պիքսելը և նրա հարևանները որոշակի տարածքում, միայն դա տեղի է ունենում որոշակի օրենքի համաձայն, որը սահմանված է Գաուսի գործառույթով:

Որտեղ y պարամետրը նշում է մշուշման աստիճանը, իսկ A պարամետրը ապահովում է նորմալացում: Արդյունքում, դիտարկվող տարածքի կենտրոնական պիքսելը կունենա Գաուսի բաշխման գագաթնակետին համապատասխանող ամենաբարձր արժեքը։ Մնացած տարրերի արժեքները գնալով ավելի քիչ ազդեցություն կունենան, երբ հեռանաք կենտրոնից:

Նշված բանաձևով հաշվարկված մատրիցային ֆիլտրը կոչվում է Գաուսի; որքան մեծ է դրա չափը, այնքան ավելի ուժեղ է մշուշումը (ֆիքսված y-ի համար): Քանի որ այս զտիչը բաժանելի է, այն կարող է ներկայացվել հետևյալ կերպ.

Սրանից հետևում է, որ կոնվուլյացիան կարող է իրականացվել հաջորդաբար տողերում և սյունակներում, ինչը հանգեցնում է մեթոդի զգալի արագացման մեծ ֆիլտրի չափերի համար:

2Dcleaner ալգորիթմ

Փոխարինում է պատկերի յուրաքանչյուր պիքսել հարևան պիքսելների միջին արժեքով, որը վերցված է որոշակի շառավղով սահմանափակված տարածքում: Այս դեպքում հաշվի են առնվում ոչ բոլոր կետերը, որոնք ընկնում են շառավղով, այլ միայն նրանք, որոնց արժեքը տարբերվում է կենտրոնական պիքսելից ոչ ավելի, քան որոշ կանխորոշված արժեք (շեմ): Դրա շնորհիվ միատեսակ գունավոր տարածքները ավելի շատ են լղոզվում, քան առարկաների սուր եզրերը: Սա նվազեցնում է պատկերի ցածր մակարդակի աղմուկը` միաժամանակ պահպանելով մանր մանրամասները:

Միջին ֆիլտրում

Գծային ալգորիթմները պարզվում է, որ շատ արդյունավետ են Գաուսի աղմուկը ճնշելու համար, երբ հարևան պիքսելները, թեև ունեն արժեքների որոշ պատահական տարածում, այնուամենայնիվ մնում են այն տարածքին բնորոշ միջին արժեքի սահմաններում, որին պատկանում են: Այնուամենայնիվ, երբեմն պետք է գործ ունենալ այլ տեսակի միջամտությունների պատճառով խեղաթյուրված պատկերների հետ: Նման միջամտության օրինակ է իմպուլսային աղմուկը, որն արտահայտվում է պատկերի մեջ պատահականորեն ցրված պայծառության կետերի առկայությամբ։ Այս դեպքում միջինացումը «կեղտոտում» է յուրաքանչյուր այդպիսի կետ հարևան պիքսելների վրա՝ հանգեցնելով պատկերի որակի վատթարացման:

Միջին ֆիլտրումը իմպուլսային աղմուկը ճնշելու ստանդարտ միջոց է: Պատկերի մշակման ոչ գծային մեթոդը վերացնում է ցայտերը, բայց, ի տարբերություն գծային միջինացման ալգորիթմների, միապաղաղ պիքսելային հաջորդականություններն անփոփոխ են թողնում: Դրա շնորհիվ միջնադարյան ֆիլտրերը կարող են առանց խեղաթյուրման պահպանել առարկաների ուրվագծերը և տարբեր պայծառության տարածքների միջև եղած տարբերությունները՝ միաժամանակ արդյունավետ կերպով զսպելով չկապված աղմուկը և փոքր չափի մանրամասները:

Զտման սկզբունք. Պատկերի յուրաքանչյուր պիքսելին հաջորդաբար դրված է տարօրինակ չափի որոշակի պատուհան: Բոլոր պիքսելների մեջ, որոնք ընկնում են դիտարկվող տարածքում, ներառյալ կենտրոնականը, որոնվում է միջին արժեքը, որն ի վերջո վերագրվում է տարածքի կենտրոնական պիքսելին: Միջինն այս դեպքում տարածքին պատկանող դասավորված պիքսելային արժեքների զանգվածի միջին տարրն է: Պատուհանի տարօրինակ չափը ընտրված է հենց միջին պիքսելի գոյությունն ապահովելու համար:

Հնարավոր է նաև օգտագործել մեդիանային զտիչ՝ պատկերում սպիտակ գաուսյան աղմուկը ճնշելու համար: Այնուամենայնիվ, մեդիանային ֆիլտրման միջոցով աղմուկի ճնշման ուսումնասիրությունը ցույց է տալիս, որ դրա արդյունավետությունը այս խնդրի լուծման գործում ավելի ցածր է, քան գծային ֆիլտրումը:

Միջին ֆիլտրումը առանց թերության չէ, որը բնորոշ է աղմուկի նվազեցման զտիչների մեծամասնությանը. երբ դիմակի չափը մեծանում է աղմուկի նվազեցման աստիճանը բարելավելու համար, պատկերի սրությունը նվազում է և դրա ուրվագիծը մշուշվում է: Այնուամենայնիվ, հնարավոր է նվազագույնի հասցնել բացասական ազդեցությունները՝ կիրառելով մեդիանային զտում դինամիկ դիմակի չափսով (լրացուցիչ մեդիանային զտում): Դրա սկզբունքը մնում է նույնը, միայն զտիչ լոգարիթմական պատուհանի չափը կարող է փոխվել՝ կախված հարևան պիքսելների պայծառությունից:

Պատկերի սրացում

Նկարի աղմուկի նվազեցման համարյա բոլոր ալգորիթմները հանգեցնում են դրա լղոզմանը, արդյունքում մանր մանրամասները կորչում են, իսկ պատկերի ընկալումը դժվարանում է։ Այս բացասական ազդեցությունը մասամբ փոխհատուցելու և ուրվագծերի կորցրած հակադրությունն ու գունային անցումները վերականգնելու համար պատկերի սրման ֆիլտրն ունակ է: Սրությունը կարող է կախված լինել նաև բազմաթիվ այլ գործոններից՝ ոսպնյակի որակից, օգտագործվող բացվածքից, թվային տեսախցիկների մեծ մասի մատրիցայի վրա հայտնաբերված հակամուարե ֆիլտրի հաստությունից, որը տարբեր աստիճանի մշուշում է պատկերը: Նաև պատկերների հստակությունը հաճախ անհրաժեշտ է մեծացնել դրանց չափերը նվազեցնելուց հետո, քանի որ այս դեպքում տեղեկատվության մի մասը անխուսափելիորեն կորչում է, և դրա հետ մեկտեղ՝ ուրվագծերի հստակությունը:

Unsharp masking-ը տեխնիկա է, որը, մեծացնելով պատկերի մեջ հնչերանգների միջև անցումների հակադրությունը, բարելավում է դրա տեսողական ընկալումը սրացման պատրանքի պատճառով: Իրականում հստակությունը մնում է նույն մակարդակի վրա, քանի որ սկզբունքորեն անհնար է վերականգնել պատկերի կորցրած մանրամասները, սակայն տարբեր պայծառության տարածքների միջև հակադրության բարելավումը հանգեցնում է նրան, որ պատկերն ավելի պարզ է ընկալվում:

Նկար 5.1 - «Եզրագծի կտրուկություն» հասկացության նկարազարդում

Պատկերի հստակությունը կախված է նրա ուրվագծերը կազմող տարածքների (W) պայծառության տարբերության մեծությունից և այս տարբերության փոփոխության կտրուկությունից (H):

Անսուր դիմակավորման տեխնիկան առաջին անգամ կիրառվել է ֆիլմերի լուսանկարների մշակման համար: Թվային պատկերի մշակման համար հարմարեցված մեթոդը քիչ է տարբերվում բնօրինակից. պատկերից հանվում է այսպես կոչված «անսուր դիմակը»՝ դրա լղոզված և շրջված պատճենը: Արդյունքը նոր պատկեր է, որը պարունակում է միայն բնօրինակի թեթեւ ուրվագծերը: Մուգ ուրվագծերը կարելի է ձեռք բերել պարզապես արդյունքը շրջելով:

Եթե դուք էլ ավելի հանեք մուգ եզրերը սկզբնական պատկերից և ավելացնեք բաց եզրեր, դուք կստանաք հակադրության զգալի աճ յուրաքանչյուր պայծառության տարբերության դեպքում:

Աղմուկի նվազեցման ֆիլտրերից որևէ մեկը, օրինակ՝ Գաուսի ֆիլտրը, կարող է օգտագործվել բնօրինակը մշուշելու համար՝ «անսուր դիմակ» ստանալու համար:

Նկար 5.2 - Անսուր դիմակավորման կիրառման արդյունքը

The convolution օպերացիան բավականին հաճախ օգտագործվում է պատկերների մշակման մեջ: Բացի սրացումից, այն օգտագործվում է պղտորելու, պայծառությունը մեծացնելու, պայծառացնելու և այլն:

Պատկերի կոնվոլյուցիան տվյալ պիքսելի նոր արժեքի հաշվարկման գործողությունն է, որը հաշվի է առնում նրա շրջակա հարևան պիքսելների արժեքները: Ընդհանուր իմաստով այս տերմինը նշանակում է ինչ-որ գործողություն, որը կատարվում է պատկերի յուրաքանչյուր մասի վրա:

Կոնվոլյուցիայի հիմնական տարրը ոլորման դիմակն է. սա մատրիցա է (կամայական չափերի և կողմերի հարաբերակցության): Հաճախ նման դիմակը կոչվում է զտիչ, միջուկ, կաղապար կամ պատուհան: Մատրիցային տարրերի արժեքները սովորաբար կոչվում են գործակիցներ:

Ամենից հաճախ քառակուսի մատրիցը օգտագործվում է որպես ոլորման միջուկ:

Պատկերի մշակումը կոնվոլյուցիոն գործողությամբ տեղի է ունենում հետևյալ կերպ. մատրիցայի կենտրոնական տարրը, որը կոչվում է «խարիսխ», հաջորդաբար դրվում է պատկերի յուրաքանչյուր պիքսելի վրա: Դիտարկվող պիքսելի նոր արժեքը հաշվարկվում է որպես հարևան պիքսելների արժեքների հանրագումար՝ բազմապատկված դրանց համապատասխան կոնվոլյուցիոն դիմակ գործակիցներով:

Ստացված էֆեկտը կախված է ընտրված ոլորման միջուկից:

Boost ֆիլտրի միջուկը (0, 0) կետում 1-ից մեծ արժեք ունի, բոլոր արժեքների ընդհանուր գումարը հավասար է 1-ի: Օրինակ, խթանող զտիչը ֆիլտրեր է միջուկներով, որոնք տրված են մատրիցներով.

Կոնտրաստի ավելացման էֆեկտը ձեռք է բերվում այն բանի շնորհիվ, որ ֆիլտրը ընդգծում է հարևան պիքսելների ինտենսիվության տարբերությունը՝ հեռացնելով այդ ինտենսիվությունները միմյանցից: Այս ազդեցությունը կլինի ավելի ուժեղ, այնքան մեծ կլինի միջուկի կենտրոնական տերմինի արժեքը:

Կոնվուլյացիայի վրա հիմնված գծային կոնտրաստով ուժեղացված զտումը կարող է առաջացնել տեսանելի գունային լուսապսակներ պատկերի եզրերի շուրջ:

Լույսի տարբերության փոխհատուցում

Պատկերի լուսավորության խնդիրներն առավել հաճախ առաջանում են, երբ պատուհանները, արևը կամ այլ չկարգավորվող լույսի աղբյուրները մտնում են շրջանակ:

Այս իրավիճակը կոչվում է «ավելորդ լույս» և հանգեցնում է նրան, որ չափազանց պայծառ հենակետային լուսավորության պատճառով չափազանց պայծառ առարկաների ֆոնի վրա գտնվող առարկաների մանրամասներն ու գույները կորչում են՝ դժվարանալով տարբերակել:

Հաճախ հանդիպում է նաև լույսի բացակայության իրավիճակ։ Դա կարող է առաջանալ մութ սենյակներում վատ լուսավորությամբ, ինչպես նաև տեսանկարահանող սարքերի զգայունության սահմանափակ տիրույթում նկարահանելուց:

Single Scale Retinex ալգորիթմ

Երբ փորձում եք լուսավորել պատկերը՝ մեծացնելով յուրաքանչյուր պիքսելի պայծառությունը որոշակի ֆիքսված արժեքով, սկզբնական շրջանում լույսի տարածքները կարող են ամբողջովին գերլցված լինել:

Նման դեպքերում պահանջվում է կիրառել գունային «խելացի» ուղղում, որը կկարողանա հավասարեցնել պատկերի լուսավորությունը՝ ավելի քիչ մշակելով լուսավոր հատվածները, քան մուգները։

Այս պահանջները բավարարվում են Single Scale Retinex ալգորիթմով, որը հիմնված է ցանցաթաղանթի ընկալիչների սկզբունքների վրա: Ալգորիթմի հիմնական նպատակն է պատկերը բաժանել բաղադրիչների, որոնք առանձին պատասխանատու են լուսավորության և մանրամասների համար: Քանի որ պատկերում առկա խնդիրները կապված են տեսարանի լուսավորության հետ, ապա, ստանալով լուսավորության համար պատասխանատու բաղադրիչը, հնարավոր է դառնում այն փոխակերպել պատկերից առանձին՝ դրանով իսկ զգալիորեն բարձրացնելով դրա որակը:

Ցանկացած պատկեր կարող է ներկայացվել որպես բարձր հաճախականության ազդանշանի (արտացոլում - R) և ցածր հաճախականության ազդանշանի (լուսավորություն - I) արդյունք:

S(x,y) = I(x,y) * R(x,y)(5.6)

Նկար 5.3 - Պատկերի ներկայացում Retinex ալգորիթմում:

Լուսավորության մոտավոր պատկերը կարելի է ձեռք բերել ցածր անցումային զտման միջոցով, այլ կերպ ասած՝ պարզապես պղտորել բնօրինակ պատկերը, օրինակ՝ Գաուսի ֆիլտրով:

որտեղ G - Գաուսյան ֆիլտր

Քանի որ ազդանշանի լոգարիթմը չի փոխում հաճախականությունը, և լոգարիթմական ֆունկցիայի հատկությունների պատճառով (արտադրանքի լոգարիթմը հավասար է գործոնների լոգարիթմների գումարին), ազդանշանների արտադրյալը բաժանելու խնդիր կարող է դրվել. պարզեցված է ազդանշանների գումարի տարանջատման խնդրին:

Դրանից հետո մնում է միայն ընդունված ազդանշանից ցուցիչը վերցնել՝ այն սկզբնական ամպլիտուդի սանդղակին վերադարձնելու համար։ Ստացված բարձր հաճախականության բաղադրիչը կարող է ավելացվել մշուշված և պայծառացած բնօրինակ պատկերին, որը հանդես է գալիս որպես լուսավորության նոր մոդել:

Լույսի հավասարեցումից ստացված ազդեցությունը կարող է չափազանց ուժեղ լինել (մութ տարածքները կդառնան նույն պայծառությունը, ինչ թեթևերը): Էֆեկտը նվազեցնելու համար կարող եք պարզապես որոշակի համամասնությամբ խառնել մշակված պատկերը բնօրինակի հետ։

Գամմայի ուղղում

Գամմա ուղղման սկզբնական նպատակն է փոխհատուցել տարբեր ելքային սարքերում ցուցադրվող գույների տարբերությունները, որպեսզի պատկերը նույն տեսքը ունենա, երբ դիտվում է տարբեր մոնիտորների վրա: Կիրառվող հզորության ֆունկցիայի ոչ գծային ձևի շնորհիվ գամմա ուղղումը նաև հնարավորություն է տալիս մեծացնել պատկերի մուգ հատվածների հակադրությունը՝ առանց վառ մանրամասներ ընդգծելու և պատկերի օբյեկտների սահմանների տեսանելիությունը կորցնելու:

Լուսավորության մասին տեղեկատվությունը հեռուստատեսության անալոգային ձևով, ինչպես նաև թվային ձևով ամենատարածված գրաֆիկական ձևաչափերում պահվում է ոչ գծային մասշտաբով: Պիկսելի պայծառությունը մոնիտորի էկրանին կարելի է համաչափ համարել

որտեղ ես պիքսելի պայծառությունն է ցուցադրման էկրանին (կամ գունային բաղադրիչների պայծառությունը՝ կարմիր, կանաչ և կապույտ առանձին),

V-ը 0-ից 1 թվային գունային արժեք է, և

r - գամմա ուղղման ինդեքս:

Եթե r-ը 1-ից փոքր է, ապա մակարդակի փոխանցման բնութագիրը կլինի ուռուցիկ, իսկ ստացված պատկերը ավելի բաց կլինի, քան բնօրինակը: Եթե r-ը 1-ից մեծ է, ապա մակարդակի փոխանցման բնութագիրը կլինի գոգավոր, իսկ ստացված պատկերը կլինի ավելի մուգ, քան բնօրինակը:

Լռելյայնորեն, r պարամետրը 1 է, որը համապատասխանում է մակարդակների գծային փոխանցմանը և առանց գամմայի ուղղման:

Պատկերի ուրվագծերի ընտրություն

Եզրագծային վերլուծությունը կարող է օգտագործվել նկարագրելու, ճանաչելու, համեմատելու և որոնելու գրաֆիկական օբյեկտները, որոնք ներկայացված են որպես արտաքին ուրվագծեր: Քանի որ ուրվագծերի օգտագործումը բացառում է օբյեկտի ներքին կետերը, դա կարող է զգալիորեն նվազեցնել այդ գործողությունների հաշվողական և ալգորիթմական բարդությունը:

Նկար 5.4 - Հզորության ֆունկցիայի տեսակը փոխելը կախված r պարամետրից

Օբյեկտի ուրվագիծը կետերի ցանկ է, որոնք ներկայացնում են պատկերի կորը, որն օբյեկտը բաժանում է ֆոնից: Ամենից հաճախ, եզրագծի երկայնքով պայծառության կամ գույնի թռիչք կա:

Նկարում ուրվագծերի որոնումը պարզեցնելու համար կարող եք նախապես երկուականացնել այն:

Sobel ֆիլտրը ընդգծում է առարկաների եզրերը՝ ելնելով դրանց պայծառությունից: Քանի որ գունային բաղադրիչը հաշվի չի առնվում, պատկերները նախ պետք է վերածվեն մոխրագույնի:

Sobel ֆիլտրը հաջորդաբար կիրառվում է յուրաքանչյուր պիքսելի վրա՝ հաշվարկելով դրա պայծառության գրադիենտի մոտավոր արժեքը: Յուրաքանչյուր պատկերի կետի գրադիենտը (պայծառության ֆունկցիա) երկչափ վեկտոր է, որի բաղադրիչներն են պատկերի պայծառության հորիզոնական և ուղղահայաց ածանցյալները:

Պատկերի յուրաքանչյուր կետում գրադիենտ վեկտորը կողմնորոշվում է պայծառության ամենամեծ աճի ուղղությամբ, և դրա երկարությունը համապատասխանում է պայծառության փոփոխության չափին: Այս տվյալները թույլ են տալիս ենթադրություն անել որոշակի օբյեկտի սահմանի վրա դիտարկվող կետը գտնելու հավանականության, ինչպես նաև այս սահմանի կողմնորոշման մասին։

Դա. Սոբելի օպերատորի աշխատանքի արդյունքը մշտական պայծառության շրջանի մի կետում կլինի զրոյական վեկտոր, իսկ տարբեր պայծառության շրջանների սահմանին ընկած կետում՝ սահմանը հատող վեկտորը պայծառության աճի ուղղությամբ:

Նկարի յուրաքանչյուր կետում ածանցյալների մոտավոր արժեքները հաշվարկելու համար Sobel ֆիլտրը օգտագործում է 3×3 մատրիցով ոլորում:

Sobel matrix գործակիցները:

Գրադիենտի վերջնական արժեքը հաշվարկվում է մոտավորմամբ՝ ըստ բանաձևի.

|Գ| = |Gx| + |Գյ|

Kenny սահմանային դետեկտոր

Չնայած Քենիի աշխատանքն իրականացվել է համակարգչային տեսողության սկզբնական շրջանում (1986թ.), Քենիի եզրային դետեկտորը մինչ օրս լավագույն դետեկտորներից մեկն է: Քենիի մեթոդը բազմաստիճան ալգորիթմ է և ներառում է հետևյալ քայլերը.

1. Պատկերի մաքրում աղմուկից և ավելորդ մանրամասներից։

2. Պատկերի մաքրում աղմուկից և ավելորդ մանրամասներից։

3. Որոնել պատկերի գրադիենտներ, օրինակ՝ օգտագործելով Sobel օպերատորը:

4. Ոչ մաքսիմալների զսպում. Որպես սահմաններ նշվում են միայն տեղական առավելագույնը:

5. Կրկնակի շեմի զտում: Պոտենցիալ սահմանները սահմանվում են շեմերով:

6. Հետագծող ուղիներ (եզրերը կապել ուղիներին)

Քանի որ պատկերի ամենափոքր աղմուկը կարող է կոտրել դրա ուրվագծերի ամբողջականությունը, խորհուրդ է տրվում նախքան որոնումը սկսելը պատկերը զտել աղմուկի նվազեցման ցանկացած եղանակով: Գործողության բարձր արագության և իրականացման հեշտության պատճառով ամենից հաճախ օգտագործվում է Գաուսի ֆիլտրը: Պատկերի եզրերը կարող են լինել տարբեր ուղղություններով, ուստի Քենի ալգորիթմը օգտագործում է չորս զտիչներ՝ հորիզոնական, ուղղահայաց և անկյունագծային եզրերը հայտնաբերելու համար: Օգտագործելով եզրերի հայտնաբերման օպերատորը (օրինակ՝ Sobel օպերատորը) կարելի է ստանալ առաջին ածանցյալի արժեքը հորիզոնական ուղղությամբ (Gy) և ուղղահայաց ուղղությամբ (Gx): Այս գրադիենտից կարող եք ստանալ եզրագծի ուղղության անկյունը.

Սահմանի ուղղության անկյունը կլորացվում է չորս անկյուններից մեկի վրա, որոնք ներկայացնում են ուղղահայաց, հորիզոնական և երկու անկյունագծեր (օրինակ՝ 0, 45, 90 և 135 աստիճան): Սահմաններ են հայտարարվում միայն այն պիքսելները, որոնցում հասնում է գրադիենտի տեղական առավելագույնը գրադիենտ վեկտորի ուղղությամբ։ Ուղղության արժեքը պետք է լինի 45°-ի բազմապատիկ: Ոչ մաքսիմալը ճնշելուց հետո ծայրերը դառնում են ավելի ճշգրիտ և բարակ։

Հաջորդ քայլում շեմերի զտումը որոշում է յուրաքանչյուր դիտարկվող պիքսելի համար, թե արդյոք այն պատկանում է պատկերի սահմաններին: Որքան բարձր է շեմը, այնքան ավելի միատեսակ կլինեն հայտնաբերված եզրագծերը, սակայն թույլ եզրերը կարելի է անտեսել: Մյուս կողմից, շեմի նվազումը մեծացնում է ալգորիթմի զգայունությունը աղմուկի նկատմամբ: Kenny եզրերի հայտնաբերումն օգտագործում է զտման երկու շեմ. եթե պիքսելային արժեքը վերին սահմանից բարձր է, ապա այն վերցնում է առավելագույն արժեքը (սահմանը համարվում է հուսալի), եթե այն ավելի ցածր է, ապա պիքսելը ճնշվում է, իսկ կետերը, որոնց արժեքը ընկնում է միջակայքում: շեմերը ստանում են ֆիքսված միջին արժեք (նրանք կհստակեցվեն հաջորդ քայլում):

Պատկերի մշակման վերջին փուլը առանձին եզրեր միատեսակ եզրագծերի մեջ կապելն է: Փիքսելները, որոնք ստացել են նախորդ քայլի միջին արժեքը, կա՛մ ճնշվում են (եթե դրանք չեն դիպչում արդեն հայտնաբերված եզրերից որևէ մեկին), կա՛մ կցվում են համապատասխան եզրագծին:

Սեգմենտացիան

Ֆոտո և վիդեո սարքավորումներից ստացված պատկերների մեծ մասը ռաստեր են, այսինքն՝ բաղկացած ուղղանկյուն ցանցով դասավորված գունավոր կետերից։ Այնուամենայնիվ, մարդիկ իրենց շրջապատող աշխարհն ընկալում են որպես պինդ առարկաների հավաքածու, այլ ոչ թե կետերի մատրիցա։ Մարդու ուղեղը կարողանում է միավորել պատկերի տարբեր մանրամասները միատարր տարածքների մեջ՝ հստակորեն բաժանելով այն առարկաների ենթագիտակցական մակարդակում։ Այս գործընթացը կոչվում է հատվածավորում և կարող է իրականացվել ծրագրային ապահովման մեջ՝ համակարգչային պատկերների վերլուծության և օրինաչափությունների ճանաչման խնդիրը լուծելիս: Սեգմենտացիան կատարվում է վերլուծության առաջին փուլերում, և դրա իրականացման որակը կարող է ուժեղ ազդեցություն ունենալ դրա արագության և ճշգրտության վրա:

Սեգմենտավորման մեթոդները կարելի է բաժանել երկու դասի. ավտոմատ - չպահանջող օգտատիրոջ փոխազդեցություն և ինտերակտիվ - օգտագործելով օգտագործողի մուտքը անմիջապես գործընթացում:

Առաջին դեպքում շրջանների հատկությունների մասին a priori տեղեկատվություն չի օգտագործվում, այլ որոշ պայմաններ են դրված հենց պատկերի բաժանման վրա (օրինակ, բոլոր շրջանները պետք է լինեն միատեսակ գույնով և հյուսվածքով): Քանի որ սեգմենտավորման խնդրի այս ձևակերպումը չի օգտագործում a priori տեղեկատվություն պատկերված օբյեկտների մասին, այս խմբի մեթոդները համընդհանուր են և կիրառելի ցանկացած պատկերի համար:

Որոշակի առաջադրանքում մեթոդի որակի մոտավոր գնահատման համար սովորաբար ամրագրվում են մի քանի հատկություններ, որոնք լավ հատվածավորումը պետք է ունենա.

§ Տարածքների միատարրություն (գույնի կամ հյուսվածքի միատեսակություն);

§ հարևան շրջանների տարբերությունը.

§ շրջանի սահմանի հարթություն;

§ փոքր քանակությամբ փոքր «անցքեր» մարզերի ներսում.

Շեմերի հատվածավորում

Շեմերի մշակումը պատկերի մշակմանն ուղղված ամենապարզ մեթոդն է, որի առանձին միատարր տարածքները տարբերվում են միջին պայծառությամբ: Այնուամենայնիվ, եթե պատկերը անհավասար լուսավորված է, որոշ օբյեկտներ կարող են համապատասխանել ֆոնի ինտենսիվությանը, ինչը շեմերի հատվածավորումը կդարձնի անարդյունավետ:

Շեմերի հատվածավորման ամենապարզ և միևնույն ժամանակ հաճախակի օգտագործվող տեսակը երկուական հատվածավորումն է, երբ պատկերում առանձնանում են միայն երկու տեսակի միատարր տարածքներ։

Այս դեպքում սկզբնաղբյուր պատկերի յուրաքանչյուր կետի վերափոխումը ելքային պատկերի կատարվում է ըստ կանոնի.

որտեղ x0-ը մշակման միակ պարամետրն է, որը կոչվում է շեմ: Ելքային պայծառության մակարդակները y0 և y1 կարող են լինել կամայական, դրանք կատարում են միայն նշանների գործառույթները, որոնց օգնությամբ նշվում է ստացված քարտեզը՝ դրա կետերը համապատասխանաբար վերագրելով K1 կամ K2 դասերին: Եթե ստացված պատրաստուկը պատրաստված է տեսողական ընկալման համար, ապա հաճախ դրանց արժեքները համապատասխանում են սևի և սպիտակի մակարդակներին: Եթե կան երկուսից ավելի դասեր, ապա շեմերի ընտանիքը պետք է նշվի շեմերի սահմանման ժամանակ՝ առանձնացնելով տարբեր դասերի պայծառությունը միմյանցից։

Շեմերի հատվածավորումը լավ հարմար է պատկերում չհատվող փոքր թվով օբյեկտներ ընտրելու համար, որոնք ունեն միատեսակ կառուցվածք և կտրուկ առանձնանում են ֆոնից: Պատկերի տարասեռության աստիճանի, հետևաբար հատվածների քանակի և դրանց բարդության բարձրացման հետ մեկտեղ, այս տեսակի հատվածավորումը դառնում է անարդյունավետ:

Գրաֆիկի բաժանման վրա հիմնված հատվածավորում

Գրաֆիկների տեսության մեթոդները պատկերների հատվածավորման ամենաակտիվ զարգացող ոլորտներից են:

Այս խմբի մեթոդների ընդհանուր գաղափարը հետևյալն է. Պատկերը ներկայացված է որպես կշռված գրաֆիկ՝ պատկերի կետերում գագաթներով: Գրաֆիկի եզրերի կշիռը արտացոլում է կետերի նմանությունը ինչ-որ առումով (կետերի միջև հեռավորությունը որոշ չափումների երկայնքով): Պատկերի բաժանումը մոդելավորվում է գրաֆիկական կտրվածքներով:

Սովորաբար, գրաֆիկների տեսության մեթոդներում ներդրվում է կտրված «ծախսերի» ֆունկցիոնալ, որն արտացոլում է ստացված հատվածավորման որակը: Այսպիսով, պատկերը միատարր շրջանների բաժանելու խնդիրը վերածվում է գրաֆիկի վրա ծախսերի նվազագույն կրճատում գտնելու օպտիմալացման խնդրի: Այս մոտեցումը թույլ է տալիս, բացի հատվածների գույնի և հյուսվածքի միատեսակությունից, վերահսկել հատվածների ձևը, դրանց չափերը, եզրագծերի բարդությունը և այլն:

Նվազագույն ծախսերի կրճատումը գտնելու համար օգտագործվում են տարբեր մեթոդներ՝ ագահ ալգորիթմներ (յուրաքանչյուր քայլում ընտրվում է եզր, որպեսզի կրճատման ընդհանուր արժեքը լինի նվազագույն), դինամիկ ծրագրավորման մեթոդներ (երաշխավորված է, որ յուրաքանչյուր քայլում ընտրելով օպտիմալ եզրը. , մենք կհայտնվենք օպտիմալ ճանապարհով), Dijkstra ալգորիթմ և այլն։

Ինտերպոլացիա

Համակարգչային գրաֆիկայում ինտերպոլացիայի մեթոդը հաճախ օգտագործվում է պատկերների մասշտաբը փոխելու գործընթացում։ Փոխելով պատկերի պիքսելների քանակը՝ ինտերպոլացիան օգնում է խուսափել պատկերի չափից ավելի պիքսելացումից, երբ այն մեծանում է կամ կարևոր մանրամասների կորուստը, երբ այն փոքրանում է:

Ինտերպոլացիայի գործընթացում պատկերի պիքսելների միջև տեղադրվում են լրացուցիչ կետեր, որոնց գնահատված տոնայնությունը և գույնը հաշվարկվում են հատուկ ալգորիթմի միջոցով, որը հիմնված է հարևան տարածքների առկա տվյալների վերլուծության վրա: Ցավոք սրտի, քանի որ ցանկացած ինտերպոլացիա ընդամենը մոտավորություն է, պատկերը միշտ կկորցնի որակը, երբ այն ինտերպոլացվի:

Մոտակա հարեւանի ինտերպոլացիա

Այս ալգորիթմը ինտերպոլացիայի ամենապարզ տեսակն է, որը պարզապես մեծացնում է պատկերի յուրաքանչյուր պիքսելը անհրաժեշտ մասշտաբով: Պահանջում է նվազագույն մշակման ժամանակ, բայց հանգեցնում է վատագույն արդյունքների:

Երկգծային ինտերպոլացիա

Այս տեսակի ինտերպոլացիան կատարվում է երկչափ ցանցի յուրաքանչյուր կոորդինատի համար: Պատկերը համարվում է մակերես, գույնը՝ երրորդ հարթություն։ Եթե պատկերը գունավոր է, ապա ինտերպոլացիան կատարվում է առանձին երեք գույների համար։ Նոր պատկերի յուրաքանչյուր անհայտ կետի համար երկգծային ինտերպոլացիան դիտարկում է այն շրջապատող չորս հայտնի պիքսելներից բաղկացած քառակուսի: Այս չորս պիքսելների կշռված միջինը օգտագործվում է որպես ինտերպոլացված արժեք: Արդյունքում պատկերները շատ ավելի հարթ են թվում, քան մոտակա հարեւանի մեթոդի արդյունքը։

Երկգծային ինտերպոլացիան լավ է աշխատում մասշտաբային գործոնների ամբողջ թվով մեծ արժեքների դեպքում, սակայն այն բավականին շատ է լղոզում պատկերի սուր եզրերը:

Երկխորանարդ ինտերպոլացիան մեկ քայլ առաջ է գնում, քան երկգծայինը, հաշվի առնելով շրջապատող 4x4 պիքսելների զանգվածը, ընդհանուր առմամբ 16: Քանի որ դրանք գտնվում են անհայտ պիքսելից տարբեր հեռավորությունների վրա, մոտակա պիքսելներն ավելի մեծ կշիռ են ստանում հաշվարկում: Bicubic interpolation-ը տալիս է զգալիորեն ավելի հստակ պատկերներ, քան նախորդ երկու մեթոդները և, անկասկած, լավագույնն է մշակման ժամանակի և արտադրանքի որակի առումով: Այդ պատճառով այն դարձել է ստանդարտ պատկերների խմբագրման բազմաթիվ ծրագրերում (ներառյալ Adobe Photoshop), տպիչի դրայվերները և ներկառուցված տեսախցիկի ինտերպոլացիան:

Մեծածավալ պատկերը կարող է զգալիորեն պակաս հստակ լինել: Ինտերպոլացիայի ալգորիթմները, որոնք ավելի լավ են պահպանում հստակությունը, նույնպես ավելի հակված են մուարեի նկատմամբ, մինչդեռ նրանք, որոնք վերացնում են մուարը, հակված են ավելի մեղմ արդյունքների: Ցավոք, այս ծավալային փոխզիջումը հնարավոր չէ խուսափել:

Սրա դեմ պայքարելու լավագույն միջոցներից մեկը թեփոտելուց անմիջապես հետո ոչ սրված դիմակ կիրառելն է, նույնիսկ եթե բնօրինակն արդեն սրվել է:

5.2 Ենթահամակարգում օգտագործվող ալգորիթմների ընտրության հիմնավորումը

Մշակված ծրագրային փաթեթի հիմնական պահանջն էր նվազագույնի հասցնել վիդեո հոսքի նվագարկման հետաձգումը հաշվողական կլաստերի վրա դրա նախնական մշակման ժամանակ: Բացի այդ, նկարահանումները կարող են տեղի ունենալ ցանկացած պայմաններում, ինչը նշանակում է, որ կարճ ժամանակում անհրաժեշտ էր ներդնել մեծ թվով պարզ զտիչներ՝ տարբեր բացասական ազդեցությունները չեզոքացնելու համար։ Բացի այդ, անհրաժեշտ էր կարճ ժամանակում ուսումնասիրել տեսանյութում հայտնված մեծ թվով բացասական գործոններ և դրանք չեզոքացնելու պարզ զտիչներ կիրառել։ Ներկայացված պահանջներին բավարարող ալգորիթմները պետք է լինեն հեշտ հասանելի, լավ օպտիմիզացված, ունենան բարձր հուսալիություն և, միևնույն ժամանակ, հեշտ իրականացվող: OpenCV գրադարանի գործառույթներն ունեն այդպիսի հատկություններ, հետևաբար, վիդեո հոսքի մշակման ֆիլտրերի իրականացման հատուկ մեթոդներ ընտրելիս, առաջնահերթությունը տրվեց այս գրադարանում պարունակվող ալգորիթմներին այս կամ այն ձևով:

Վերջնական որակավորման աշխատանքի տեսական մասում դիտարկված բոլոր ալգորիթմները ներդրվել են թեստային տարբերակով՝ դրանց բնութագրերը գործնականում համեմատելու համար։ Մասնավորապես, նախապատվությունը տրվել է տեսահոսքի շրջանակի մշակման արագության և արդյունքի որակի փոխզիջմանը:

Արդյունքում ընտրվել են հետևյալ ալգորիթմները՝ հաշվողական կլաստերի վրա տեսահոսքի մշակման զտիչներ իրականացնելու համար.

1. Գաուսի ալգորիթմն ընտրվել է «լրացուցիչ սպիտակ» աղմուկը հեռացնելու համար: Որպես աղմուկի նվազեցման ամենատարածված մեթոդ, այն շատ լավ օպտիմիզացված է և, հետևաբար, ունի բարձր արագություն:

2. Գաուսի ալգորիթմն ընտրվել է «լրացուցիչ սպիտակ» աղմուկը հեռացնելու համար: Որպես աղմուկի նվազեցման ամենատարածված մեթոդ, այն շատ լավ օպտիմիզացված է և, հետևաբար, ունի շահագործման բարձր արագություն:

3. Միջին ֆիլտրումն ընտրվել է «իմպուլսային» աղմուկը հեռացնելու համար: Այս մեթոդը նաև լավ օպտիմիզացված է և հատուկ նախագծված է իմպուլսիվ և աղի և պղպեղի աղմուկը վերացնելու համար:

4. Convolution-ն ընտրվել է պատկերը սրելու համար, քանի որ այն շատ ավելի արագ է աշխատում, քան ոչ սուր դիմակավորումը՝ միաժամանակ ընդունելի արդյունքներ տալով։

5. OpenCV գրադարանը չի պարունակում գունային շտկման ալգորիթմներ, ուստի որոշվել է իրականացնել ամենատարածված և լավ փաստագրված Single Scale Retinex ալգորիթմը: Այս մեթոդն ունի շատ բարձր արդյունավետություն, սակայն պահանջում է օպտիմալացում՝ աշխատանքը արագացնելու համար։

6. Որպես եզրերի հայտնաբերման մեթոդ ընտրվել է Kenny ալգորիթմը, քանի որ այն ավելի լավ արդյունքներ է տալիս, քան Sobel ֆիլտրը։

7. OpenCV գրադարանում ներկայացված բրգաձեւ հատվածավորման ալգորիթմը չափազանց դանդաղ է, ուստի որոշվեց օգտագործել նախկինում դիտարկված հատվածավորման ալգորիթմը գրաֆիկների վրա։

8. ինտերպոլացիա - երկխորանարդ ինտերպոլացիայի մեթոդն ընտրվել է որպես աշխատանքի արագության և արդյունքի որակի ամենախելամիտ փոխզիջում:

Օգտագործված ծրագրաշարի տեղադրում և կազմաձևում:

Օգտագործված հաշվողական կլաստերը աշխատում էր GNU Linux-ով (Ubuntu)

Օպերացիոն համակարգը տեղադրելուց հետո անհրաժեշտ է տեղադրել մի քանի գրադարաններ, որոնք աջակցում են պատկերային ֆայլեր կարդալու և գրելու, էկրանին նկարելու, տեսանյութի հետ աշխատելու և այլն:

CMake-ի տեղադրում

Նախագիծը կառուցված է CMake-ի միջոցով (պահանջում է 2.6 կամ ավելի բարձր տարբերակ): Դուք կարող եք տեղադրել այն հրամանով.

apt-get install cmake

Ձեզ կարող են անհրաժեշտ լինել նաև հետևյալ գրադարանները.

build-essential libjpeg62-dev libtiff4-dev libjasper-dev libopenexr-dev libtbb-dev libeigen2-dev libfaac-dev libopencore-amrnb-dev libopencore-amrwb-dev libtheora-dev libvorbis-dev libxvidcore-dev

ffmpeg-ի տեղադրում

Որպեսզի opencv-ն վիդեո ֆայլերը ճիշտ մշակի, անհրաժեշտ է տեղադրել ffmpeg գրադարանը։ Դա արվում է հետևյալ հրամաններով.

1) Գրադարանի սկզբնական ծածկագրերի ներբեռնում

wget http://ffmpeg.org/releases/ffmpeg-0.7-rc1.tar.gz

2) Արխիվի բացում սկզբնական կոդերով

tar -xvzf ffmpeg-0.7-rc1.tar.gz

3) Գրադարանի կոնֆիգուրացիա

կարգավորել --enable-gpl --enable-version3 --enable-nonfree --enable-postproc

enable-libfaac --enable-libopencore-amrnb --enable-libopencore-amrwb

Enable-libtheora --enable-libvorbis --enable-libxvid --enable-x11grab

Enable-swscale --enable-shared

4) գրադարանի կառուցում և տեղադրում

GTK տեղադրում

OpenCV պատուհանների ցուցադրման համար անհրաժեշտ է տեղադրել GTK+ 2.x կամ ավելի բարձր, ներառյալ վերնագրի ֆայլերը (libgtk2.0-dev)

apt-get տեղադրել libgtk2.0-dev

Opencv-ի տեղադրում

Բոլոր հարակից գրադարանները տեղադրելուց հետո opencv2.2-ի տեղադրումը կատարվում է հետևյալ հրամաններով.

1) OpenCV գրադարանի սկզբնական կոդերի ներբեռնում

http://downloads.sourceforge.net/project/opencvlibrary/opencv-unix/2.2/OpenCV-2.2.0.tar.bz2

2) Արխիվի բացում սկզբնական կոդերով

tar -xvf OpenCV-2.2.0.tar.bz2

3) Makefile-ի ստեղծում՝ օգտագործելով CMake:

4) OpenCV գրադարանի կառուցում և տեղադրում

5) Ձեզ նույնպես կարող է անհրաժեշտ լինել սահմանել գրադարանների ուղին

արտահանել LD_LIBRARY_PATH=/usr/local/lib:$LD_LIBRARY_PATH

Մշակված ծրագրային փաթեթի տեղադրում և կազմում

Անհրաժեշտ է պատճենել ծրագրերի սկզբնական ծածկագրերը սույն բացատրական գրառմանը կցված սկավառակից։ Պատճենեք build_all.sh խմբաքանակի ֆայլը նույն թղթապանակում և գործարկեք այն: Եթե gcc կոմպիլյատորը տեղադրված է համակարգում, ապա կառուցումը տեղի կունենա ավտոմատ կերպով:

ԹՎԱՅԻՆ ԲՈՒԺՈՒՄ ԱԶԱՆԳՆԵՐ

Թեմա 17. ՊԱՏԿԵՐԻ ՄՇԱԿՈՒՄԸ

Մարդու երևակայությունից այն կողմ ոչինչ չկա։

Տիտոս Լուկրեցիոս. Հռոմեացի փիլիսոփա և բանաստեղծ. 1-ին դար մ.թ.ա ե.

Երևակայությունը լավ բան է։ Բայց նկուղից մի բոմժ դուրս բերելը, այն լվանալը, այն «Ապոլոն» դարձնելը, այն լուցկու տուփի մեջ փաթեթավորելը և ընկերոջը էլեկտրոնային փոստով ուղարկելը, լավ գրաֆիկական ծրագիրն ավելի լավ կլինի:

Անատոլի Պիշմինցև, Ուրալի դպրոցի Նովոսիբիրսկի երկրաֆիզիկոս։ 20 րդ դար

Ներածություն.

1. Հիմնական հասկացություններ. Պատկերների գրաֆիկական ներկայացում: Գույնի ներկայացում համակարգչային գրաֆիկայում: RGB գույնի մոդել: CIE XYZ գունային համակարգ:

2. Ռաստերային պատկերների երկրաչափական փոխակերպումներ. Փոխակերպման ոլորտներն ու փուլերը. Նմուշառում. Երկչափ ազդանշանի վերականգնման ինտերպոլացիոն շարք: Պատկերների հաճախականության աղավաղումներ և դրանց վերացում: Պատկերի նմուշառում.

3. Պատկերի զտում. Գծային զտիչներ. Հարթեցնող զտիչներ. Կոնտրաստային զտիչներ. տարբերության զտիչներ. Երկչափ ցիկլային կոնվուլյացիա. ոչ գծային զտիչներ. Շեմի զտում. միջին ֆիլտրում: Ծայրահեղ զտիչներ.

4. Պատկերի սեղմում: Կրկնվող երկարության կոդավորման ալգորիթմներ (RLE): Բառարանի ալգորիթմներ. Վիճակագրական կոդավորման ալգորիթմներ. Կորստի պատկերի սեղմում: Պատկերի կորստի գնահատում. Ֆուրիեի փոխակերպում. Wavelet փոխակերպում.

ՆԵՐԱԾՈՒԹՅՈՒՆ

Թվային պատկերների ոլորտում հետազոտությունների շրջանակը արագորեն աճում է։ Դա պայմանավորված է նրանով, որ պատկերի մշակումը բազմաչափ ազդանշանի մշակում է, և իրական աշխարհում ազդանշանների մեծ մասը բազմաչափ է:

Մաթեմատիկական ներկայացման մեջ պատկերը երկչափ ազդանշան է, որը կրում է հսկայական քանակությամբ տեղեկատվություն: 500 × 500 տարրերից բաղկացած գունավոր պատկերը մի քանի հարյուր հազար բայթանոց զանգված է: Նման տեղեկատվության մշակումը հնարավոր է միայն հաշվարկների ռացիոնալ կազմակերպմամբ։ Պատկերի մշակման հատուկ առաջադրանքների համար կարող են կիրառվել արդյունավետ մշակման մեթոդներ՝ հաշվի առնելով այս կոնկրետ առաջադրանքի առանձնահատկություններն ու սահմանափակումները: Բայց եթե մենք խոսում ենք պատկերների մշակման մասին՝ խնդիրների լայն դասի լուծման համար, ապա անհրաժեշտ է առանձնացնել ստանդարտ գործողությունների մի շարք, որոնցից կարող են կառուցվել կամայական խնդիրներ լուծելու ալգորիթմներ: Դրանք ներառում են գծային փոխակերպումներ, 2D կոնվոլյուցիա և 2D դիսկրետ Ֆուրիեի փոխակերպումներ:

Բայց պատկերների մշակման մեջ լայնորեն կիրառվում են նաև ոչ գծային փոխակերպումները։ Պատկերների առանձնահատկությունն այն է, որ պատկերի առանձին տարրերը որոշակի կապի մեջ են հարևան տարրերի հետ։ Հետևաբար, պատկերների փոխակերպման ալգորիթմների մեծ մասը լոկալ բնույթ է կրում, այսինքն՝ նրանք պատկերները մշակում են տվյալի շրջակայքում գտնվող տարրերի խմբերով: Գծային փոխակերպումները բավարարում են տեղայնության հատկությունը և թույլ են տալիս կառուցել ալգորիթմներ, որոնց հաշվողական բարդությունը մեծապես կախված չէ ծածկված հարևանության չափից: Նույն հատկությունները պահանջվում են ոչ գծային պատկերի փոխակերպումների համար: Նման փոխակերպումների դասը ներառում է ալգորիթմներ, որոնք կոչվում են վարկանիշային ֆիլտրման ալգորիթմներ՝ հիմնված տեղական վարկանիշային պատկերի վիճակագրության հաշվարկի վրա։ Վարկանիշային վիճակագրությունը և դրանց ածանցյալները հաշվարկելիս հնարավոր են պարզեցումներ՝ կապված պատկերների տեղեկատվական ավելորդության հետ։ Այս դասի ամենահայտնի ալգորիթմը մեդիանային զտման ալգորիթմն է։ Վարկանիշային ալգորիթմների այլ օրինակներ են ծայրահեղ զտման ալգորիթմները, որոնք փոխարինում են վերլուծված պատկերի տարրը հարևանության առավելագույն կամ նվազագույնի հետ: Կարգավորման ալգորիթմների մեկ այլ հատկություն է մշակված պատկերի բնութագրիչներին տեղական հարմարվողականությունը և դրանց օգտագործման հնարավորությունը ոչ միայն հարթելու և զրոյացնելու, այլ նաև պատկերի ավտոմատ ճանաչման մեջ հատկանիշի արդյունահանման համար:

Պատկերների մշակման ժամանակ լայնորեն կիրառվում են ազդանշանների մշակման միաչափ մեթոդները, եթե հնարավոր է դրանք ընդհանրացնել բազմաչափ ազդանշանների։ Միևնույն ժամանակ, պետք է հաշվի առնել, որ բազմաչափ համակարգերի նկարագրության մաթեմատիկական մեթոդները ամբողջական չեն։ Բազմաչափ համակարգերն ունեն մեծ թվով ազատության աստիճաններ, և դրանց դիզայնը ձեռք է բերում ճկունություն, որը բնորոշ չէ միաչափ համակարգերին: Միևնույն ժամանակ, բազմաչափ բազմանդամները չեն կարող տարրալուծվել պարզ գործոնների, ինչը բարդացնում է բազմաչափ համակարգերի վերլուծությունը և սինթեզը։

17.1. Հիմնական հասկացություններ

Պատկերների գրաֆիկական ներկայացում: Գրաֆիկական տեղեկատվությունը երկչափ հարթության վրա (մոնիտորի էկրան) ներկայացնելու համար օգտագործվում է երկու մոտեցում՝ ռաստեր և վեկտոր:

Վեկտորային մոտեցմամբ գրաֆիկական տեղեկատվությունը նկարագրվում է որպես վերացական երկրաչափական օբյեկտների մի շարք՝ ուղիղ գծեր, հատվածներ, կորեր, ուղղանկյուններ և այլն: Վեկտորի նկարագրությունը ենթադրում է ապրիորի գիտելիքներ պատկերի կառուցվածքի մասին:

Ռաստերային գրաֆիկան գործում է կամայական պատկերների վրա bitmaps-ի տեսքով: Ռաստերը հարթության վրա պատկերի նկարագրությունն է՝ բաժանելով (նմուշառում) այն նույնական տարրերի սովորական ցանցի երկայնքով և յուրաքանչյուր տարրի հատկացնելով իր գույնը և ցանկացած այլ հատկանիշ: Ամենապարզ ռաստերը ուղղանկյուն է, պատկերների փոխանցման նմուշների քանակով ամենախնայողը՝ վեցանկյուն։ Մաթեմատիկորեն ռաստերը շարունակական պատկերի ֆունկցիայի հարթության վրա մաս-մաս հաստատուն մոտարկում է:

Ռաստերի տարրը կոչվում է պիքսել: Ստանդարտ պիքսելային նույնականացում.

f(i, j) = (A(i, j),C(i, j)), (17.1.1)

որտեղ A(i, j) Ì R2 - պիքսելային տարածք, C(i, j) Î C - պիքսել հատկանիշ (սովորաբար գույն): Առավել հաճախ օգտագործվող երկու հատկանիշներն են.

C (i, j) = I (i, j) - պիքսելի ինտենսիվություն (պայծառություն);

C(i, j) = (R(i, j), G(i, j), B(i, j)) - գույնի հատկանիշներ RGB գունային մոդելում:

Մատրիցային ձևով.

Mij = (Aij, Cij):

Շարունակական պատկերներ նմուշառելիս Aij արժեքները կարող են սահմանվել երկու եղանակով, կամ որպես Aij = (i, j) կետերի արժեքներ, որոնց համար սահմանվում են Cij հատկանիշները, կամ որպես քառակուսիների արժեքներ: Aij = (i, i+1) × (j, j+1) կամ որևէ այլ ձև՝ Cij-ի սահմանմամբ այս ձևի միջին արժեքներով (նկ. 17.1.1):

Գործնականում, որպես կանոն, X-ը և Y-ը քառակուսի կամ ուղղանկյուն ռաստերի ոչ բացասական ամբողջ թվերի սահմանափակ բազմություններ են՝ լայնության և ռաստերի բարձրության գծերի հարաբերակցությամբ (հատկանիշի հարաբերակցությամբ), որը գրվում է, օրինակ. «4:3».

Գույնի ներկայացում համակարգչային գրաֆիկայում: Գույնի հասկացությունը հիմնված է մարդու աչքերի կողմից էլեկտրամագնիսական ալիքների ընկալման վրա որոշակի հաճախականության միջակայքում: Օրվա լույսը, որը մենք ընկալում ենք, ունի λ ալիքի երկարություն՝ տատանվում է 400 նմ (մանուշակագույն) մինչև 700 նմ (կարմիր): Լույսի հոսքի նկարագրությունը կարող է լինել նրա սպեկտրային ֆունկցիան I(λ): Լույսը կոչվում է մոնոխրոմատիկ, եթե նրա սպեկտրն ունի միայն մեկ կոնկրետ ալիքի երկարություն։

Ցանցաթաղանթի վրա կան երկու տեսակի ընկալիչներ՝ ձողիկներ և կոններ։ Ձողիկների սպեկտրալ զգայունությունը (նկ. 17.1.2) ուղիղ համեմատական է ընկնող լույսի պայծառությանը: Կոնները բաժանվում են երեք տեսակի, որոնցից յուրաքանչյուրն ունի որոշակի զգայունություն սահմանափակ տիրույթներում կարմիր, կանաչ և կապույտ գույների առավելագույն չափերով և կտրուկ կորցնում է իրենց զգայունությունը մթության մեջ: Աչքի զգայունությունը կապույտի նկատմամբ շատ ավելի ցածր է, քան մյուս երկուսին: Մարդկանց լույսի ընկալման կարևոր հատկությունը գծայինությունն է տարբեր ալիքի երկարություններով գույներ ավելացնելիս:

RGB գույնի մոդել (Կարմիր, Կանաչ, Կապույտ - կարմիր, կանաչ, կապույտ) համակարգչային գրաֆիկայում ներկայումս ամենատարածվածն է: Այս մոդելում սպեկտրային ֆունկցիան ներկայացված է որպես զգայունության կորերի գումար յուրաքանչյուր տեսակի կոնի համար ոչ բացասական քաշային գործակիցներով (նորմալացված 0-ից 1), որոնք նշվում են որպես R, G և B: Մոդելը բնութագրվում է. նոր գույներ ստանալու հավելումների հատկությունը. Օրինակ, սպեկտրային ֆունկցիաների կոդավորումը.

Սև՝ fblack = 0, (R, G, B) = (0,0,0);

Մանուշակագույն fviolet = fred + fblue, (R, G, B) = (1,0,1);

Սպիտակ fwhite = fred + fgreen + fblue, (R, G, B) = (1,1,1):

RGB մոդելի եռաչափ գունային տարածությունը ցույց է տրված նկ. 17.1.3. Ելնելով ընկալիչների կողմից լույսի ընկալման առանձնահատկություններից՝ մարդկանց համար տեսանելի ոչ բոլոր գույներն են ներկայացված այս մոդելում։ Այնուամենայնիվ, վերարտադրվող գույների համամասնությունը շատ ավելի մեծ է, քան այն գույների համամասնությունը, որոնք ներկայացված չեն այս մոդելում:

CIE XYZ գունային համակարգ: Գույնի ներկայացման միջազգային ստանդարտը CIE (CIE - Commission Internationale de l "Eclairage) ընդունվել է 1931 թվականին Լուսավորման միջազգային հանձնաժողովի կողմից: Այն սահմանում է երեք հիմնական ֆունկցիա ρX (λ), ρY (λ), ρZ (λ), կախված ալիքի երկարությունը, որոնց գծային համակցությունները ոչ բացասական գործակիցներով (X, Y և Z) առաջացնում են մարդու համար տեսանելի բոլոր գույները: Այս գործառույթները հաշվի են առնում աչքի ընկալիչների լույսի ինտենսիվության հարաբերական ընկալումը: Եռաչափ տարածության մեջ CIE գունային համակարգը կազմում է կոն առաջին քառորդում և օգտագործվում է գունավոր պատկերների բարձրորակ ցուցադրման համար:

17.2. Բիթքարտեզների երկրաչափական վերափոխումներ

Փոխակերպման ոլորտներն ու փուլերը. Պատկերները կարելի է բաժանել տեքստային և մանրամասն: Հյուսվածքային պատկերներում բոլոր նմուշները (տարրերը) կրում են տեղեկատվություն (պատկեր հեռուստացույցի էկրանին): Մանրամասն պատկերն այն պատկերն է, որում կարելի է տարբերել խանգարող առարկաները, ֆոնը և օգտակար առարկաները:

Համակարգիչների վրա պատկերների մշակման ալգորիթմների երեք հիմնական խումբ կա.

1. Պատկերի առաջնային (նախնական) մշակում վերականգնման, պատահական աղմուկից մաքրելու, որակի բարելավման, օպտիկական համակարգերի երկրաչափական աղավաղումների շտկման նպատակով (դեֆոկուս, շեղումներ և այլն):

2. Պատկերների նկարագրություն, օրինաչափությունների ճանաչում։ Այն իրականացվում է պատկերի մանրամասների պարամետրերը որոշելու համար և ներառում է.

3. Արդյունավետ կոդավորում՝ փոխանցման և պահպանման քանակությունը նվազեցնելու համար:

Նախամշակման մեթոդների մեծ մասը հիմնված է գծային տարածական անփոփոխ (LPI) ֆիլտրերի օգտագործման վրա: Գծային ալգորիթմները կատարվում են օգտագործելով 1D FIR և IIR ֆիլտրերի 2D անալոգներ: Դրանք կարող են օգտագործվել, օրինակ, պատկերների աղմուկի մակարդակը նվազեցնելու համար զտիչներ կիրառելիս:

FIR ֆիլտրերը իրականացվում են կոնվոլյուցիոն մեթոդով: 2D FIR ֆիլտրերի առավելությունը տեսանելիությունն է, պարզությունը և բացարձակ կայունությունը: IIR զտիչներն իրականացվում են տարբեր հավասարումների և z-փոխակերպումների միջոցով: Նրանք ավելի արագ են, քան FIR ֆիլտրերը, բայց կարող են լինել անկայուն: Երկչափ IIR ֆիլտրերի սինթեզը տարբերվում է միաչափերի սինթեզից, քանի որ երկչափ ֆունկցիայի համար հնարավոր չէ հստակ ընտրել բևեռները:

Պատկերները վերականգնելու և դրանց որակը բարելավելու համար կարող են պահանջվել նաև ոչ գծային մեթոդներ: Այսպիսով, օրինակ, աղմուկը զսպելու և պատկերների ուրվագծային մասը միևնույն ժամանակ պահպանելու համար անհրաժեշտ է կիրառել ոչ գծային կամ գծային տարածական ոչ ինվարիանտ (SPNI) զտիչներ, որոնք իրականացվում են դասակարգման ալգորիթմներով։ Բոլոր վարկանիշային ոչ գծային զտիչները հիմնված են տեղական հիստոգրամների հաշվման արագ ալգորիթմների վրա:

Այդպիսի մեթոդներից մեկը միջին ֆիլտրումն է: Միջին ֆիլտրերի օգտագործումը արդյունավետ է որոշակի տեսակի աղմուկի և պարբերական աղմուկը ճնշելու համար՝ առանց ազդանշանի միաժամանակ խեղաթյուրման, օրինակ՝ աղմուկի արտանետումների պայթյունները ճնշելու համար, ներառյալ գծերի արտանետումները: Մեթոդը կարող է օգտագործվել նաև ճանաչման հետ կապված խնդիրների լուծման համար, օրինակ՝ ընդգծելու բարակ գծերը և փոքր մեկուսացված առարկաները։

Պատկերների նկարագրման և պատկերների ճանաչման ալգորիթմները, որպես կանոն, ոչ գծային են և ունեն էվրիստիկ բնույթ։ Օբյեկտների նշանները սովորաբար օբյեկտի պատկերի տարածքն են, պատկերի եզրագծի պարագիծը, տարածքի հարաբերակցությունը պատկերի պարագծի քառակուսին: Օբյեկտի ձևը կարելի է բնութագրել նկարում ներգծված կամ առարկայի պատկերի շուրջը շրջագծված շրջանագծի շառավղով, պատկերի «զանգվածի կենտրոնից» նվազագույն և առավելագույն շառավղով վեկտորի երկարությամբ։

Նմուշառում. Պատկերի փոխակերպումները համակարգչում և մշակված տվյալների պահպանումը կատարվում են դիսկրետ ձևով: Նմուշառումն օգտագործվում է իրական աշխարհի շարունակական անալոգային պատկերներից դիսկրետ ներկայացում ստանալու համար: Գործնականում այն իրականացվում է մուտքային սարքերով (թվային տեսախցիկ, սկաներ կամ այլոց): Վերամշակված պատկերների տեսողական ընկալման համար ելքային սարքերում (ցուցասարք, պլոտեր և այլն), անալոգային պատկերը վերակառուցվում է ըստ իր դիսկրետացված ներկայացման:

Սև և սպիտակ պատկերների ամենապարզ դեպքում մենք ունենք երկչափ զանգված sa(x, y): RGB մոդելի գունավոր պատկերների համար, գույների ավելացման ժամանակ հաշվի առնելով հավելյալության հատկությունը, յուրաքանչյուր R, G և B շերտ կարող է դիտարկվել և մշակվել որպես երկչափ զանգված՝ արդյունքների հետագա ամփոփմամբ:

Միաչափ պարբերական դիսկրետացումը երկչափ գործին ընդհանրացնելու եղանակներից ամենապարզը ուղղանկյուն կոորդինատներով պարբերական դիսկրետացումն է.

s(n, m) = sa(nDx, mDy),

որտեղ Dx-ը և Dy-ը երկչափ շարունակական ազդանշանի sa(x, y) նմուշառման հորիզոնական և ուղղահայաց միջակայքներն են՝ շարունակական x և y կոորդինատներով: Ստորև Dx-ի և Dy-ի արժեքները, ինչպես միաչափ դեպքում, վերցված են հավասար 1-ի:

Երկչափ ազդանշանի դիսկրետացումը հանգեցնում է նաև դրա սպեկտրի պարբերականացմանը և հակառակը: Դիսկրետ ազդանշանի կոորդինատների և հաճախականության ներկայացումների տեղեկատվական համարժեքության պայմանը նույնպես պահպանվում է հիմնական ազդանշանային տիրույթներում հավասար քանակությամբ նմուշառման կետերով: Ուղղանկյուն դիսկրետիզացիայի համար Ֆուրիեի ուղիղ և հակադարձ փոխակերպումները սահմանվում են հետևյալ արտահայտություններով.

S(k, l) =s(n, m) exp(-jn2pk/N-jm2pl/M), (17.2.1)

S(k, l) =exp(-jn2pk/N) s(n, m) exp(-jm2pl/M), (17.2.1")

s(n, m) =S(k, l) exp(-jn2pk/N-jm2pl/M): (17.2.2)

s(n, m) = exp(-jn2pk/N) S(k, l) exp(-jm2pl/M): (17.2.2")

Բրինձ. 17.2.1. Սպեկտրի պարբերականացում.

Այս արտահայտությունները ցույց են տալիս, որ 2D DFT-ն ուղղանկյուն տվյալների նմուշառման ռաստերի վրա կարող է հաշվարկվել 1D սերիական DFT-ների միջոցով: (17.2.1") և (17.2.2") արտահայտությունների երկրորդ գումարները n և k տողերի երկայնքով s(n, m) և S(k, l) ֆունկցիաների հատվածների միաչափ DFT-ներն են, համապատասխանաբար, իսկ առաջինները m և l-ով հատվածներում հաշվարկված ֆունկցիաների միաչափ DFT-ներն են։ Այլ կերպ ասած, s(n, m) և S(k, l) արժեքների սկզբնական մատրիցները նախ վերահաշվարկվում են միջանկյալ մատրիցների մեջ DFT-ով ըստ տողերի (կամ սյունակների), իսկ միջանկյալ մատրիցները վերահաշվարկվում են վերջնական մատրիցների մեջ DFT-ով: ըստ սյունակների (կամ, համապատասխանաբար, ըստ տողերի):

Որպեսզի Fx=1/Dx և Fy=1/Dy հաճախականությամբ անալոգային ազդանշանի նմուշառմամբ առաջացած սպեկտրի պարբերական կրկնությունը (նկ. 17.2.1) չփոխի սպեկտրը հիմնական հաճախականության մեջ։ միջակայքը (բնօրինակ անալոգային ազդանշանի սպեկտրի հետ կապված), անհրաժեշտ է և բավարար է, որ առավելագույն հաճախականության բաղադրիչները fmax անալոգային ազդանշանի սպեկտրում, ինչպես տողերում, այնպես էլ սյունակներում, չգերազանցեն Nyquist հաճախականությունը (fmax. x £ fN = Fx/2, fmax. y £ fM = Fy/2): Սա նշանակում է, որ ազդանշանի նմուշառման հաճախականությունը պետք է լինի առնվազն երկու անգամ ավելի բարձր, քան ազդանշանի սպեկտրի առավելագույն հաճախականության բաղադրիչը.

Fx ³ 2fmax. x, Fy ³ 2fmax. y, (17.2.3)

որն ապահովում է, որ սպեկտրային ֆունկցիաները հասնում են զրոյական արժեքների սպեկտրի հիմնական տիրույթի ծայրերում:

Երկչափ ազդանշանի վերականգնման ինտերպոլացիոն շարք: Եթե շարունակական ազդանշանը sa(x, y) սպեկտրով սահմանափակ ազդանշան է, և նմուշառման ժամանակաշրջանները ընտրված են բավական փոքր, և հարևան ժամանակաշրջանների սպեկտրները չեն համընկնում.

Sa(Wx, Wy) = 0 համար |Wx|p/Dx, |Wy|p/Dx,

այնուհետև, ինչպես միաչափ դեպքում, sa(x, y) ազդանշանը կարող է վերակառուցվել դիսկրետ ազդանշանից՝ օգտագործելով Կոտելնիկով-Շաննոն շարքի երկչափ անալոգը.

sa(x, y) = Sn Sm s(n, m) . (17.2.4)

Պատկերների հաճախականության աղավաղումներ և դրանց վերացում: Անսահմանափակ սպեկտրով ազդանշանը նույնպես կարող է նմուշառվել, բայց այս դեպքում առկա է սպեկտրների համընկնումը հարևան ժամանակաշրջաններում, մինչդեռ բարձր հաճախականությունները, որոնք ավելի բարձր են, քան Nyquist հաճախականությունները, «քողարկվելու են», ինչպես միաչափ դեպքում. հիմնական ժամանակաշրջանի ցածր հաճախականությունները. Ժամանակահատվածի սահմաններից «արտացոլման» էֆեկտն էլ ավելի բարդ պատկեր է տալիս տարբեր կոորդինատներում արտացոլված հաճախականությունների միջամտության շնորհիվ։ Նմանատիպ էֆեկտը, որը հայտնի է որպես aliasing, նույնպես տեղի կունենա, երբ պատկերները թերընտրվում են: Այս էֆեկտը կարելի է հատկապես հստակ նկատել պայծառության կտրուկ հակադրվող փոփոխությունների վրա:

Նման երևույթների դեմ պայքարելու համար օգտագործվում է նախնական զտում (հակաալիազինգ)՝ քաշի ֆիլտրի գործառույթով անալոգային պատկերի նախնական ոլորում, որը կտրում է բարձր հաճախականության բաղադրիչները, որոնք կարող են հանգեցնել ալիզացման: Երկչափ դեպքում ֆիլտրումը նկարագրվում է հետևյալ կերպ.

z(x, y) = h(x", y") ③③ s(x-x", y-y"): (17.2.5)

Հարկ է նշել, որ անալոգային պատկերները գոյություն ունեն միայն օպտիկական տիրույթում, օրինակ՝ էկրանի վրա լուսային ցուցադրման, լուսանկարչական թղթի կամ ֆիլմի տեսքով, սակայն չեն կարող գոյություն ունենալ համակարգչային հիշողության մեջ: Հետևաբար, նախնական զտման ֆիզիկական իրականացումը հնարավոր է միայն այն ժամանակ, երբ գրանցվում է պատկեր՝ այն ապակենտրոնացնելով, որը, որպես կանոն, չի օգտագործվում։ Առաջնային տեղեկատվությունը միշտ պետք է գրանցվի առավելագույն ամբողջականությամբ և ճշգրտությամբ, իսկ առաջնային տեղեկատվության մաքրումն ավելորդ մանրամասներից և ավելորդությունից հետագա տվյալների մշակման խնդիր է: Հետևաբար, 17.2.5 հավասարման հետ կապված, երկչափ նախնական զտումը, իր գործնական իրականացման ընթացքում, կարող է լինել միայն մեծ լուսանցքով նմուշառված պատկերների զտում հիմնական հաճախականության միջակայքում (չափազանց լուծաչափով) և որպես կանոն օգտագործվում է: , երբ նմուշները վերածվում են ավելի մեծ քայլի, օրինակ՝ պատկերները սեղմելիս: Նախաֆիլտրացումը կարող է նաև ներկառուցվել պատկերային ալգորիթմների մեջ:

Նկ. 17.2.3 և ստորև, Աղյուսակ 17.2.1-ում ներկայացված են ամենատարածված միաչափ հակաալիզացման ֆիլտրերի օրինակներ: Դրանք կարող են իրականացվել նաև անալոգային ֆիլտրերի տեսքով և օգտագործվում են, օրինակ, պատկերների հեռուստատեսային գծերը անալոգային տեսքով ռադիոալիքների միջոցով փոխանցելիս (հորիզոնական հակաալիզինգ): Սկզբունքորեն նմանատիպ գործողություն կարելի է կատարել սյունակների վրա (կրկնօրինակ՝ պատկեր), իսկ պատկերն ամփոփելուց հետո կկատարվի ամբողջական հակաալիզինգային գործողություն, սակայն այս մեթոդն ավելի շատ պատկանում է հատուկ գիտական հետազոտությունների ոլորտին։

Աղյուսակ 17.2.1.

Հիմնական քաշի գործառույթները

ժամանակի պատուհան	քաշի ֆունկցիան	Ֆուրիեի փոխակերպում
Բնական (P)	П(t) = 1, \|t\|£t; П(t) = 0, \|t\|>t	П(w) = 2t sinc
Բարթլետ (D)		B(w) = t sinc2 (wt/2):
Հեննինգ, Հաննա	p (t) = 0.5	0.5p(w)+0.25p(w+p/t)+0.25p(w-p/t)
Համինգ	p(t) = 0.54+0.46 cos(pt/t)	0.54P(w)+0.23P(w+p/t)+0.23P(w-p/t)
Carré (2-րդ պատուհան)	p(t) = b(t) sinc(pt/t)	t B(w)*P(w), P(w) = 1 \|w\|-ի համար
Լապլաս-Գաուս	p(t) = exp[-b2(t/t)2/2]	[(t/b) exp(-t2w2/(2b2))] ③ P(w)

F1(x) միաչափ ֆիլտրերի երկչափ անալոգները կառուցված են սիմետրիկության երկու տարբերակներով՝ կամ շառավղից կախված.

f2 (x, y) = f1 (),

կամ որպես ստեղծագործություն:

f2 (x, y) = f1 (x) × f1 (y):

Առաջին տարբերակն ավելի ճիշտ է, բայց երկրորդն ունի բաժանելիության հատկություն, այսինքն՝ երկչափ ոլորումը կարող է կատարվել երկու միաչափ ոլորումների միջոցով հաջորդաբար՝ f1(x)-ով և f1(y-ով սյունակներում):

Պատկերի նմուշառում կամ resampling-ը թվային ազդանշանի նմուշառման արագության փոփոխությունն է: Թվային պատկերների համար դա նշանակում է պատկերի չափափոխում:

Կան տարբեր պատկերների նմուշառման ալգորիթմներ: Օրինակ, երկգծային ինտերպոլացիայի մեթոդով պատկերը 2 անգամ մեծացնելու համար միջանկյալ սյունակներն ու տողերը ստացվում են հարևան սյունակների և տողերի արժեքների գծային ինտերպոլացիայի միջոցով: Նոր պատկերի յուրաքանչյուր կետը հնարավոր է ստանալ որպես սկզբնական պատկերի ավելի մեծ թվով կետերի կշռված գումար (երկխորանարդ և այլ տեսակի ինտերպոլացիա): Ամենաբարձր որակի վերանմուշառումը ստացվում է ալգորիթմների կիրառման ժամանակ, որոնք հաշվի են առնում ոչ միայն ազդանշանի ժամանակը, այլև հաճախականության տիրույթը:

Դիտարկենք կրկնօրինակման ալգորիթմ՝ պատկերի հաճախականության տեղեկատվության առավելագույն պահպանմամբ: Մենք կդիտարկենք ալգորիթմի գործողությունը միաչափ ազդանշանների վրա, քանի որ երկչափ պատկերը կարող է սկզբում ձգվել կամ սեղմվել հորիզոնական (տողերով), այնուհետև ուղղահայաց (սյունակներում), և երկչափ պատկերի նմուշառումը կարող է իրականացվել. կրճատվել է միաչափ ազդանշանների նմուշառման:

Ենթադրենք, ունենք միաչափ ազդանշան (նկ. 17.2.4), տրված 0-T միջակայքում և դիսկրետացված Dt=1 քայլով (N ընդմիջումներով): Անհրաժեշտ է ազդանշանը «ձգել» մ անգամ։ Նկարում ցուցադրված ազդանշանի սպեկտրը հաշվարկվում է արագ Ֆուրիեի փոխակերպմամբ (FFT, սպեկտրի նմուշների թիվը հավասար է ազդանշանի նմուշների թվին) և տրվում է հիմնական FFT միջակայքում (0-2p, Nyquist հաճախականությունը wN = p/Dt = p, կամ 0,5N՝ ըստ սպեկտրի նմուշների համարակալման՝ Df = 1/T կամ Dw = 2p/T սպեկտրի երկայնքով քայլով: Ձգումը պահանջում է 2 քայլ.

Առաջին քայլը զրոյական ինտերպոլացիա է, որը մեծացնում է ազդանշանի երկարությունը m անգամ: (նկ. 17.2.5): Անհրաժեշտ է բնօրինակ ազդանշանի բոլոր նմուշները բազմապատկել մ-ով, այնուհետև յուրաքանչյուր ազդանշանի նմուշից հետո տեղադրել m-1 զրոյական արժեք: 0-T միջակայքում, որի արժեքը մնում է անփոփոխ, այժմ կան m անգամ ավելի շատ նմուշառման միջակայքեր (mN), իսկ նոր նմուշառման միջակայքը հավասար կլինի Dx=Dt/m-ի: Համապատասխանաբար, այս ազդանշանի համար Nyquist-ի նոր հաճախականությունը mp/Dt=mp է: Բայց սպեկտրի քայլի ֆիզիկական արժեքը հաճախականության միավորներով հակառակն է ազդանշանի սահմանման միջակայքի ֆիզիկական արժեքին (Df=1/T), և, հետևաբար, FFT-ն mN ազդանշանային կետերի վրա կհաշվի սպեկտրի mN կետերը: հիմնական FFT միջակայքը 0-2pm-ը սկզբնական ազդանշանի սպեկտրային քայլով, որում ներկա կլինեն սկզբնական ազդանշանի սպեկտրի m-ժամկետները (մեկ հիմնական և m-1 կողմ):

Երկրորդ քայլը սպեկտրի կողային շերտերի զտումն է ցածր անցումային ֆիլտրի միջոցով՝ ժամանակի կամ սպեկտրային տիրույթում: Նկ. 17.2.6, սպեկտրը մաքրվեց և կատարվեց հակադարձ Ֆուրիեի փոխակերպումը, որի արդյունքում ստացվեց սկզբնական ազդանշանից մ անգամ ավելի երկար ազդանշան՝ ամբողջ հաճախականության տեղեկատվության ամբողջական պահպանմամբ:

Նմանատիպ սկզբունքի համաձայն՝ ազդանշանը n անգամով սեղմելու (քայքայելու) ալգորիթմ կարող է ստեղծվել, մինչդեռ քայլերի հերթականությունը հակադարձվում է։ Ազդանշանը սեղմելիս ազդանշանի նմուշառման քայլը մեծանում է, և, համապատասխանաբար, նվազում է Nyquist հաճախականությունը, մինչդեռ անջատված բարձր հաճախականությունները (աղմուկ և ազդանշանի սպեկտրի աննշան բարձր հաճախականության մասեր) կարտացոլվեն հիմնական տիրույթի սահմանից։ եւ ավելացրել է հիմնական տեղեկատվությանը՝ ստեղծելով աղավաղումներ։ Այս երևույթը վերացնելու համար ազդանշանը նախ զտվում է ցածր անցումային հաճախականությամբ, որը հավասար է Nyquist-ի նոր հաճախականությանը (հակաալիազինգ), և միայն դրանից հետո ազդանշանը նոսրանում է:

Երբ վերանմուշառումն իրականացվում է միայն ժամանակի տիրույթում, ձգման և սեղմման ալգորիթմները սովորաբար համակցվում են մեկ հաջորդական գործընթացում՝ սահմանելով նմուշառման քայլի փոփոխությունը m/n հարաբերակցության տեսքով, ինչը թույլ է տալիս սահմանել m-ի ամբողջ արժեքները: և n նմուշառման քայլի փոփոխության կոտորակային արժեքների համար: Սա մեծապես պարզեցնում է ալգորիթմները և բարելավում դրանց աշխատանքի արդյունավետությունն ու որակը: Օրինակ, երբ ազդանշանը ձգվում է 1,5 անգամ m/n = 3/2-ով, ազդանշանը նախ ձգվում է 3 անգամ (բոլոր նմուշներին զրոների պարզ և միատեսակ ավելացում, այնուհետև կատարվում է ցածր անցումային զտում, որից հետո. ազդանշանը քայքայվում է երկու գործակցով: Հակասերմանային ֆիլտր չի պահանջվում, քանի որ դրա անջատման հաճախականությունը համընկնում է առաջին ցածրանցումային ֆիլտրի հաճախականության հետ: Հակադարձ սեղմման գործողության դեպքում (օրինակ, m/n = 2/3): ), նմանապես, օգտագործվում է միայն հակաալիզինգային ֆիլտրը:

17.3. պատկերի զտում

Պատկերի զտումը հասկացվում է որպես գործողություն, որի արդյունքում ստացվում է նույն չափի պատկեր, որը ստացվում է օրիգինալից որոշ կանոնների համաձայն: Որպես կանոն, ստացված պատկերի յուրաքանչյուր պիքսելի ինտենսիվությունը (գույնը) որոշվում է սկզբնական պատկերի որոշ հարևանությամբ գտնվող պիքսելների ինտենսիվությամբ (գույներով):

Զտման կանոնները կարող են շատ բազմազան լինել: Պատկերի զտումը համակարգչային տեսողության, օրինաչափությունների ճանաչման և պատկերների մշակման ամենահիմնական գործողություններից մեկն է: Պատկերների մշակման մեթոդների ճնշող մեծամասնությունը սկսվում է բնօրինակ պատկերների այս կամ այն զտմամբ:

Գծային զտիչներ ունեն շատ պարզ մաթեմատիկական նկարագրություն: Մենք կենթադրենք, որ սկզբնական կիսատոնային պատկերը A տրված է, և նրա պիքսելների ինտենսիվությունը կնշենք A(x, y)-ով: Գծային ֆիլտրը սահմանվում է իրական արժեք ունեցող h ֆունկցիայով (ֆիլտրի միջուկ), որը սահմանված է ռաստերի վրա: Զտումն ինքնին իրականացվում է դիսկրետ կոնվոլյուցիայի (կշռված գումարման) գործողության միջոցով.

B(x, y) = h(i, j) ③③A(x, y) = h(i, j) A(x-i, y-j): (17.3.1)

Արդյունքը B պատկերն է: Սովորաբար ֆիլտրի միջուկը զրոյական չէ միայն կետի N որոշ հարևանությամբ (0, 0): Այս թաղամասից դուրս h(i, j)-ը հավասար է զրոյի կամ շատ մոտ է դրան և կարող է անտեսվել: Գումարը կատարվում է (i, j) н N-ի վրա, և յուրաքանչյուր պիքսելի B(x, y) արժեքը որոշվում է A պատկերի պիքսելներով, որոնք գտնվում են N պատուհանում, որը կենտրոնացած է (x, y) կետում: նշվում է N(x, y) բազմությունը): N ուղղանկյուն հարևանությամբ սահմանված ֆիլտրի միջուկը կարելի է դիտարկել որպես m-ի n մատրիցա, որտեղ կողմերի երկարությունները կենտ թվեր են: Միջուկը որպես մատրիցա նշելիս այն պետք է կենտրոնացված լինի: Եթե պիքսելը (x, y) գտնվում է պատկերի եզրերի մոտակայքում, ապա որոշակի (i, j) համար A(x-i, y-j) կոորդինատները կարող են համապատասխանել պատկերից դուրս գոյություն չունեցող A պիքսելներին: Այս խնդիրը կարող է լուծվել մի քանի եղանակով.

Մի զտեք նման պիքսելների համար՝ կտրելով B պատկերը եզրերում կամ կիրառելով A պատկերի սկզբնական արժեքները դրանց արժեքների համար:

Մի ներառեք բաց թողնված պիքսելը գումարման մեջ՝ հավասարաչափ բաշխելով նրա քաշը h(i, j) N(x, y) հարևանությամբ գտնվող այլ պիքսելների միջև:

Վերասահմանեք պիքսելային արժեքները պատկերի սահմաններից դուրս՝ օգտագործելով էքստրապոլացիա:

Վերասահմանեք պիքսելների արժեքները պատկերի սահմաններից դուրս՝ օգտագործելով պատկերի հայելային շարունակությունը:

Մեթոդի ընտրությունը կատարվում է հաշվի առնելով հատուկ ֆիլտրի և պատկերի առանձնահատկությունները։

Հարթեցնող զտիչներ. r շառավղով ամենապարզ ուղղանկյուն հարթեցնող ֆիլտրը տրվում է (2r+1) × (2r+1) մատրիցով, որի բոլոր արժեքներն են 1/(2r+1)2, իսկ արժեքների գումարը՝ մեկ. Սա ցածր անցումային 1D U-աձև շարժվող միջին ֆիլտրի 2D անալոգն է: Նման միջուկով զտելիս պիքսելային արժեքը փոխարինվում է 2r+1 քառակուսու միջին արժեքով: 3×3 ֆիլտրի դիմակ օրինակ.

Ֆիլտրերի կիրառություններից մեկը աղմուկի նվազեցումն է: Աղմուկը տարբեր պիքսելներից անկախ տատանվում է, և պայմանով, որ աղմուկի արժեքի մաթեմատիկական ակնկալիքը զրոյական է, հարևան պիքսելների աղմուկը կզրկվի միմյանցից, երբ գումարվի: Որքան մեծ է ֆիլտրման պատուհանը, այնքան ցածր է աղմուկի միջին ինտենսիվությունը, այնուամենայնիվ, տեղի կունենա նաև պատկերի զգալի մանրամասների համապատասխան լղոզում: Սև ֆոնի վրա սպիտակ կետի պատկերը զտման ժամանակ (արձագանք մեկ զարկերակին) կլինի միատեսակ մոխրագույն քառակուսի:

Ուղղանկյուն ֆիլտրի միջոցով աղմուկի նվազեցումը զգալի թերություն ունի. ֆիլտրի դիմակի բոլոր պիքսելները մշակվածից ցանկացած հեռավորության վրա ունեն նույն ազդեցությունը արդյունքի վրա: Մի փոքր ավելի լավ արդյունք է ձեռք բերվում ֆիլտրը փոփոխելով կենտրոնական կետի քաշի ավելացմամբ.

Աղմուկի ավելի արդյունավետ նվազեցում կարելի է ձեռք բերել, եթե պիքսելների ազդեցությունը արդյունքի վրա նվազում է մշակվածից հեռավորության մեծացման հետ: Այս հատկությունն ունի գաուսյան ֆիլտր միջուկով. h(i, j) = (1/2ps2) exp(-(i2+j2)/2s2): Գաուսի ֆիլտրն ունի անսահման չափի ոչ զրոյական միջուկ: Այնուամենայնիվ, ֆիլտրի միջուկի արժեքը շատ արագ նվազում է մինչև n), և, հետևաբար, գործնականում կարելի է սահմանափակել իրեն մի փոքր պատուհանով (0, 0) շուրջը, օրինակ՝ վերցնելով պատուհանի շառավիղը հավասար 3σ:

Գաուսի ֆիլտրումը նույնպես հարթեցնում է: Սակայն, ի տարբերություն ուղղանկյուն ֆիլտրի, Գաուսի զտիչով կետի պատկերը կլինի սիմետրիկ լղոզված կետ՝ միջինից մինչև եզրեր պայծառության նվազմամբ։ Պատկերի լղոզման աստիճանը որոշվում է σ պարամետրով:

Կոնտրաստային զտիչներ . Եթե հարթեցնող ֆիլտրերը նվազեցնում են պատկերի տեղական հակադրությունը՝ պղտորելով այն, ապա հակադրությունը ուժեղացնող ֆիլտրերը հակառակ էֆեկտ են տալիս և, ըստ էության, բարձր տարածական հաճախականությունների զտիչներ են: Boost ֆիլտրի միջուկը (0, 0)-ում ունի 1-ից մեծ արժեք, որի արժեքների ընդհանուր գումարը հավասար է 1-ի: Օրինակ, խթանող զտիչները զտիչներ են միջուկով, որը տրված է մատրիցներով.

. .

Ֆիլտրի կիրառման օրինակը ներկայացված է նկ. 17.3.1. Կոնտրաստի ավելացման էֆեկտը ձեռք է բերվում այն բանի շնորհիվ, որ ֆիլտրը ընդգծում է հարևան պիքսելների ինտենսիվության տարբերությունը՝ հեռացնելով այդ ինտենսիվությունները միմյանցից: Այս ազդեցությունը կլինի ավելի ուժեղ, այնքան մեծ կլինի միջուկի կենտրոնական տերմինի արժեքը: Գծային կոնտրաստի ուժեղացման զտման բնորոշ արտեֆակտը նկատելի լույսն է և ավելի քիչ նկատելի մուգ լուսապսակները եզրերի շուրջ:

Տարբերության զտիչներ գծային զտիչներ են, որոնք սահմանվում են դիֆերենցիալ օպերատորների դիսկրետ մոտարկումներով (վերջավոր տարբերությունների մեթոդով)։ Այս զտիչները կարևոր դեր են խաղում բազմաթիվ հավելվածներում, օրինակ՝ պատկերի եզրեր որոնելու համար:

Ամենապարզ դիֆերենցիալ օպերատորը x-ածանցյալ d/dx-ն է, որը սահմանված է շարունակական ֆունկցիաների համար։ Դիսկրետ պատկերների համար նմանատիպ օպերատորների ընդհանուր տարբերակներն են Prewitt և Sobel ֆիլտրերը.

. .

Զտիչներ, որոնք մոտեցնում են ածանցյալ օպերատորին y-կոորդինատի d/dy-ի նկատմամբ, ստացվում են մատրիցների փոխադրման միջոցով:

Երեք հարակից կետերի վրա գրադիենտի նորմը հաշվարկելու ամենապարզ ալգորիթմը.

G(x, y) = .

Օգտագործվում է նաև պարզեցված հաշվարկային բանաձև.

Գրադիենտի նորման հաշվարկը չորս հարակից կետերի վրա (Ռոբերտսի օպերատոր).

Sobel ալգորիթմը կենտրոնական կետի մոտակայքում օգտագործում է պայծառության ութ նմուշ.

G(x, y) = , G(x, y) @ ,

Gxx, y = -,

Gyx, y = - .

Գրադիենտի նորմայի ավելի ճշգրիտ սահմանման հետ մեկտեղ, Sobel ալգորիթմը թույլ է տալիս նաև որոշել գրադիենտ վեկտորի ուղղությունը պատկերի վերլուծության հարթությունում գրադիենտ վեկտորի և մատրիցային տողերի ուղղության միջև j անկյան տեսքով.

j(x, y) = argtg(Gyx, y /Gxx, y):

Ի տարբերություն հարթեցնող և հակադրություն ուժեղացնող ֆիլտրերի, որոնք չեն փոխում պատկերի միջին ինտենսիվությունը, տարբեր օպերատորների կիրառման արդյունքում, որպես կանոն, ստացվում է զրոյին մոտ միջին պիքսելային արժեք ունեցող պատկեր։ Բնօրինակ պատկերի ուղղահայաց կաթիլները (սահմանները) համապատասխանում են ստացված պատկերում մեծ մոդուլային արժեքներով պիքսելներին: Հետևաբար, տարբերությունների զտիչները կոչվում են նաև օբյեկտների սահմանների հայտնաբերման զտիչներ:

Վերոնշյալ ֆիլտրերի նման, վերջավոր տարբերության մեթոդը կարող է օգտագործվել այլ դիֆերենցիալ օպերատորների համար զտիչներ կազմելու համար: Մասնավորապես, Լապլասի դիֆերենցիալ օպերատորը (լապլայան) D= 𝝏2/𝝏x2 + 𝝏2/𝝏y2, որը կարևոր է բազմաթիվ կիրառությունների համար, կարող է մոտավորվել դիսկրետ պատկերների համար մատրիցով զտիչով (տարբերակներից մեկը).

Ինչպես երևում է նկ. 17.3.2, դիսկրետ լապլասի կիրառման արդյունքում բացարձակ արժեքի մեծ արժեքները համապատասխանում են ինչպես ուղղահայաց, այնպես էլ հորիզոնական պայծառության տարբերություններին: Այսպիսով, ֆիլտրը ֆիլտր է, որը գտնում է ցանկացած կողմնորոշման սահմանները: Պատկերում եզրեր գտնելը կարելի է անել՝ կիրառելով այս ֆիլտրը և վերցնելով բոլոր պիքսելները, որոնց բացարձակ արժեքը գերազանցում է որոշակի շեմը:

Այնուամենայնիվ, այս ալգորիթմը զգալի թերություններ ունի. Հիմնականը շեմային արժեքի ընտրության անորոշությունն է։ Պատկերի տարբեր մասերի համար ընդունելի արդյունք սովորաբար ստացվում է զգալիորեն տարբեր շեմերի դեպքում։ Բացի այդ, դիֆերենցիալ ֆիլտրերը շատ զգայուն են պատկերի աղմուկի նկատմամբ:

Երկչափ ցիկլային կոնվուլյացիա. Ինչպես 1D ազդանշանների դեպքում, 2D կոնվուլյացիան կարող է իրականացվել տարածական հաճախականության տիրույթում՝ օգտագործելով FFT ալգորիթմները և բազմապատկելով 2D պատկերի սպեկտրները և ֆիլտրի միջուկը: Այն նաև ցիկլային է և սովորաբար կատարվում է լոգարիթմական տարբերակով։ Հաշվի առնելով ցիկլայնությունը՝ միջուկի սպեկտրի հաստատուն օրինաչափությունը հաշվարկելու համար միջուկի ֆիլտրի դիմակի չափերը կրկնապատկվում են առանցքների երկայնքով և լրացվում են զրոներով, և նույն դիմակի չափերն օգտագործվում են պատկերի վրայով սահող պատուհանը ընդգծելու համար, որի ներսում FFT-ն իրականացվում է. FIR ֆիլտրի ներդրումը FFT-ով հատկապես արդյունավետ է, եթե ֆիլտրն ունի մեծ հղման տարածք:

Ոչ գծային զտիչներ . Թվային պատկերների մշակման ժամանակ ոչ գծային ալգորիթմները, որոնք հիմնված են վարկանիշային վիճակագրության վրա, լայնորեն օգտագործվում են տարբեր աղմուկի մոդելներից վնասված պատկերները վերականգնելու համար: Դրանք թույլ են տալիս խուսափել պատկերի հավելյալ աղավաղումից աղմուկը հեռացնելիս, ինչպես նաև զգալիորեն բարելավել ֆիլտրերի արդյունքները բարձր աղմուկով պատկերների վրա:

Ներկայացնենք պատկերի A(x, y) տարրի M հարևանության հայեցակարգը, որը կենտրոնական է այս հարևանության համար: Ամենապարզ դեպքում M-հարևանությունը պարունակում է N-պիքսելներ՝ կետեր, որոնք ընկնում են ֆիլտրի դիմակի մեջ՝ ներառյալ (կամ չներառելով) կենտրոնականը: Այս N-տարրերի արժեքները կարող են տեղադրվել V(r) փոփոխական շարքի մեջ, դասակարգվել աճման (կամ նվազման) կարգով, և այս շարքի որոշակի պահերը կարող են հաշվարկվել, օրինակ, պայծառության միջին արժեքը mN: իսկ դիսպերսիան dN. Կենտրոնական նմուշը փոխարինող ֆիլտրի ելքային արժեքի հաշվարկը կատարվում է բանաձևով.

B(x, y) = aА(x, y) + (1-a)mN. (17.3.2)

a = գործակիցի արժեքը կապված է որոշակի կախվածության հետ ֆիլտրի պատուհանի նմուշների վիճակագրության հետ, օրինակ.

a = dN /(dN + k dS), (17.3.3)

որտեղ dS-ը պատկերի ամբողջության կամ S հարևանության վրա աղմուկի շեղումն է S > M-ի և MnS-ի համար, k-ն S-ի հարևանության շեղման վստահության հաստատունն է: Այս բանաձևից հետևում է, որ k=1 և dN »dS-ի համար տեղի է ունենում a » 0.5, իսկ B(x, y) = (A(x, y) + mN)/2 արժեքը, այսինքն. կենտրոնական նմուշի արժեքների և նրա M հարևանության պիքսելների միջին արժեքի վրա: dN-ի արժեքների աճով մեծանում է կենտրոնական հղման արժեքի ներդրումը արդյունքին, իսկ նվազմամբ՝ mN-ի արժեքը: M հարևանության վրա միջին արժեքների ներդրման կշիռը կարող է փոխվել k գործակցի արժեքով:

Վիճակագրական ֆունկցիայի ընտրությունը և նրանից a գործակցի կախվածության բնույթը կարող են բավականին բազմազան լինել (օրինակ՝ ըստ M-հարևանության ընթերցումների տարբերությունների՝ կենտրոնական ընթերցմամբ), և կախված է երկուսն էլ. ֆիլտրի բացվածքի չափը և պատկերների և աղմուկի բնույթը: Ըստ էության, a գործակցի արժեքը պետք է նշի կենտրոնական նմուշի վնասման աստիճանը և, համապատասխանաբար, փոխառության գործառույթը M-հարևանից նմուշների ուղղման համար:

Պատկերի մշակման համար ոչ գծային ֆիլտրերի ամենապարզ և ամենատարածված տեսակներն են շեմային և միջին ֆիլտրերը:

Շեմի զտում տրված է, օրինակ, հետևյալ կերպ.

B(x, y) =

Արժեք էջֆիլտրի շեմն է: Եթե ֆիլտրի կենտրոնական կետի արժեքը շեմային արժեքով գերազանցում է նմուշների mN նմուշների միջին արժեքը M-ի հարևանությամբ, ապա այն փոխարինվում է միջին արժեքով: Շեմային արժեքը կարող է լինել կամ հաստատուն կամ ֆունկցիոնալորեն կախված կենտրոնական կետի արժեքից:

Միջին ֆիլտրում սահմանվում է հետևյալ կերպ.

B(x, y) = med (M(x, y)),

այսինքն, զտման արդյունքը հարևանության պիքսելների միջին արժեքն է, որի ձևը որոշվում է ֆիլտրի դիմակով: Միջին ֆիլտրումը կարող է արդյունավետ կերպով հեռացնել աղմուկը պատկերից, որն ինքնուրույն ազդում է առանձին պիքսելների վրա: Օրինակ՝ նման միջամտություններն են թվային նկարահանման ժամանակ «կոտրված» պիքսելները, «ձյան» աղմուկը, երբ որոշ պիքսելներ փոխարինվում են առավելագույն ինտենսիվությամբ պիքսելներով և այլն։ Միջին ֆիլտրման առավելությունն այն է, որ մուգ ֆոնի վրա «տաք» պիքսելը կլինի։ փոխարինված մուգ, և ոչ թե «քսած» շրջակայքում:

Միջին ֆիլտրումն ունի ընդգծված ընտրողականություն զանգվածի տարրերի նկատմամբ, որոնք ֆիլտրի բացվածքի մեջ թվերի հաջորդականության ոչ միապաղաղ բաղադրիչն են: Միևնույն ժամանակ, միջին ֆիլտրը թողնում է հաջորդականության միապաղաղ բաղադրիչը անփոփոխ: Այս հատկության շնորհիվ միջին ֆիլտրերը՝ օպտիմալ ընտրված բացվածքով, պահպանում են սուր առարկաների եզրերը՝ առանց աղավաղումների՝ զսպելով չկապակցված կամ թույլ փոխկապակցված աղմուկը և փոքր չափի մանրամասները:

Ծայրահեղ զտիչներ սահմանված կանոններով.

Bmin(x, y) = min(M(x, y)),

Bmax(x, y) = max (M(x, y)),

այսինքն՝ զտման արդյունքը ֆիլտրի դիմակի նվազագույն և առավելագույն պիքսելային արժեքներն են: Նման զտիչներ կիրառվում են, որպես կանոն, երկուական պատկերների համար։

17.4. ՊԱՏԿԵՐԻ ՍԵՂՄՈՒՄ

Գունավոր փոխանցման համար մոտ 3000×2000 լուծաչափով տիպիկ պատկերը 24 բիթ մեկ պիքսելում ունի 17 մեգաբայթ չափ: Պրոֆեսիոնալ սարքերի համար ստացված պատկերի ռաստերի չափը կարող է շատ ավելի մեծ լինել, գույնի խորությունը մինչև 48 բիթ մեկ պիքսելում, իսկ մեկ պատկերի չափը կարող է լինել ավելի քան 200 մեգաբայթ: Հետևաբար, պատկերի սեղմման ալգորիթմները շատ կարևոր են պատկերը ներկայացնող տվյալների քանակը նվազեցնելու համար:

Ալգորիթմների երկու հիմնական դաս կա.

1. Անկորուստ սեղմում A (անկորուստ սեղմում), եթե կա այնպիսի հակադարձ ալգորիթմ A-1, որ ցանկացած h - պատկերի համար A[h] = h1 ունենանք A-1 = h: Անկորուստ սեղմումն օգտագործվում է այնպիսի գրաֆիկական պատկերների ձևաչափերում, ինչպիսիք են՝ GIF, PCX, PNG, TGA, TIFF և օգտագործվում է հատկապես արժեքավոր առաջնային տեղեկատվության մշակման ժամանակ (բժշկական պատկերներ, օդային և տիեզերական պատկերներ և այլն), երբ նույնիսկ ամենափոքր աղավաղումն անցանկալի է:

2. Կորուստ սեղմում, եթե այն չի ապահովում սկզբնական պատկերը ճշգրիտ վերականգնելու հնարավորություն։ A-ի հետ զուգակցված պատկերի վերականգնման մոտավոր ալգորիթմը կնշանակվի որպես A*: Զույգը (A, A*) ընտրված է սեղմման բարձր գործակիցներ ապահովելու համար՝ պահպանելով տեսողական որակը: Կորուստ սեղմումը կիրառվում է գրաֆիկական ձևաչափերով՝ JPEG, JPEG2000 և այլն։

Բոլոր ալգորիթմներն ու հայտարարությունները վերաբերում են ինչպես պատկերներին, այնպես էլ կամայական հաջորդականություններին, որոնց տարրերը կարող են ընդունել սահմանափակ թվով արժեքներ: Միաժամանակ պետք է հաշվի առնել, որ չկան իդեալական ալգորիթմներ, որոնք կարող են առանց կորստի սեղմել տվյալների ցանկացած հավաքածու։

Կրկնել երկարության կոդավորման (RLE) ալգորիթմները հիմնված են պարզ սկզբունքի վրա՝ սկզբնական հաջորդականության տարրերի կրկնվող խմբերի փոխարինում զույգով (քանակ, տարր) կամ միայն քանակով։

բիթ մակարդակ: Մենք կդիտարկենք սկզբնական տվյալները բիթերի հաջորդականության մակարդակով, օրինակ՝ ներկայացնելով սև և սպիտակ պատկեր: Սովորաբար անընդմեջ լինում են մի քանի 0 կամ 1, և հաջորդական միանման թվանշանների թիվը կարող է կոդավորվել: Բայց կրկնությունների քանակը նույնպես պետք է կոդավորված լինի բիթերով: Կարելի է համարել, որ կրկնությունների յուրաքանչյուր թիվը փոխվում է 0-ից 7-ի (3-բիթանոց կոդ)՝ փոխարինելով մեկերի և զրոների կոդերի հաջորդականությունը։ Օրինակ, հաջորդականությունները կարելի է համեմատել 7 0 4 թվերի հետ, այսինքն՝ 7 մեկ, 0 զրո, 4 միավոր, մինչդեռ մենք ունենք նոր տարի. Այսպիսով, 21 միավորների, 21 զրոների, 3 մեկների և 7 զրոների հաջորդականությունը կոդավորված է հետևյալ կերպ.

Բայթ մակարդակ: Ենթադրենք, որ մուտքագրումը գորշ գույնի պատկեր է, որտեղ 1 բայթ հատկացվում է պիքսելների ինտենսիվության արժեքին, մինչդեռ նույնական բիթերի երկար շղթայի ակնկալիքը զգալիորեն կրճատվում է:

Մուտքային հոսքը կբաժանենք բայթերի (կոդը 0-ից մինչև 255) և կրկնվող բայթերը կկոդավորենք որպես զույգ (թիվ, տառ): Մեկ բայթ չի կարող փոփոխվել: Այսպիսով, AABBBCDAA բայթերը կոդավորում են (2A) (3B) (C) (D) (2A):

Այնուամենայնիվ, այս ալգորիթմի փոփոխությունները հազվադեպ են օգտագործվում ինքնուրույն (օրինակ, PCX ձևաչափով), քանի որ հաջորդականությունների ենթադասը, որոնց վրա ալգորիթմն արդյունավետ է, համեմատաբար նեղ է: Ավելի հաճախ դրանք օգտագործվում են որպես սեղմման խողովակաշարի փուլերից մեկը։

Բառարանի ալգորիթմներ մուտքային հաջորդականության միայն մեկ տարրը կոդավորելու փոխարեն կատարվում է տարրերի շղթայի կոդավորում։ Սա օգտագործում է տողերի բառարան (ստեղծվել է մուտքագրման հաջորդականությունից)՝ նորերը կոդավորելու համար:

LZ77 ալգորիթմն առաջիններից էր, որ օգտագործեց բառարան։ Որպես բառարան օգտագործվում են հաջորդականության N վերջին՝ արդեն կոդավորված տարրերը։ Սեղմման ժամանակ բառարան-ենթահաջորդականությունը «սահում է» մուտքային հաջորդականության վրայով։ Ելքի վրա տարրերի շղթան կոդավորված է հետևյալ կերպ՝ բառարանում մշակված տարրերի շղթայի համապատասխան մասի դիրքը՝ օֆսեթ (ընթացիկ դիրքի համեմատ), երկարությունը, շղթայի համապատասխան մասին հաջորդող առաջին տարրը։ Համապատասխան շղթայի երկարությունը վերևից սահմանափակվում է n թվով: Համապատասխանաբար, խնդիրն է գտնել բառարանից ամենամեծ տողը, որը համապատասխանում է մշակված հաջորդականությանը: Եթե համընկնումներ չկան, ապա գրվում են օֆսեթ զրո, երկարությունը մեկ և չկոդավորված հաջորդականության առաջին տարրը:

Վերևում նկարագրված կոդավորման սխեման հանգեցնում է լոգարիթմական պատուհանի գաղափարին, որը բաղկացած է երկու մասից.

N-բառարան երկարությամբ արդեն կոդավորված տարրերի հաջորդականություն - որոնման բուֆեր;

Տարրերի շղթայից n երկարության հաջորդականությունը, որի համար փորձ է արվելու գտնել համընկնումը, նայող բուֆերն է:

Սեղմված հաջորդականության ապակոդավորումը ձայնագրված կոդերի վերծանումն է. յուրաքանչյուր մուտքը համընկնում է բառարանից տողի և հստակ գրված տարրի հետ, որից հետո բառարանը տեղափոխվում է: Բառարանը վերստեղծվում է վերծանման ալգորիթմի գործարկման ընթացքում:

Այս ալգորիթմը ալգորիթմների մի ամբողջ ընտանիքի նախահայրն է։ Դրա առավելությունները ներառում են բավականաչափ մեծ հաջորդականությունների վրա սեղմման պատշաճ աստիճան և արագ դեկոպրեսիա: Թերությունները ներառում են սեղմման դանդաղ արագությունը և սեղմման ավելի ցածր հարաբերակցությունը, քան այլընտրանքային ալգորիթմները:

LZW ալգորիթմ. Այս ալգորիթմի բառարանը աղյուսակ է, որն ալգորիթմի գործարկման ընթացքում լցված է տարրերի շղթաներով: Սեղմման գործընթացը փնտրում է բառարանում արդեն գրված ամենաերկար տողը: Ամեն անգամ, երբ բառարանում չի գտնվում տարրերի նոր տող, այն ավելացվում է բառարանում, և տողի ծածկագիրը ձայնագրվում է: Տեսականորեն սեղանի չափի սահմանափակում չկա, բայց չափի սահմանը բարելավում է սեղմման հարաբերակցությունը, քանի որ ավելորդ (չառաջացող) շղթաներ են կուտակվում։ Որքան շատ գրառումներ ունենա աղյուսակը, այնքան ավելի շատ տեղեկատվություն պետք է հատկացվի խանութի կոդերին:

Ապակոդավորումը բաղկացած է կոդերի ուղղակի վերծանումից, այսինքն՝ բառարանի կառուցումից և համապատասխան շղթաների ելքից։ Բառարանը սկզբնավորվում է այնպես, ինչպես կոդավորիչում: Ալգորիթմի առավելությունները ներառում են սեղմման բարձր աստիճան և բավականին բարձր արագություն, ինչպես սեղմում, այնպես էլ վերծանում:

Էնտրոպիայի կոդավորման ալգորիթմներ Հերթականության յուրաքանչյուր տարրին նշանակեք կոդ, որպեսզի դրա երկարությունը համապատասխանի տարրի առաջացման հավանականությանը: Սեղմումը տեղի է ունենում սկզբնական հաջորդականության տարրերը, որոնք ունեն նույն երկարությունը (յուրաքանչյուր տարր զբաղեցնում է նույն քանակությամբ բիթ) տարբեր երկարությունների տարրերով, որոնք համաչափ են հավանականության բացասական լոգարիթմին, այսինքն՝ տարրերը, որոնք ավելի հաճախ են հանդիպում, քան մյուսները, ունեն ծածկագիր։ ավելի փոքր երկարությամբ:

Հաֆմանի ալգորիթմը օգտագործում է փոփոխական երկարության նախածանցի կոդ, որն ունի հատուկ հատկություն. ավելի կարճ կոդերը չեն համընկնում ավելի երկարների նախածանցին (սկզբնական մասին): Նման ծածկագիրը թույլ է տալիս մեկ առ մեկ կոդավորում: Սեղմման գործընթացը բաղկացած է մուտքագրման հաջորդականության յուրաքանչյուր տարրը իր ծածկագրով փոխարինելուց: Կոդերի հավաքածուի կառուցումը սովորաբար իրականացվում է այսպես կոչված օգտագործելով ծածկագրի ծառերը.

Հաֆմանի ալգորիթմը երկու անցուղի է: Պատկերով առաջին անցումը ստեղծում է տարրերի կշիռների աղյուսակ, իսկ երկրորդ անցման ժամանակ տեղի է ունենում կոդավորում։ Կան ֆիքսված աղյուսակի ալգորիթմի իրականացում: Հաճախ է պատահում, որ այբուբենի տարրերի a priori հավանականության բաշխումն անհայտ է, քանի որ ամբողջ հաջորդականությունը միանգամից հասանելի չէ, մինչդեռ օգտագործվում են Huffman ալգորիթմի հարմարվողական փոփոխություններ:

Կորստի պատկերի սեղմում: Պատկերները պահելու համար անհրաժեշտ տեղեկատվության քանակը սովորաբար մեծ է: Դասական ալգորիթմները, լինելով ընդհանուր նշանակության ալգորիթմներ, հաշվի չեն առնում, որ սեղմվող տեղեկատվությունը պատկեր է՝ երկչափ օբյեկտ, և չեն ապահովում սեղմման բավարար աստիճան։

Կորուստային սեղմումը հիմնված է պատկերի մարդկային ընկալման առանձնահատկությունների վրա. մեծագույն զգայունություն գունային ալիքի երկարությունների որոշակի տիրույթում, պատկերն ամբողջությամբ ընկալելու կարողությունը՝ չնկատելով փոքր աղավաղումներ: Պատկերների հիմնական դասը, որի վրա կենտրոնացած են կորստի սեղմման ալգորիթմները, լուսանկարներն են՝ սահուն գունային անցումներով պատկերներ։

Պատկերի կորստի գնահատում. Կան բազմաթիվ չափումներ՝ սեղմվածներից դրանց վերականգնումից (վերծանումից) հետո պատկերների կորուստները գնահատելու համար, սակայն բոլորի համար կարելի է ընտրել երկու պատկեր այնպես, որ դրանց տարբերությունը բավականաչափ մեծ լինի, բայց տարբերությունները գրեթե աննկատ կլինեն։ աչքը. Եվ հակառակը. դուք կարող եք վերցնել պատկերներ, որոնք մեծապես տարբերվում են աչքով, բայց ունեն փոքր չափով տարբերություն:

Կորստի ստանդարտ թվային չափումը սովորաբար վերակազմված պատկերի բնօրինակից պիքսելային արժեքների ստանդարտ շեղումն է (RMS): Սակայն կորուստների գնահատման ամենակարեւոր «չափը» դիտորդի կարծիքն է։ Որքան քիչ տարբերություններ (կամ ավելի լավ, դրանց բացակայությունը) դիտորդը հայտնաբերի, այնքան բարձր կլինի սեղմման ալգորիթմի որակը: Կորուստ սեղմման ալգորիթմները հաճախ թույլ են տալիս օգտվողին ընտրել «կորցրած» տվյալների քանակը, այսինքն՝ ընտրելու իրավունք սեղմված պատկերի որակի և չափի միջև: Բնականաբար, որքան լավ է տեսողական որակը ավելի բարձր սեղմման հարաբերակցությամբ, այնքան լավ կլինի ալգորիթմը:

Ֆուրիեի փոխակերպում. Ընդհանուր դեպքում պատկերը կարելի է դիտարկել որպես երկու փոփոխականների ֆունկցիա՝ սահմանված վերջնական ռաստերի կետերում։ Ֆիքսված վերջավոր ռաստերի կետերի վրա նման ֆունկցիաների բազմությունը կազմում է վերջավոր չափերի էվկլիդյան տարածություն, և դրանց վրա կարող է կիրառվել դիսկրետ Ֆուրիեի փոխակերպումը, այսինքն՝ պատկերի սպեկտրալ ներկայացումը։ Այն ապահովում է.

Սպեկտրի գործակիցների անհամատեղելիությունն ու անկախությունը, այսինքն՝ մեկ գործակիցի ներկայացման ճշգրտությունը կախված չէ մյուսից:

- Էներգիայի խտացում. Փոխակերպումը հիմնական տեղեկատվությունը պահում է փոքր թվով գործակիցներով: Այս հատկությունն առավել արտահայտված է ֆոտոռեալիստական պատկերներում:

Սպեկտրալ ներկայացման գործակիցները պատկերի տարածական հաճախությունների ամպլիտուդներն են։ Սահուն անցումներով պատկերների դեպքում տեղեկատվության մեծ մասը պարունակվում է ցածր հաճախականության սպեկտրում։

Սեղմման ալգորիթմը, որն օգտագործվում է JPEG ձևաչափում, հիմնված է դիսկրետ կոսինուս Ֆուրիեի փոխակերպման վրա: Ալգորիթմում սեղմման սխեման խողովակաշար է, որտեղ այս փոխակերպումը միայն փուլերից մեկն է, բայց հիմնականներից մեկը: Ալգորիթմը պարունակում է հետևյալ հիմնական գործողությունները.

1. Տեղափոխել YCbCr գունային տարածություն: Այստեղ Y-ը լումա բաղադրիչն է, Cb-ն և Cr-ը՝ քրոմինանսական բաղադրիչները: Մարդու աչքն ավելի զգայուն է պայծառության նկատմամբ, քան գույնի: Հետևաբար, ավելի կարևոր է ավելի մեծ ճշգրտություն պահպանել Y-ը փոխանցելիս, քան Cb և Cr փոխանցելիս:

2. Դիսկրետ կոսինուսային փոխակերպում (DCT): Պատկերը բաժանված է 8 × 8 բլոկների: Յուրաքանչյուր բլոկի վրա կիրառվում է դիսկրետ կոսինուսային փոխակերպում (առանձին Y, Cb և Cr բաղադրիչների համար):

3. DCT մատրիցներում բարձր հաճախականության բաղադրիչների կրճատում: Մարդու աչքը գրեթե չի նկատում բարձր հաճախականության բաղադրիչների փոփոխությունները, հետևաբար, բարձր հաճախականությունների համար պատասխանատու գործակիցները կարող են պահպանվել ավելի քիչ ճշգրտությամբ:

4. Մատրիցների զիգզագաձեւ դասավորություն. Սա հատուկ մատրիցային անցում է միաչափ հաջորդականություն ստանալու համար: Սկզբում հայտնվում է T00 տարրը, այնուհետև T01, T10, T1: Ավելին, տիպիկ ֆոտոռեալիստական պատկերների համար նախ կլինեն ցածր հաճախականության բաղադրիչներին համապատասխանող ոչ զրոյական գործակիցներ, իսկ հետո շատ զրոներ (բարձր հաճախականության բաղադրիչներ):

5. Սեղմում սկզբում RLE մեթոդով, իսկ հետո՝ Huffman մեթոդով։

Պատկերի վերականգնման ալգորիթմն աշխատում է հակառակ հերթականությամբ: Սեղմման հարաբերակցությունը 5-ից 100 կամ ավելի անգամ է: Միևնույն ժամանակ, ֆոտոռեալիստական պատկերների մեծ մասի տեսողական որակը մնում է լավ մակարդակի վրա, երբ սեղմվում է մինչև 15 անգամ: Ալգորիթմը և ձևաչափը ամենատարածվածն են ամբողջական գունավոր պատկերների փոխանցման և պահպանման համար:

Wavelet փոխակերպում ազդանշանները դասական Ֆուրիեի փոխակերպման ընդհանրացումն է: «wavelet» (wavelet) տերմինը անգլերենից թարգմանաբար նշանակում է «փոքր (կարճ) ալիք»: Ալիքները ընդհանրացված անվանում են որոշակի ձևի մաթեմատիկական ֆունկցիաների ընտանիքների համար, որոնք տեղային են ժամանակով և հաճախականությամբ, և որոնցում բոլոր գործառույթները ստացվում են մեկ հիմնական ֆունկցիայից՝ այն տեղափոխելով և ընդլայնելով ժամանակի առանցքի երկայնքով:

Կորուստային սեղմման ալգորիթմներում, որպես կանոն, սեղմման խողովակաշարի բոլոր գործողությունները պահպանվում են դիսկրետ Ֆուրիեի փոխակերպումը դիսկրետ ալիքային փոխակերպմամբ: Wavelet փոխակերպումները շատ լավ հաճախական-տարածական տեղայնացում ունեն և այս ցուցանիշով գերազանցում են ավանդական Ֆուրիեի փոխակերպումները: Այս դեպքում հնարավոր է դառնում կիրառել ավելի ուժեղ քվանտացում՝ բարելավելով հաջորդականության հատկությունները հետագա սեղմման համար։ Այս փոխակերպման վրա հիմնված պատկերի սեղմման ալգորիթմները, նույն սեղմման հարաբերակցությամբ, ավելի լավ արդյունքներ են ցույց տալիս պատկերի որակի պահպանման հարցում:

գրականություն

46. et al. Արագ ալգորիթմներ թվային պատկերի մշակման մեջ: - Մ.: Ռադիո և կապ, 1984. - 224 էջ.

47. Սոյֆերի պատկերի մշակում. Մաս 2. Մեթոդներ և ալգորիթմներ. - Սորոսի կրթական հանդես թիվ 3, 1996 թ.

48. Աճառային աղմուկը պատկերներից, որոնք հիմնված են ոչ գծային ալգորիթմների վրա, օգտագործելով վարկանիշային վիճակագրությունը: - Յարոսլավլի պետական համալսարան, 2007 թ.

49. Անդրեևի հեռուստատեսային հսկողության համակարգեր. Մաս II. Թվաբանություն - տրամաբանական հիմքեր և ալգորիթմներ: Ուսուցողական. - Սանկտ Պետերբուրգ: Սանկտ Պետերբուրգ, GUITMO, 2005. - 88-ական թթ.

51. Թվային ազդանշանների մշակման ներածություն (մաթեմատիկական հիմքեր) - Մ.: Մոսկվայի պետական համալսարան, Համակարգչային գրաֆիկայի և մուլտիմեդիա լաբորատորիա, 2002 թ.- http://pv. *****/dsp/dspcourse. pdf, http://dsp-book. *****/dspcourse. djvu, http://geogin. *****/archiv/dsp/dsp4.pdf.

1i. և ռաստերային գրաֆիկայի այլ ալգորիթմական հիմքեր: – Տեղեկատվական տեխնոլոգիաների ինտերնետ համալսարան: - http://www. *****/goto/course/rastergraph/

2i. Lukin-Electronic Systems. Դասախոսությունների նշումներ. ITMO, 2004. - Սանկտ Պետերբուրգ, ITMO IFF, 2004. - http://iff. *****/kons/oes/KL. htm

Նկատված սխալների և լրացումների վերաբերյալ առաջարկությունների մասին՝ *****@***ru.

Լաբորատորիա թիվ 1

Պատկերների մշակման ալգորիթմներ

Կովոլյուցիոն գործողություն

Convolution-ը շատ լայն ալգորիթմ է, որը կարող է օգտագործվել ինչպես պատկերների նախնական մշակման, այնպես էլ օբյեկտների ճանաչման և նույնականացման համար: Թող պատկերը տրվի երկչափ պայծառության մատրիցով Ֆ" , և իմպուլսային արձագանքման մատրիցը Հ. Մատրիցայի մաթեմատիկական կոնվուլյացիա Ֆմիջուկով Հկարելի է սահմանել հետևյալ բանաձևով.

որտեղ M2xN2 - ոլորման միջուկի մատրիցայի չափը: Մատրիցայի չափը Ֆհավասար է (M1+M2-1)x(N1+N2-1), որտեղ M1xN1 - սկզբնական մատրիցայի չափը Ֆ" . Մատրիցա Ֆստացվում է բնօրինակից՝ ըստ որոշ կանոնների մատրիցայի եզրերին տարրեր ավելացնելով՝ այն անհրաժեշտ չափին հասցնելու համար։ Սովորաբար, սկզբնական մատրիցը եզրերին զրոյական է լցնում մատրիցայի լայնության կեսին: Հձախ և աջ և, համապատասխանաբար, բարձրության կեսը վերև և նույնը ներքև: Այնուհետեւ ստացված մատրիցայի չափը Ռկլինի նույնը, ինչ մատրիցը Ֆ" .

Կովոլյուցիան կարող է ուղղակիորեն հաշվարկվել՝ «վազելով» մի մատրիցը մյուսի վրա, ինչպես արդեն ցույց է տրված վերևում։ Նկ. 1-ը ցույց է տալիս ոլորման հաշվարկման սխեման (դիմակի մատրիցայի չափը վերցված է հավասար 3x3): Կոնվուլյացիայի օպերատորը կարող է դիտվել որպես գործակիցների (դիմակների) մատրիցա, որոնք բազմապատկվում են տարր առ տարր ընտրված պատկերի հատվածի հետ, որին հաջորդում է գումարում՝ զտված պատկերի տարրի նոր արժեք ստանալու համար: Այս մատրիցը կարող է լինել կամայական չափի, պարտադիր չէ, որ քառակուսի լինի:

Բրինձ. 1. Կոնվոլյուցիոն գործողության իրականացում.

Զորավարժություններ

Իրականացնել ալգորիթմ, որն իրականացնում է բնօրինակ պատկերի ոլորման գործողությունը մատրիցա-դիմակով:

Մատրիցա-դիմակի չափը և տեսակը սահմանվում է օգտագործողի կողմից:

Պատկերների մշակման տարբեր ալգորիթմներ իրականացնելու համար օգտագործեք հետևյալ դիմակի մատրիցները.

Պատկերում աղմուկը հարթելու և ճնշելու համար օգտագործվում է հետևյալ ձևի 3x3 մատրիցային դիմակ.

Եզրագծերն ընդգծելու համար օգտագործվում են հետևյալ ձևի մատրիցային դիմակները.

1/9*

Եզրագծերը ընտրելու համար օգտագործվում է հետևյալ ձևի դիմակը.

4. Ներդրեք մեդիանային ֆիլտր, որն օգտագործվում է կետային և իմպուլսային աղմուկը ճնշելու համար: Պատկերի պիքսելը և նրա հարևանները դիտարկվող տարածքում շարված են փոփոխական շարքով (պիքսելների աճող կամ նվազող արժեքներով) և այս փոփոխական շարքի կենտրոնական արժեքը ընտրվում է որպես նոր պիքսելային արժեք: Միջին զտման արդյունքն այն է, որ պատկերում պարունակվող ցանկացած պատահական աղմուկ արդյունավետ կերպով կվերացվի: Դա պայմանավորված է նրանով, որ դիտարկվող տարածաշրջանում պիքսելների ինտենսիվության ցանկացած պատահական կտրուկ փոփոխություն կտեսակավորվի, այսինքն. այն կտեղադրվի այդ տարածաշրջանի տեսակավորված արժեքների վերևում կամ ներքևում և չի հաշվվելու, քանի որ կենտրոնական արժեքը միշտ վերցվում է նոր տարրի արժեքի համար:

5. Իրականացնել դաջման ալգորիթմը: Դաջվածքը կատարվում է միջինացման կամ եզրերի բարձրացման ալգորիթմների նմանությամբ: Պատկերի յուրաքանչյուր պիքսել մշակվում է 3x3 դաջող միջուկով (մատրիքս-դիմակ): Օրինակ, որպես դաջող միջուկ, կարող եք վերցնել հետևյալ դիմակի մատրիցը.

Այն բանից հետո, երբ պիքսելային արժեքը մշակվում է դաջող շարժիչով, դրան ավելացվում է 128: Այսպիսով, ֆոնային պիքսելների արժեքը կդառնա միջին մոխրագույն գույնը (կարմիր = 128, կանաչ = 128, կապույտ = 128): 255-ից ավելի գումարները կարող են կլորացվել մինչև 255:

Պատկերի դաջված տարբերակում ուրվագծերը կարծես արտամղված են մակերեսի վերևում: Պատկերի ընդգծման ուղղությունը կարող է փոխվել միջուկում 1 և -1 դիրքերը փոխելով: Եթե, օրինակ, 1 և -1 արժեքները փոխվում են, ապա հետևի լույսի ուղղությունը փոխվում է:

6. Պատկերի ջրաներկավորում. Ջրաներկի ֆիլտրը փոխակերպում է պատկերը, և մշակելուց հետո այն կարծես ջրաներկով գրված լինի.

Ջրաներկի ֆիլտրի կիրառման առաջին քայլը նկարի գույները հարթեցնելն է: Հարթեցնելու եղանակներից մեկը յուրաքանչյուր կետում միջին գույնի միջինացում կիրառելն է: Յուրաքանչյուր պիքսելի և նրա 24 հարևանների գունային արժեքը (մատրիցա-դիմակի չափը 5x5 է) դասավորված են փոփոխական շարքով՝ նվազման կամ աճման կարգով: Միջին (տասներեքերորդ) գույնի արժեքը տատանումների շարքում նշանակվում է կենտրոնական պիքսելին:

Գույները հարթելուց հետո անհրաժեշտ է կիրառեք եզրերի բարելավման ֆիլտր, որպեսզի ընդգծեք գունային անցումների սահմանները:

Պատկերի ներկայացում

Գոյություն ունեն պատկերների ներկայացման երկու հիմնական տեսակ՝ վեկտոր և ռաստեր:

Վեկտորային պատկերում պատկերը նկարագրվում է գծերի (վեկտորների) մի շարքով, որոնք պարունակում են սկզբի և վերջի կետերի կոորդինատները, գծերի կորությունը և այլ երկրաչափական բնութագրեր. նկարագրված է նաև. Այլ կերպ ասած, ռաստերային ներկայացումը պահանջում է ինչ-որ մաթեմատիկական մոդելի ձևավորում: Հետևաբար, վեկտորային ներկայացումը հիմնականում օգտագործվում է պատկերների սինթեզի խնդիրների լուծման համար։ Թեև պատկերների ճանաչման որոշ ալգորիթմներ պահանջում են վեկտորային ներկայացում իրենց աշխատանքի համար, որը պետք է ստացվի բնօրինակ պատկերից:

Ռաստերային պատկերը մեկ կամ մի քանի մատրիցա է, որը նկարագրում է պատկերի բնութագրերի տարածական բաշխումը որոշակի դեկարտյան կոորդինատային ցանցի վրա։ Այս դեպքում պատկերը կառուցված է մի շարք կետերից և ունի ռաստերային կառուցվածք։ Պատկերի ռաստերային ներկայացման հիմնական տարրը պիքսելն է (կրճատ «պատկերային տարրեր» արտահայտությունը), որն ունի կոորդինատներ ռաստերային կոորդինատային համակարգում և որոշ ատրիբուտներ (գույն, պայծառություն, թափանցիկություն և այլն): X և Y կոորդինատների երկայնքով պիքսելների քանակը (հորիզոնական և ուղղահայաց) սահմանում է պատկերի ներկայացման լուծումը (չափը): Պիկսելի գույնը տրվում է նրա խորությամբ, որը բիթերի քանակն է, որն անհրաժեշտ է ցանկացած գույն նշելու համար:

Ռաստերային պատկերները, կախված պիքսելի գույնը սահմանելու մեթոդներից և բնօրինակ պատկերի հատկություններից, բաժանվում են.

Երկուական

Կիսաձայն

Ներկապնակ

ամբողջական գույն

Երկուական ներկայացման դեպքում պիքսելի գույնը կարող է լինել կամ սպիտակ կամ սև և կոդավորված է մեկ բիթով: Պատկերը մատրիցա է։ Այս մատրիցայի I (i, j) յուրաքանչյուր տարր ունի կամ 0 կամ 1 արժեք, որտեղ i-ն տողի համարն է և տվյալ պիքսելին համապատասխանող տարրի j սյունակի թիվն է (նկ. 1):

Մոխրագույն գույնի պատկերներում պիքսելները ներկայացնում են մոխրագույնի երանգներին համապատասխանող պայծառության արժեքներ: Մատրիցային ինդեքսները, որոնք նկարագրում են կիսատոնային պատկերը, սահմանում են պիքսելի դիրքը ռաստերի վրա և մատրիցային տարրի արժեքը

- սահմանում է իր պայծառությունը I (i, j) (նկ. 2):

Ներկապնակ պատկերները նկարագրվում են երկու մատրիցներով (նկ. 3): One-ը պահպանում է ինդեքսների արժեքները, որոնք նշում են գունապնակի մատրիցայի տող մուտքը: Ներկապնակ մատրիցը գունավոր քարտեզ է: Այն պարունակում է սյունակների 3 խումբ՝ համապատասխան կարմիր «R», կանաչ «G» և կապույտ «B» գույներին։ Նրանք սահմանում են համապատասխան պիքսելի գույնը։

Ներկապնակը Nc 3 մատրիցա է, որտեղ Nc-ը գույների քանակն է։

Պատկերի նախնական մշակման ալգորիթմներ

Ամբողջ գունավոր պատկերները կառուցված են RGB ձևաչափով և ներկայացնում են երեք մատրիցներ R (i , j ), G (i , j ), B (i , j ) : Յուրաքանչյուր մատրիցայի համապատասխան տարրերը պարունակում են կարմիր, կանաչ և կապույտ գույների ինտենսիվության արժեքները մատրիցային ինդեքսներով սահմանված պիքսելի համար: Այսպիսով, ամբողջական գունավոր պատկերը չունի գունավոր քարտեզ, և յուրաքանչյուր պիքսելի գույնը ներկայացված է համապատասխան մատրիցներից վերցված երեք թվերով (նկ. 4):

Մատրիցներում թվերի ձևաչափը կարող է լինել ինչպես ամբողջ, այնպես էլ լողացող կետ: Առաջին դեպքը վերաբերում է այսպես կոչված թվայնացված պատկերներին, որոնք ստացվում են տարբեր սարքերի միջոցով՝ սկաներներ, թվային տեսախցիկներ, հեռուստատեսային տեսախցիկներ և այլն։ Հենց այս ձևաչափով է պատկերների մասին տեղեկատվությունը պահվում ստանդարտ գրաֆիկական ֆայլերում:

Երկրորդ տարբերակը օգտագործվում է պատկերների ներքին ներկայացման համար՝ դրանց մշակման ընթացքում։ Այս դեպքում հարմար է ինտենսիվության տվյալները նորմալացնել մեկ տիրույթում, օրինակ՝ տիրույթում և կատարել տարբեր հաշվարկներ լողացող թվերով, այնուհետև արդյունքը վերածել սկզբնական ամբողջ թվի ձևի: Այս մեթոդը թույլ է տալիս նվազեցնել հաշվարկների սխալները և բարելավել մշակման արդյունքի ճշգրտությունը:

Ամբողջ գունավոր պատկերների համար տարբերակներից մեկը գույների առավելագույն քանակն է, որը կարող է ներկայացված լինել այդ ձևաչափով: Առավել հաճախ օգտագործվող պատկերներն ունեն 16, 256, 65536 (բարձր գույն) և 10,7 միլիոն (իսկական գույն):

Պատկերի նախնական մշակման ալգորիթմներ

	0 0 0 0 1 1 1 0 0	120 122 125 128 115 117 118
	1 0 0 0 1 1 1 1 0	119 121 124 125 128 130 133
	1 1 0 0 1 1 0 0 1	122 122 124 123 127 126 128
	1 1 0 0 1 1 0 0 1	120 121 123 125 127 125 126
	1 1 1 0 1 1 0 0 0	120 121 123 125 127 125 126
	1 1 1 0 1 1 0 0 0	118 110 109 108 108 109 110
	0 0 1 0 0 1 0 0 1

Պատկերի նախնական մշակման ալգորիթմներ

Ինդեքսային մատրիցա

31 15 03 09

պալիտրա մատրիցա

Պատկերի նախնական մշակման ալգորիթմներ

Ամբողջական գունավոր պատկերը կարող է ներկայացվել ոչ միայն RGB ձևաչափով, այլև օգտագործելով այլ գունային համակարգեր:

HSB համակարգում գույնը ներկայացված է հետևյալ գունային բնութագրերով. Hue - գունային երանգ;

Հագեցվածություն - հագեցվածություն; Պայծառություն - պայծառություն:

Ենթադրվում է, որ այս գունային համակարգը համապատասխանում է մարդու գույնի ընկալման առանձնահատկություններին։

LAB համակարգում գույնը դիտվում է որպես պայծառության (թեթևության) և երկու անկախ քրոմինանսական արժեքների համակցություն, որոնք որոշում են պիքսելի իրական գույնը: Chromaticity A - գունային բաղադրիչն ընտրվում է մոխրագույնից մինչև կանաչ միջակայքում: Chromaticity B - երկրորդ գունային բաղադրիչն ընտրվում է դեղինից կապույտ միջակայքից:

Գոյություն ունեն գույների ներկայացման այլ համակարգեր: Բնականաբար, դրանք բոլորը կապված են, և մի ներկայացուցչությունից կարելի է ստանալ մյուսը։ Գունային համակարգերի բազմազանությունը պայմանավորված է նրանց օգնությամբ լուծված խնդիրներով։ Օրինակ, ավելի հարմար է LAB համակարգում գունային ուղղում կատարելը, RGB համակարգում մոնիտորի էկրանին պատկերը վերարտադրելու համար, ավելի լավ է տպել,

Պատկերի նախնական մշակման ալգորիթմներ

օգտագործելով CMYK ներկայացուցչությունը: Այնուամենայնիվ, ամեն դեպքում, պատկերները մշակելիս և ճանաչելիս նրանք աշխատում են մեկ կամ մի քանի մատրիցա պարունակող պատկերների ռաստերային ներկայացմամբ։

Նախամշակման ալգորիթմների դասակարգում

Պատկերի նախնական մշակման ալգորիթմները բաժանվում են տարբեր խմբերի՝ կախված դասակարգման առանձնահատկությունից: Նախամշակման բոլոր ալգորիթմները պետք է կա՛մ ինչ-որ առումով բարելավեն պատկերների որակը, կա՛մ փոխակերպեն այն ձևի, որն առավել հարմար է հետագա մշակման համար:

Ալգորիթմները, որոնք ուղղված են պատկերի գունային վերարտադրության բարելավմանը, կոչվում են գունային ուղղման ալգորիթմներ։ Այս խումբը ներառում է նաև ալգորիթմներ, որոնք աշխատում են գորշ գույնի պատկերների հետ, որոնք փոխում են դրանց պայծառությունն ու կոնտրաստը:

Պատկերների տարածական բնութագրերի մշակմանն ուղղված ալգորիթմները կոչվում են ալգորիթմներ տարածական զտում.Այս խումբը ներառում է աղմուկի զսպման ալգորիթմներ, տարածական հարթեցման ալգորիթմներ և տարածական ուժեղացման ալգորիթմներ, տարածական հաճախականություններ ճնշելու և ուժեղացնելու ալգորիթմներ:

Ալգորիթմները, որոնք պատկերի վրա երկրաչափական գործողություններ են կատարում, կոչվում են երկրաչափական մշակման ալգորիթմներ. Դրանք ներառում են.

Պատկերի նախնական մշակման ալգորիթմներ

– Պատկերի կտրում - ուղղանկյուն ձևի որոշակի մասի ընտրություն օրիգինալ պատկերից.

– Պատկերի չափափոխում. Այս ալգորիթմները օգտագործում են ինտերպոլացիայի տարբեր մեթոդներ՝ կա՛մ ճիշտ լրացնելու բացակայող պիքսելները մեծացված պատկերում, կա՛մ վերահաշվարկելու պիքսելների արժեքները, երբ պատկերը կրճատվում է:

– Պատկերի ռոտացիա. Այս ալգորիթմները պտտում են բնօրինակ պատկերը տվյալ անկյան տակ՝ ճիշտ վերահաշվարկելով պիքսելային արժեքները՝ օգտագործելով ինտերպոլացիայի տարբեր մեթոդներ:

Ալգորիթմները, որոնք կատարում են փոխակերպումներ մի գունային համակարգից մյուսը, կոչվում են գույների փոխակերպման ալգորիթմներ. Դրանք ներառում են նաև գունավոր պատկերները մոխրագույն մասշտաբի վերածելու ալգորիթմներ և երկուականացման ալգորիթմներ, որոնք սկզբնական պատկերը վերածում են երկուականի:

Ալգորիթմները, որոնք ընտրում են բնօրինակ պատկերի որոշ տարածքներ՝ ըստ տարբեր, հաճախ ոչ ֆորմալ պայմանների, կոչվում են հատվածավորման ալգորիթմներ։ Նման ալգորիթմի օրինակ կարող է լինել, օրինակ, ալգորիթմը, որը պետք է ընդգծի տեքստի և գրաֆիկական տեղեկատվության տարածքները փաստաթղթի պատկերի վրա, կամ ալգորիթմ, որն ընտրում է առանձին բառերի պատկանող տեքստային պատկերի տարածքները:

Պատկերի նախնական մշակման ալգորիթմներ

Տարածական զտման ալգորիթմներ

Պատկերի տարածական զտումը մաթեմատիկական ձևով դիսկրետ պատկերի դիսկրետ ոլորումն է՝ տարածական ֆիլտրի որոշ իմպուլսային արձագանքով։


Եթե (i, j)	Im(i m, j n)h (m, n), որտեղ:

m N11 n N21

Im, եթե սկզբնական և զտված պատկերների մատրիցները, h-ը ֆիլտրի իմպուլսային արձագանքի մատրիցն է,

N 11 , N 21 իմպուլսային արձագանքման սյունակների ստորին և վերին սահմանները, իմպուլսային արձագանքման տողերի N 12, N 22 ձախ և աջ սահմանները:

Իմպուլսային արձագանքման մատրիցը կարելի է ստանալ՝ հաշվարկելով տարածական ֆիլտրը՝ հիմնված տվյալ պարամետրերի վրա։ Թվային զտման վերաբերյալ մեծ քանակությամբ գրականություն նվիրված է, օրինակ, տարածական ֆիլտրերի հաշվարկման մեթոդներին: Գործնական հաշվարկների համար կարող եք օգտագործել ստանդարտ մաթեմատիկական փաթեթներ, օրինակ՝ «MATLAB» համակարգը ներառում է «Image Filter Design» ֆիլտրի հաշվարկման համակարգը։

Նշենք, որ զտումը կարող է իրականացվել նաև հաճախականության տիրույթում: Դրանում

Պատկերի նախնական մշակման ալգորիթմներ

Այս դեպքում զտման կարգը հետևյալն է.

Պատկերը տարածականից հաճախականության տիրույթի փոխակերպեք՝ օգտագործելով 2D դիսկրետ Ֆուրիեի փոխակերպումը

Կատարեք պատկերի հաճախականության մատրիցայի տարրական բազմապատկում ֆիլտրի հաճախականության մատրիցով

Ստացված արդյունքը վերածվում է տարածական տիրույթի՝ օգտագործելով հակադարձ երկչափ դիսկրետ Ֆուրիեի փոխակերպումը։


Ես (x, y)	Im(f x, f y)	Եթե (f x, f y) Im(f x, f y) H (f x, f y)	Եթե (fx, f y)		Եթե (x, y):

Հաճախականության տիրույթում պատկերների զտումը հազվադեպ է օգտագործվում հաշվարկների մեծ քանակի պատճառով: Այնուամենայնիվ, այս զտման մեթոդը լայնորեն կիրառվում է տեսական հաշվարկներում՝ պատկերների մշակման տարբերակների վերլուծության ժամանակ։ Այն թույլ է տալիս բավականին հստակ պատկերացնել, թե ինչ տեսակի զտում է անհրաժեշտ: Օրինակ, եթե դուք պետք է ընդգծեք պատկերի պայծառության կտրուկ փոփոխությունները, ապա ակնհայտ է, որ դուք պետք է օգտագործեք բարձր անցումային զտիչներ: Ընդհակառակը, եթե ձեզ անհրաժեշտ է ազատվել ցածր հաճախականության աղմուկից՝ դողացող սխեմաներից, առանձին գագաթներից և այլն, ապա դուք պետք է օգտագործեք ցածր անցումային զտիչներ: Հատուկ ֆիլտրի պարամետրերը ընտրվում են միջամտության հաճախականության վերլուծության և բնօրինակ պատկերի հատկությունների հիման վրա: