छवि के भीतर पाठ का पता लगाने

वोट
25

मैं वर्तमान में एक परियोजना पर काम कर रहा हूँ और मेरा लक्ष्य एक छवि में पाठ का पता लगाने की है। पाठ OCR'ing अभी तक के रूप में मेरा इरादा नहीं है। मैं मूल रूप से एक छवि में पाठ की सीमा से प्राप्त करने के लिए चाहते हैं। मैं हेरफेर के लिए AForge.Net इमेजिंग घटक का उपयोग कर रहा हूँ। कुछ अर्थों या किसी अन्य रूप में किसी भी सहायता की?

अद्यतन 2/5/09: मैं के बाद से अपने प्रोजेक्ट में एक और मार्ग के साथ चला गया है। हालांकि मैं मोदी (माइक्रोसॉफ्ट ऑफिस दस्तावेज़ इमेजिंग) का उपयोग कर पाठ प्राप्त करने के लिए प्रयास किया था। यह आप एक छवि ओसीआर और कुछ आसानी से इसे से पाठ को खींचने के लिए अनुमति देता है।

05/08/2008 को 04:04
का स्रोत उपयोगकर्ता
अन्य भाषाओं में...                            


4 जवाब

वोट
12

इस शोध के एक सक्रिय क्षेत्र है। वहाँ का शाब्दिक हैं इस विषय पर शैक्षिक पेपर की अधिक संख्या। यह अधिक Deatails ओ डब्ल्यू / विशेष रूप से आप सहायता देने के लिए मुश्किल हो रहा है। आप पाठ के विशिष्ट प्रकार के लिए देख रहे हैं? फोंट्स? सिर्फ अंग्रेजी? आप शैक्षिक साहित्य से परिचित हैं?

"पाठ का पता लगाने" किसी भी ओसीआर (ऑप्टिकल कैरेक्टर रिकॉग्निशन) प्रणाली में एक मानक समस्या है और इसके परिणामस्वरूप वहाँ interwebs कि इसके साथ सौदा पर कोड के टुकड़े के बहुत सारे हैं।

मैं गूगल से लिंक के ढेर लिस्टिंग शुरू कर सकता है, लेकिन मैं सुझाव है कि आप बस "पाठ का पता लगाने के लिए" कोई खोज करते हैं और पढ़ने :) शुरू करते हैं। पर्याप्त उदाहरण कोड उपलब्ध भी है।

05/08/2008 को 04:24
का स्रोत उपयोगकर्ता

वोट
3

एक छवि के अंदर का पाठ पहचानने वास्तव में उस क्षेत्र में शोधकर्ताओं के लिए एक गर्म विषय है, लेकिन केवल नियंत्रण से बाहर विकसित करने के लिए जब शुरू हो गया कैप्चा का हो गया "आदर्श" स्पैम बॉट के खिलाफ रक्षा के संदर्भ में। क्यों कैप्चा का उपयोग संरक्षण के रूप में? अच्छी तरह से, क्योंकि यह है / बहुत एक छवि के अंदर का पता लगाने (और पढ़ें) पाठ करने के लिए कठिन हो गया था!

कारण है कि मैं उल्लेख कैप्चा की क्योंकि ज्यादातर उन्नति * कि छोटे से क्षेत्र के भीतर किया जाता है, और मुझे लगता है कि अपने समाधान सबसे अच्छा वहाँ पाया जा सकता है। खासकर इसलिए कि कैप्चा के अव्यवस्थित छवि के अंदर का पाठ (या कुछ है कि पाठ जैसा दिखता है) का पता लगाने और बाद में पत्र सही ढंग से पढ़ने का प्रयास के बारे में वास्तव में कर रहे हैं।

इसलिए यदि आप अपने आप को मिल सकता है एक अच्छा खुला स्रोत कैप्चा तोड़ने उपकरण आप शायद तुम सब अपने प्रयास जारी रखने की आवश्यकता है ...
आप शायद भी दूर सबसे dificult कोड है कि वर्ण पहचान ही संभालती है, फेंक सकता है, क्योंकि उन ओसीआर के पढ़ने के लिए उपयोग किया जाता है विकृत पाठ, कुछ तुम क्या करने की जरूरत नहीं है।

*:, दिखाई प्रयोग करने योग्य है, और के मामले में उन्नति व्यावहारिक एक "गैर-शोधकर्ता" के लिए जानकारी

05/08/2008 को 07:00
का स्रोत उपयोगकर्ता

वोट
0

स्ट्रोक चौड़ाई बदलना कर सकते हैं कि आप के लिए। यही कारण है कि एमएस उनके मोबाइल फोन ओएस के लिए कम से कम क्या विकसित है। कार्यान्वयन पर एक चर्चा है https://stackoverflow.com/ पर यहाँ

19/04/2013 को 15:54
का स्रोत उपयोगकर्ता

वोट
0

आप इस के लिए एक ऑनलाइन एपीआई का उपयोग कर के साथ ठीक कर रहे हैं, पर एपीआई http://www.wisetrend.com/wisetrend_ocr_cloud.shtml सिर्फ ओसीआर के अलावा पाठ का पता लगाने कर सकते हैं।

23/06/2010 को 06:49
का स्रोत उपयोगकर्ता

Cookies help us deliver our services. By using our services, you agree to our use of cookies. Learn more