यह परियोजना तो वाकई मजेदार थी!
1998 के किसी समय में, मैं नवविवाहित था और थोड़े समय के लिए यूएस आया हुआ था। हम एरिका तोसंई के घर में रह रहे थे और वहाँ चर्चा चलने लगी स्कैनिंग परियोजनाओं की जो हमने साथ में की थीं और आगामी मिलवौकी सम्मेलन की। मुझे याद नहीं कि कौन था, पर किसी ने सुझाव दिया कि सम्मेलन में स्टार ऑफ द वेस्ट की एक सीडी बेची जाए। यह हास्यास्पद लगा, पर जितना मैंने इस पर विचार किया, उतना ही यह संभाव्य लगने लगा अगर ध्यान से योजना बनाई जाए।
हमने सम्मेलन की तारीख से पिछले हिसाब से काम किया, सीडी प्रिंटिंग, डिजाइन आदि के लिए समय की गणना की। शेड्यूल पागलपन भरा था। दो महीने में सीडी पर सॉफ्टवेयर तैनात करना पागलपन था। मुझे पता था कि यह परफेक्ट नहीं होगा, इसलिए मुझे सबसे पहले ऑटो-अपडेट्स को एकीकृत करना था।
एरिका कुछ दिनों बाद यात्रा पर चली गईं और मेरे पास एक व्यापारिक उत्पाद बनाने के लिए डेढ़ महीना बचा था! मैंने क्या वचनबद्धता कर ली थी??
ऐतिहासिक रिकॉर्ड के लिए। यहाँ स्टार ऑफ द वेस्ट के शिफ्टर के घोषणा वाले मूल वेब पेज पोस्ट है: शिफ्टर - स्टार ऑफ द वेस्ट >>
पूरी तरह पागलपन भरी योजना
आधुनिक इटरेटिव विकास के बावजूद, दो महीने से कम समय में एक तैयार सॉफ्टवेयर प्रोजेक्ट को पूरा करना अभी भी एक पागलपन भरा शेड्यूल है। मैंने इस चुनौती पर विचार किया और यहाँ हमने जो किया:
- अत्यधिक प्राथमिकता: सबसे महत्वपूर्ण कार्यों को पहले प्राथमिकता देना
- पहले तैनाती: सबसे पहले ऑनलाइन अपडेटिंग सुविधा का निर्माण करना। वैसे, उस समय यह एक बिलकुल नया विचार था।
- प्रतिदिन इटरेट करना और पहुंचाना: प्रतिदिन जीवंत विकास और सक्रिय यूज़र्स के छोटे समूह के लिए नई कार्यक्षमता तैनात करना। यूज़र स्वीकृति परीक्षण विकास प्रक्रिया का भाग बन जाता है।
बहुत बड़ी इमेज...
उस समय, ड्राइव स्पेस अभी भी इतना पर्याप्त नहीं था कि यूज़र्स से 500mb+ की पृष्ठ इमेजों को उनके हार्ड डिस्क पर इंस्टॉल करने की उम्मीद की जा सके, इसलिए सॉफ्टवेयर को इमेजों के साथ या बिना इमेज के सहज रूप से काम करना था। PDF अभी भी बहुत अधिक अनुपयोगी था इसलिए ये TIFF इमेजों के फोल्डर थे जिनके साथ इंडेक्स नेविगेशन, बुकमार्क्स, पूर्ण-पाठ खोज आदि प्रदान करते थे।
निम्न गुणवत्ता वाली OCR, ची...
खोज को इतना धुंधला होना पड़ा कि पृष्ठों में घुसे हुए सभी भयानक OCR त्रुटियों को नजरअंदाज कर सके। आजकल आपको बुरे OCR के बारे में नहीं पता चलता क्योंकि खराब OCR PDF फाइलों में एक अदृश्य परत में छिपा होता है। लेकिन यह खोज को अभी भी बाधित करता है। सबसे अच्छे OCR की प्राप्ति के लिए, हमने “वोटिंग” OCR सिस्टम का उपयोग किया, जिसने कई इंजनों का संयोजन किया और हर शब्द पर मतदान किया। इससे परिणाम 20% बेहतर हो गए।
और तैनाती... कुछ भी नहीं
पहले दो दिनों में, एरिका को ग्रीष्मकालीन स्कूल दौरे के लिए निकलना पड़ा। पहली चीज़ जो मैंने की थी वह एक एप्लिकेशन सेटअप करना था जो इंटरनेट पर अद्यतन की जांच करता था। फिर, यदि एक अपडेट मौजूद होती थी, तो यह स्वयं को डाउनलोड करती और फिर खुद पर रहते हुए एक छोटी लाइव-पुन:स्थापना करती (यह विंडोज़ पर आसान नहीं था)। लेकिन यह काम कर गया! और पहले दिन से ही हमारे पास नए बिल्ड तैनात करने का तंत्र था और एक एप्लिकेशन जो स्वचालित रूप से बिल्ड लागू करता था। उसके बाद, मैं प्रतिदिन एक दर्जन बार अपडेट तैनात कर रहा था। एरिका, मेरी प्रमुख परीक्षक, कई बार एप्लिकेशन की जांच करती थी ताकि इसके विकास को देख सकें। कितना मजेदार था!
हर दिन कदम दर कदम, काम सम्पन्न
वाकई में यह बहुत अच्छा था। एक हफ्ते के भीतर हमारे पास संदर्भ से इमेज नेविगेशन था। दो हफ्तों में, पूर्ण पाठ-खोज। तीन हफ्तों में, बुकमार्किंग और प्रिंटिंग। हर दिन एक या दो नई तैनाती देखी जाती थी, प्रत्येक एक पूरी पर उन्नत उत्पाद थी। सम्मेलन से एक हफ्ते पहले हमने नवीनतम इमेज जलाई और उसे प्रिंटिंग के लिए भेज दिया। सम्मेलन से दो दिन पहले हमने प्रिंटर से 1,000 सीडी के एक बॉक्स की उठाई, जिसमें बुकलेट्स केस और सीडी जैकेट स्लिप्स भी थे।
हम कच्चे उत्पाद के साथ पार-देश सफर पर निकले और जब हम वहाँ पहुंचे, सम्मेलन से एक रात पहले, हमने शाम को युवाओं के एक समूह के साथ सीडी पैकेजेस को इकट्ठा करने में बिताई। सुबह में हमने जस्टिस सेंट रेन ऑफ स्पेशल आइडियाज से मुलाकात की और उन्हें सीडी का एक ढेर बेचने के लिए दिया।
और यह बेकार का काम भी नहीं था, पूरा पैकेज काफी अच्छा दिखता था! OCR एक भयानक प्रौद्योगिकी है लेकिन इस दृष्टिकोण ने इसकी कमियों को दूर करने और पूरे सेट को पूर्ण पाठ के लिए पहुँच प्रदान करने में मदद की। जब जॉर्ज रोनाल्ड ने स्टार ऑफ द वेस्ट को पुनर्प्रकाशित किया त