Βιβλιοθήκη εγγράφων
Smart eDocMan-SE
Enterprise Document Management & Search Engine
Η Βιβλιοθήκη εγγράφων (eDocMan) είναι μια εφαρμογή που επικεντρώνεται γύρω από τη συνεργασία ανθρώπων σε ένα ή περισσότερα έγγραφα και στην ασφαλή αναζήτηση πληροφοριών εντός των εγγράφων αυτών.
Η εφαρμογή είναι ανεπτυγμένη σε περιβάλλον Oracle και δουλεύει αποκλειστικά με την συγκεκριμένη τεχνολογία. Η εφαρμογή δουλεύει αποκλειστικά μέσω web browser.
Γιατί σας ενδιαφέρει ! ! !
Το βασικό χαρακτηριστικό της εφαρμογής σε σχέση με την Ελληνική αγορά είναι η γρήγορη αναζήτηση ελληνικών χαρακτήρων & λέξεων εντός αρχείων PDF, DOCx, XLSx, MDB, PPTx κλπ., στο σύνολο των εγγράφων που έχουν αποθηκευθεί στην Βάση Δεδομένων.
Κατά την διάρκεια της εισαγωγής ενός εγγράφου στην βιβλιοθήκη, γίνεται πλήρης ανάλυση των λέξεων και ταξινόμηση σε ειδικό ασφαλές index, το οποίο έχει ως αποτέλεσμα η αναζήτηση των λέξεων ή φράσεων να γίνεται σε ελάχιστο χρόνο. Συνήθως είναι λιγότερο από 1 δευτερόλεπτο.
Η εφαρμογή αναγνωρίζει σχεδόν όλους τους γνωστούς τύπους αρχείων (περίπου 192) διαφορετικούς τύπους αρχείων συν τις διάφορες εκδόσεις τους. Αναλυτικός πίνακας ακολουθεί στο τέλος του εγγράφου
Ίσως το σημαντικότερο σημείο της εφαρμογής αποτελεί ο τρόπος αποθήκευσης και αναζήτησης αρχείων τύπου PDF (πρωτόκολλο ανεπτυγμένο από την εταιρεία Adobe). Είναι σημαντικό λόγω του ότι το υποστηρίζουν οι περισσότεροι επαγγελματικοί σαρωτές εγγράφων (scanners) όπου το πρόγραμμα σάρωσης, σε κάποιες ειδικές εκδόσεις έχει τη δυνατότητα της να κάνει παράλληλα οπτική αναγνώριση δακτυλογραφημένων χαρακτήρων στα Ελληνικά (και σε πολλές ακόμα γλώσσες) και το οποίο αποθηκεύεται σαν μέρος του PDF.
Αποτέλεσμα: μπορούμε να ανεβάσουμε στην βάση δεδομένων της εφαρμογής ένα PDF με το ενσωματωμένο κείμενο, η εφαρμογή θα διαβάσει και θα ταξινομήσει το κείμενο του PDF. Χωρίς να χρειαστεί να πληκτρολογήσουμε πρακτικά τίποτα από το κείμενο του εγγράφου, μπορούμε να ψάχνουμε το κείμενο σε όλα τα PDF (και βεβαίως σε κάθε άλλο έγγραφο) που έχουμε ανεβάσει στη βάση δεδομένων. Όταν το PDF εμφανιστεί στην οθόνη μας, θα έχει την φωτογραφική μορφή του αυθεντικού εγγράφου, με χρώματα, υπογραφές, σημειώσεις, φωτογραφίες, διαγράμματα κλπ.
Σημαντική παρατήρηση 1: Η ακρίβεια της αναζήτησης ισοδυναμεί με την ακρίβεια της οπτικής αναγνώρισης κατά την διάρκεια του scan.
Σημαντική παρατήρηση 2: Η υποστήριξη χειρόγραφων εξαρτάται από το σύστημα οπτικής αναγνώρισης. Αν το σύστημα οπτικής αναγνώρισης μπορεί να το αναγνωρίσει σωστά, η εφαρμογή Smart eDocMan θα μπορέσει να το ταξινομήσει άρα και να το αναζητήσει σωστά.
Η Βάση δεδομένων μπορεί να χειρισθεί κάθε όγκο δεδομένων. Από μερικά Gigabytes μέχρι Petabytes, η διαφορά είναι στο hardware και το licensing.
Το license της βάσης δεδομένων επιβαρύνει τον πελάτη. Για μικρές εφαρμογές ή για πιλοτικές εφαρμογές μπορεί να χρησιμοποιηθεί η έκδοση Oracle Express η οποία έχει μηδενικό κόστος license, αλλά έχει περιορισμούς: 11 GB data files, 1 GB RAM, 1 processor. Χονδρικά μπορεί να υποστηρίζει περίπου 80.000 σελίδες κειμένου. Ο αριθμός αυτός επηρεάζεται από το είδος των σελίδων, από τον αριθμό φωτογραφιών των γραφημάτων και οτιδήποτε άλλο αυξάνει το μέγεθος του PDF.