Intranets heute - wie werden sie eingesetzt? was sind die Erwartungen?

Intranets heute - wie werden sie eingesetzt? was sind die Erwartungen?

Posts 1-10 of 14
  • Detlev Poettgen
    Detlev Poettgen
    The company name is only visible to registered members.
    Search Engines mit Java
    Guten Morgen,

    ich habe mich die letzten 6 Monate bedingt durch Kundenanfragen mit dem Thema Suchen und Finden auf Internet-/Intranet-Sites beschäftigt und diverse Produkte getestet.

    Folgende Vorraussetzung waren für mich gegeben. Die Suchlösung muß Java basiert, die Kosten überschaubar, da mehr als 100.000 Pages zu indizieren sind und diverse Zeichensätze möglich sein.

    Durch die Beschränkung auf Java fallen einige Engines aus der engeren Wahl.

    Übriggeblieben sind Searchblox, Oxyus& Nutch. Diese drei Lösung haben Out of the Box im Vergleich zu anderen sofort funktioniert.

    - Searchblox basiert auf Lucene und ist eine kommerzielle Lösung. Und ist ähnlich wie der vorherige Post in 10 Minuten eingerichtet, aber mit 3.000 bis 10.000 Euro relativ teuer.

    - Oxyus ist ein kleines OpenSource Projekt (I only want a search button for my homepage...) . Für die Indizierung einer kleinen Website in einer Sprache sehr gut geeignet. Wenn man spezielle Dinge will, stößt man schnell an die Grenzen.

    - Nutch ist ein Apache Open Source Projekt und hat den Anspruch eine Open Source Alternative zu google zu ermöglichen. Nach einiger Einarbeitung läuft Nutch sehr zuverlässig und stabil. Die Anwendung ist skalierbar und die Treffergüte sehr ansprechend.

    Meine Wahl viel auf Nutch, da Open Source und somit beliebig an meine Bedürfnisse anpassbar und die Indizierung und Suche einer Site mit ca. 200.000 Pages in 9 Sprachen sauber funktioniert. Allerdings ist Nutch noch in der Entwicklungsphase (daher zB. noch kein Admin GUI)

    Hat sonst noch jemand Erfahrung mit anderen Java basierten Engines gemacht? Oder Interesse am Informationsaustausch zu Nutch oder Open Source Lösungen?

    Über eine Diskussion würde ich mich freuen.
  • Detlef Müller
    Detlef Müller    Premium Member
    The company name is only visible to registered members.
    Re: Search Engines mit Java
    Hallo,
    Ich kann zu den genannten Open Source Lösungen keine Bewertung abgeben. Mir fallen hier aber als Lesender ein paar Dinge auf, die ich sehr oft als Handlungsmuster wiederfinde und die mich dazu veranlassen, bestimmte Dinge einfach mal zu hinterfragen. Vielleicht erlangen Sie ja auch daraus ein paar interessante Erkenntnisse.

    1. Java Engine:
    Es ist nicht erläutert, warum es eine Java Engine sein muß. Es ja kann durchaus gute Gründe geben. Dies aber nur als Tatsache zu definieren , würde mir persönlich nicht reichen, da sie mich in meiner Entscheidungsfindung einschränken würde.
    Was qualifiziert eine Technologie wie Java dazu, sich genau in diesem Umfeld der Suche und Indizierung maßgeblich zu behaupten? Bitte nicht mißverstehen, ich bin kein Java Feind - im Gegenteil. Ich will es nur hinterfragen. Ich komme im Zuge der Kostenbetrachtung gleich nochmal auf diesen Technologieaspekt zurück

    2. Open Source:
    Der Kostenfaktor bei Open Source wird immer wieder gerne auf die Lizenzen zurückgeführt. Keine Frage, das ist sicher dem Kunden gegenüber ein gutes Argument. Das Risiko des Kunden ist aber nicht nur rein finanzieller Art bzgl. Anschaffung der Lizenzen, sondern es sollte darüber hinaus Fragen in den Mittelpunkt rücken, wie "Wer ist im Zweifel wofür rechtlich zuständig" und "Wer gibt wofür welchen Support zu welchen Folgekosten".

    Suchen und Finden hat viel mit Daten zu tun, daher sollte hier die Frage der Datenhaltung auch eine wichtige Rolle spielen. Auch die Textfilter und das Aktualisieren der Indizes sind wichtig. Was macht man im Bereich des Identity Management, wenn es darum geht, abgesicherte Quellen zu indizieren und die Treffermenge der Suche auch nur auf autorisierte Zugriffe zu beschränken? Dann benötigt man ein Identity Managent bzw. muß die Lösung in die bestehende Securityinfrastruktur einbinden (das sind übrigens alles keine reinen Java Themen, daher würde ich den Java Zwang nicht zu eng nehmen). Dies (und noch mehr) sind alles Dinge, die erfahrungsgemäß nicht originär in einer einzigen Open Source Lösung enthalten sind. Daher ist man eigentlich meistens mit dem Zusammenbinden mehrerer Teillösungen beschäftigt, die nicht immer in der Konzeptionierung aufeinander abgestimmt sind. Ist das noch effizient bzw. kostenminimal? Was passiert denn, wenn hier eine Teilkomponenten zusammenbricht? Auch OpenSource Lösungen haben einen Lifecycle und sind nicht für ewig in Stein gemeißelt.

    Bitte verstehen Sie mich nicht falsch, ich will Ihnen die Open Source Lösungen nicht ausreden, sondern möchte nur auf bestimmte Fallen hinweisen. Möglicherweise sind Ihnen diese auch bereits bekannt.

    Kurzum, ich bin der Meinung, dass kommerzielle Lösungen durchaus eine preiswerte Alternative zu OpenSource sein können, wenn man die Gesamtkosten betrachtet und nicht nur auf die Anschaffung von Lizenzern schaut.

    Viele Grüße
    D.Müller
    This post was modified on 07 Jun 2006 at 04:04 pm.
  • Detlev Poettgen
    Detlev Poettgen
    The company name is only visible to registered members.
    Re^2: Search Engines mit Java
    Hallo Herr Müller,

    die Vorgabe für eine Java basierte Lösung ist aus folgendem Grund getroffen worden:

    Wir entwickeln für unsere Kunden Java Application Server basierte Lösung. Ein Fokus liegt in der Portal (Websphere, jBoss & Liferay) Integration. Eine Suchlösung sollte sich daher in diese Umgebung integrieren. Daher die Vorgabe Java.

    Eine Open Source Lösung war initial nicht erste Wahl. Wir haben kommerzielle (auch nicht Java basierte) Lösungen über einen Zeitraum von 6 Monaten getestet. Unter anderen die Google Appliance, IBM Omnifind, Ultraseek und Exalead Enterprise Search. Diese berücksichtigen (bis auf Google und Ultraseek) die von Ihnen besprochenen Punkte. Insbesondere das Thema Sicherheit ist hier sehr gut umgesetzt. Wir sind IBM Premier Partner und realisieren auch Kundenlösungen mit Omnifind.

    Allerdings gibt es auch Anforderungen, wo Sicherheit keine explizite Rolle spielt. Für die Integration einer vernünftigen Search Lösung für eine normale Firmen Website (die eh public ist) , reichen die von mir angesprochen Open Source Lösungen voll und ganz aus. Sie sind Ressourcen schonender, crawlen zuverlassig und die Treffergüte ist beeindruckend. Hinter den Lösungen steht übrigens die Lucene Engine, welche de Facto in vielen kommerziellen Lösungen Ihre Dienste verrichtet. Ein weiterer Vorteil,mit ein wenig Java Knowhow sind die Lösungen beliebig erweiterbar.

    Als kommerzielle Lösungen kann ich Omnifind und Exalead empfehle. Allerdings muss man hier alleine an Lizenzkosten von mindestens ca. 30.000 Euro ausgehen. Und meine Erfahrung ist, das dies für kleinere Mittelstandsfirmen nicht aktuell ins Budget passt.

    Freundliche Grüße

    Detlev Pöttgen
  • Wolfgang Jung
    Wolfgang Jung    Premium Member
    The company name is only visible to registered members.
    Re^3: Search Engines mit Java
    Hallo Herr Pöttgen,

    als IBM Mitarbeiter kann ich Sie noch auf folgende Lösung aufmerksam machen: IBM OmniFind Yahoo! Edition. Lizenz-Kostenfrei, bis 500.000 Dokumente, diverse Dateiformate und Sprachen und inklusive Ihrem fehlenden AdminGUI und API. Den Download, Dokumente und eine Demo finden Sie unter http://omnifind.ibm.yahoo.net/. Ich hoffe das hilft Ihnen weiter (?). Gruss, Wolfgang Jung
  • Post visible to registered members
  • Dennis de Vries
    Dennis de Vries
    (not a XING member)
    Re^4: Search Engines mit Java
    Gibt es bei der OmniFind Yahoo Edition auch die Möglichkeit den Zugriff nur für bestimmte Personen zuzulassen?
  • Post visible to registered members
  • Wolfgang Jung
    Wolfgang Jung    Premium Member
    The company name is only visible to registered members.
    Re^6: Search Engines mit Java
    Den Zugriff nur für bestimmte Personen zuzulassen ist auch mit IBM OmniFind Yahoo! Editon möglich.

    Diese Sicherheitsfunktion stellt die Suchmaschine Stand heute nicht in der mitgelieferten, beispielhaften Suche-Anwendung zur Verfügung, sondern wird dann in einer eigenen Suche-Anwendung selbst etabliert.

    Ein guter Artikel wie man OmniFind Yahoo! Edition in seine eigene Suche-Anwendung einfach integrieren kann, findet sich auf http://www-128.ibm.com/developerworks/db2/library/techarticl...
    Wie dann eine sichere Suche-Anwendung mit Benutzerrechten zu gestalten ist, findet sich in einem Eintrag im Internet-Forum der OmniFind Yahoo! Edition ein Hinweis unter http://omnifind.ibm.yahoo.net/forums/index.php/topic,133.0.h...
    Alle Standardansätze um eine J2EE Webapplikation "sicher" zu gestalten müssten funktionieren. Auf der Webseite http://docs.codehaus.org/display/JETTY/Realms findet sich ein Hinweis wie Authentifizierung in JETTY (der HTTP Server von OmniFind Yahoo! Edition) möglich wird.

    Bei Fragen können wir hier gerne weiter diskutieren (oder private Nachrichten an mich senden).
    Ich würde mich freuen!
    Gruss, Wolfgang Jung
  • Carmen Hintz
    Carmen Hintz    Premium Member
    The company name is only visible to registered members.
    Re^7: Search Engines mit Java
    Sehr geehrte Herren,

    ich habe mit Interesse diesen Beitrag angesehen und teste derzeit die IBM OmniFind Yahoo! Edition.
    Für unsere Zwecke reicht diese vorerst vollkommen aus.
    Nun muss ich mich aber gegenüber der Geschäftsführung absichern. Dadurch das Yahoo innerhalb des Namens erwähnt wird, herrscht eine gewisse Unsicherheit.
    Ich gehe davon aus, dass keinerlei Firmendaten aus dem internen Netz in irgendeiner Form nach außen dringen.
    Gibt es dazu irgendwo eine offizielle Aussage, die ich evtl. als Referenz nutzen kann?

    Herzlichen Gruß,
    Carmen Hintz
  • Post visible to registered members