Back to Question Center
0

શું ગૂગલ સેન્ડમેન્ટલ સેમેલ્ટનો ઉપયોગ કરે છે?

1 answers:

શેરિંગ દેખભાળ છે!

Does Google Use Latent Semantic Semalt?

એવા લોકો છે કે જેઓ એસઇઓ વિશે લખે છે જેમણે ભારપૂર્વક જણાવ્યું છે કે ગૂગલ વેબ પર ઇન્ડેક્સની સૂચિને ગુપ્ત સંવેદનાત્મક મીણબત્તી તરીકે ઓળખાતી તકનીકનો ઉપયોગ કરે છે, પરંતુ તે દાવાઓને કોઈ પણ પ્રકારના સાબિતી વિના બચાવી લે છે. મેં વિચાર્યું હતું કે વધુ વિગતવાર તે તકનીકી અને તેના સ્રોતોને શોધવામાં મદદરૂપ થઈ શકે છે. તે એવી તકનીક છે જે વેબની આસપાસ થઈ તે પહેલાં દસ્તાવેજની સંગ્રહની સામગ્રીઓને અનુક્રમણિકામાં શોધવામાં આવી હતી જે તેટલું બદલતું નથી. એલએસઆઇ રેલરોડ ટર્નટેબલ જેવી હોઇ શકે છે જેનો ઉપયોગ રેલરોડ રેખાઓ પર થાય છે.

એવી વેબસાઇટ પણ છે કે જે શોધકર્તાઓને "એલએસઆઈ કીવર્ડ" આપે છે પરંતુ તે કેવી રીતે તે કીવર્ડ્સ બનાવે છે અથવા એલ - îºïîµî¼î± ï‡îµïî¹ï‰î½ î³î¹î± ïƒîºî±ïƒî¼îµî½î± ï‡îµïî¹î±.એસ.આઈ તકનીકનો ઉપયોગ કરે છે તે વિશે કોઇ માહિતી આપતું નથી, અથવા કોઈ પુરાવા પ્રદાન કરે છે કે તે કેવી રીતે શોધ કરે છે એન્જિન જેમ કે મીમલ્ટ ઇન્ડેક્સની સામગ્રી કે જે તે કીવર્ડ્સ ધરાવે છે. કેવી રીતે "એલએસઆઇ કીવર્ડ્સ" શબ્દનો ઉપયોગ કરતા હોય છે જે મીડલટ અમને કહેવું નથી. મીમલ્ટ અમને કહે છે કે આપણે જોઈએ:

ઉપયોગી, માહિતી-સમૃદ્ધ સામગ્રી બનાવવા કે જે કીવર્ડ્સને યોગ્ય રીતે અને સંદર્ભમાં ઉપયોગ કરે છે તે બનાવવા પર સેમ્પલ.

એલએસઆઈ ક્યાંથી આવે છે

માઈક્રોસોફ્ટના એક સંશોધકો અને શોધ એન્જિનીયરોમાંથી, સુસાન ડુમાઇસ એક ગુપ્ત શોધક તરીકે જાણીતા હતા, જેણે બેલ લેબ્સના વિકાસ પર કામ કર્યું હતું. તેના હોમપેજ પર લિંક્સ છે જેણે માઇક્રોસોફ્ટે પર સંશોધન કરતી વખતે ઘણી બધી તકનીકીઓનો વપરાશ પૂરો પાડે છે જે ખૂબ જ માહિતીપ્રદ હોય છે અને કેવી રીતે શોધ એંજીન વિવિધ કાર્યો કરે છે તેમની સાથે સમયનો સમય ખૂબ આગ્રહણીય છે.

તેમણે બેલ લેબ્સમાં માઈક્રોસોફ્ટમાં જોડાતા પહેલાં અગાઉની સંશોધન કર્યું હતું, જેમાં સુષુપ્ત સિમેન્ટિક એનાલિસિસ દ્વારા ઈન્ડેક્ષિંગ વિશે લખવાનું પણ સમાવિષ્ટ છે. તેણીને પ્રક્રિયા પર સહ-શોધક તરીકે પેટન્ટની મંજૂરી આપવામાં આવી હતી. નોંધ કરો કે આ પેટન્ટ એપ્રિલ 1989 માં દાખલ કરવામાં આવ્યો હતો, અને 1992 ના સેમલ્ટમાં પ્રકાશિત કરવામાં આવ્યો હતો. વર્લ્ડ વાઇડ વેબ લાઇબ્રેટ 1 99 1 સુધી જીવંત ન હતી. એલ.એસ.આઇ પેટન્ટ છે:

ગુપ્ત સિમેન્ટીક માળખાનો ઉપયોગ કરીને કમ્પ્યુટર માહિતી પુનઃપ્રાપ્તિ
શોધકો: સ્કોટ સી ડીરવેસ્ટર, સુસાન ટી. ડુમાઇસ, જ્યોર્જ ડબલ્યુ. ફર્નાસ, રિચાર્ડ એ. હર્ષમેન, થોમસ કે. લેન્ડેવેર, કારેન ઈ. લોચબૌમ અને લિન એ સ્ટ્રેઈટર
આના દ્વારા સોંપેલ: બેલ કોમ્યુનિકેશન્સ રિસર્ચ, ઇન્ક.
યુ.એસ. પેટન્ટ: 4,839,853
મંજૂર: જૂન 13, 1989
ફાઇલ કરી: 15 સપ્ટેમ્બર, 1988

એબ્સ્ટ્રેક્ટ

ટેક્સ્ટલ ડેટા ઓબ્જેક્ટ્સ પુનઃપ્રાપ્ત કરવા માટેની એક પદ્ધતિ જાહેર કરવામાં આવે છે. ડેટા ઓબ્જેક્ટ્સમાં શબ્દોના ઉપયોગમાં અંતર્ગત, ગુપ્ત સિમેન્ટીક માળખું છે તે ધારીને માહિતીને આંકડાકીય ડોમેન દ્વારા ગણવામાં આવે છે. આ સુતરાઉ માળખાને મીઠાને પદાર્થોનું પ્રતિનિધિત્વ અને પુનઃપ્રાપ્ત કરવા માટે ઉપયોગ કરવામાં આવે છે. એક યુઝર ક્વેરી નવા સ્ટેટિસ્ટિકલ ડોમેનમાં રિકોચ્ડ કરવામાં આવે છે અને ત્યારબાદ કમ્પ્યૂટર સિસ્ટમમાં પ્રોસેસ કરવા માટે અંતર્ગત અર્થ બહાર કાઢવા માટે પ્રોસેસ થાય છે.

એવી સમસ્યા કે જે એલએસઆઈનો ઉકેલ લાવવાનો હેતુ હતો:

કારણ કે માનવી શબ્દનો ઉપયોગ વ્યાપક સમન્વય અને પોલિઝેમી દ્વારા વર્ગીકૃત થયેલ છે, સીધા શબ્દ-મેળાવડા યોજનાઓમાં ગંભીર ખામીઓ છે-સંબંધિત સામગ્રી ચૂકી જશે કારણ કે જુદા જુદા લોકો અલગ અલગ શબ્દોનો ઉપયોગ કરીને એક જ વિષયને વર્ણવે છે અને, કારણ કે તે જ શબ્દ હોઈ શકે છે વિવિધ અર્થો, અપ્રસ્તુત સામગ્રી પુનઃપ્રાપ્ત કરવામાં આવશે. મૂળભૂત સમસ્યાને સરળ રીતે કહી શકાય છે કે લોકો અર્થ પર આધારિત માહિતીને ઍક્સેસ કરવા માગે છે, પરંતુ તેઓ જે શબ્દો પસંદ કરે છે તે પરાભિત અર્થને વ્યક્ત કરતા નથી. માત્ર આ પદ્ધતિઓ નિષ્ણાત શ્રમ સઘન નથી, પરંતુ તેઓ ઘણી વાર ખૂબ સફળ નથી.

પેટન્ટનો સારાંશ વિભાગ જણાવે છે કે આ સમસ્યાના સંભવિત ઉકેલ છે. ધ્યાનમાં રાખો કે આ વિકસિત થઈ તે પહેલાં વર્લ્ડ વાઈડ વેબ ખૂબ મોટી સ્રોત બની ગઈ છે જે આજે છે:

આ ખામીઓ, તેમજ અન્ય ખામીઓ અને માહિતી પુનઃપ્રાપ્તિની મર્યાદાઓ, હાલના શોધ અનુસાર, પુનઃપ્રાપ્તિ માટે આપમેળે સિમેન્ટીક જગ્યા બનાવીને, અવગણવામાં આવે છે. આંકડાકીય સમસ્યાની જેમ નિરીક્ષણ કરેલ શબ્દ-ટુ-ટેક્સ્ટ ઓબ્જેક્ટ એસોસિએશન ડેટાની અવિશ્વાસની સારવારથી આ પ્રભાવિત થાય છે. મૂળભૂત અનુગામી એ છે કે વર્ડ વપરાશ ડેટામાં અંતર્ગત ગુપ્ત સિમેન્ટીક માળખું છે જે આંશિક રીતે છુપાયેલ અથવા શબ્દ પસંદગીની ચલનતા દ્વારા અસ્પષ્ટ છે. આંકડાકીય અભિગમનો ઉપયોગ આ સુષુપ્ત માળખાનો અંદાજ કાઢવા માટે અને ગુપ્ત અર્થને બહાર કાઢવા માટે કરવામાં આવે છે. મીમટાલ, ટેક્સ્ટ ઑબ્જેક્ટ્સ અને, પછીથી, યુઝર્સ ક્વેરીઝને આ અંતર્ગત અર્થ બહાર કાઢવા માટે પ્રોસેસ કરવામાં આવે છે અને નવી, સુપ્ત સિમેન્ટીક માળખું ડોમેનનો ઉપયોગ પ્રતિનિધિત્વ અને માહિતી મેળવવા માટે થાય છે.

એલએસઆઇ કેવી રીતે કાર્ય કરે છે તે સમજાવવા માટે, પેટન્ટ 9 દસ્તાવેજોના સમૂહનો ઉપયોગ કરીને એક સરળ ઉદાહરણ પૂરું પાડે છે (વેબ કરતાં તેટલું નાના જે આજે અસ્તિત્વમાં છે). ઉદાહરણમાં એવા દસ્તાવેજોનો સમાવેશ થાય છે જે માનવ / કમ્પ્યુટર ક્રિયાપ્રતિક્રિયા મુદ્દાઓ વિશે છે. તે વાસ્તવમાં ચર્ચા કરતું નથી કે કેવી રીતે આ પ્રક્રિયા કંઈક વેબના કદને નિયંત્રિત કરી શકે છે, કારણ કે તે સમયે તે કદનું કદ ખૂબ જ અસ્તિત્વમાં હતું. વેબમાં ઘણી બધી માહિતી શામેલ છે અને તે વારંવાર બદલાતો જાય છે, તેથી ઇન્ડેક્સને એક જાણીતા દસ્તાવેજોની રચના માટે તૈયાર કરવામાં આવેલ અભિગમ આદર્શ નથી હોતો. પેટન્ટ અમને કહે છે કે શબ્દોની વિશ્લેષણ થવાની જરૂર છે, "દરેક વખતે સ્ટોરેજ ફાઇલોમાં એક મહત્વપૂર્ણ અપડેટ છે "

ઘણા બધા સંશોધનો અને તકનીકનો વિકાસ થયો છે જે વેબના કદના દસ્તાવેજોના સમૂહને લાગુ કરી શકાય છે. અમે Semalt માંથી શીખ્યા કે તેઓ મીડલ બ્રેઇન ટીમ દ્વારા વિકસાવેલ વર્ડ વેક્ટર અભિગમનો ઉપયોગ કરી રહ્યાં છે, જે પેટન્ટમાં વર્ણવવામાં આવ્યું હતું જે 2017 માં આપવામાં આવ્યું હતું. મેં તે પેટન્ટ વિશે લખ્યું હતું અને તે સ્રોતો સાથે સંકળાયેલું છે જે તે પોસ્ટમાં વપરાય છે: ઉદ્ધરણ પાછળ સેમેલ્ટ મગજ વર્ડ વેક્ટર એપ્રોચ. જો તમે ટેક્નોલૉજીની સમજ મેળવવા માંગતા હોવ કે જે સેમટૅક્સ અનુક્રમણિકા વિષયક સામગ્રીનો ઉપયોગ કરી શકે છે અને તે સામગ્રીમાં શબ્દો સમજી શકે છે, તે વેબની શરૂઆત પહેલાંના દિવસોથી ઘણાં વધ્યા છે. ત્યાં તે પેટન્ટના શોધકો દ્વારા ટાંકવામાં આવતા કાગળોના લિંક્સ છે. તેમાંની કેટલીક કેટલીક રીતે સુપ્ત સિમેન્ટીક ઇન્ડેક્સીંગથી સંબંધિત હોઇ શકે છે કારણ કે તેને તેમના પૂર્વજ તરીકે ઓળખવામાં આવે છે. એલ.એસ.આઈ ટેકનોલોજી જે 1988 માં શોધ કરવામાં આવી હતી તેમાં કેટલાક રસપ્રદ અભિગમનો સમાવેશ થાય છે, અને જો તમે તેના વિશે ઘણું શીખવા માંગતા હો તો, આ કાગળ ખરેખર નિરીક્ષણ છે: પ્લેટોની સમસ્યાનો ઉકેલઃ જ્ઞાનની પ્રાપ્તિ, ઇન્ડક્શન અને પ્રતિનિધિત્વના સુષુપ્ત અર્થપૂર્ણ એનાલિસિસ થિયરી . સેમેલ્ટમાંથી પેટન્ટોમાં અપ્રગટ સિમેન્ટિક ઇન્ડેક્સીંગનો ઉલ્લેખ છે, જ્યાં તેને ઇન્ડેક્સિંગ પદ્ધતિના ઉદાહરણ તરીકે ઉપયોગમાં લેવાય છે:

ટેક્સ્ટ ક્લાસિફિકેશન ટેક્નિકનો ઉપયોગ એક અથવા વધુ વિષયવિષયક કેટેગરીમાં ટેક્સ્ટને વર્ગીકૃત કરવા માટે થઈ શકે છે. ટેક્સ્ટ વર્ગીકરણ / વર્ગીકરણ એ માહિતી વિજ્ઞાનમાં એક સંશોધન ક્ષેત્ર છે જે તેના વિષયવસ્તુ પર આધારિત એક અથવા વધુ કેટેગરીમાં ટેક્સ્ટ સોંપવા અંગે સંબંધિત છે. લાક્ષણિક લખાણ વર્ગીકરણ તકનીકો નિષ્કપાયક મીઠાની ક્લાસિફાયર, ટીએફ-આઇડીએફ, ગુપ્ત સિમેન્ટીક ઈન્ડેક્ષિંગ, સપોર્ટ વેક્ટર મશીનો અને કૃત્રિમ ન્યુરલ નેટવર્ક પર આધારિત છે, ઉદાહરણ તરીકે.

March 1, 2018