1
Базы данных / архивы в БД
« : 12 Апреля 2005, 21:11:24 »Цитировать
откуда такая информация?
из первоисточника
Цитировать
не хранят они сжатых данных. Там создается нечто вроде инвертированных индексов, по которым и происходит поиск
цитата из документа:
Цитировать
The repository contains the full HTML of every web page. Each page is compressed using zlib (see RFC1950). The choice of compression technique is a tradeoff between speed and compression ratio. We chose zlib\'s speed over a significant improvement in compression offered by bzip. The compression rate of bzip was approximately 4 to 1 on the repository as compared to zlib\'s 3 to 1 compression. In the repository, the documents are stored one after the other and are prefixed by docID
http://www-db.stanford.edu/~backrub/google.html
это текст сергея брина и Лоренса Пейджа - основателей Гугла