第 2 章第 1 题同位词问题下问 Multimap实现

问题分析

　　输入：一个任意的单词和一个内含多个乱序单词的字典文件

　　输出：该单词在字典中的所有同位词

　　约束：允许事先对字典进行预处理

解决思路

　　上问的程序有个缺点 - 我们必须遍历完整个字典文件才能输出所有结果。现在下问允许我们事先对字典文件进行预处理，那么可以先对字典文件的单词按其标识符排序，这样相同标识符的单词都聚集在了一起，从而避免了对整个文件的检索。下面的代码用C++中的关联容器Multimap实现了这个思想。

代码实现

 #include <iostream>

 #include <fstream>

 #include <map>

 #include <string>

 using namespace std;

 #define MAX 26

 /*

  * 获取单词word的标识符并返回

 */

 string getID(string word)

 {

     string id(, '');

     for (string::size_type i=; i<word.length(); i++) {

         id[word[i]-]++;

     }

     return id;

 }

 int main()

 {

     /*

      * 打开字典文件

     */

     string filename;

     cout << "请输入字典文件名( 当前目录下 ): ";

     cin >> filename;

     fstream io;

     io.open(filename.c_str());

     if (!io) {

         cout << "打开文件失败" << endl;

         return ;

     }

     /*

      * 获取查询单词及其标识符

     */

     string word;

     cout << "请输入查询单词: ";

     cin >> word;

     string wordID = getID(word);

     /*

      * 将字典文件存放进关联容器

     */

     multimap<string, string> m;

     string first, second;

     while (io >> second) {

         first = getID(second);

         m.insert(make_pair(first, second));

     }

     io.close();

     /*

      * 检索关联容器并打印检索结果

     */

     multimap<string, string> :: iterator it1, it2;

     it1 = m.lower_bound(wordID);

     it2 = m.upper_bound(wordID);

     while (it1->first != it2->first) {

         cout << it1->second << endl;

         it1++;

     }

     // 关闭文件指针

     io.close();

     return ;

 }

运行测试

测试所用字典文件：

运行结果：

说明

　　当字典文件中单词数量达到千万级别的时候，程序运行异常（很占CPU和内存且耗时巨大，而上问用的程序依然运行良好）。难道multimap容器不适合处理大批量的数据？原因仍在思考中读者若有思路欢迎与我联系... ...

巴特西

第 2 章第 1 题同位词问题下问 Multimap实现

最新文章

热门文章

巴特西

第 2 章 第 1 题 同位词问题 下问 Multimap实现

最新文章

热门文章

第 2 章第 1 题同位词问题下问 Multimap实现