plison
diff --git a/‎OnDiskPt/Main.cpp
Lines changed: 8 additions & 8 deletions b/‎OnDiskPt/Main.cpp
Lines changed: 8 additions & 8 deletions
diff --git a/‎OnDiskPt/TargetPhrase.cpp
Lines changed: 10 additions & 10 deletions b/‎OnDiskPt/TargetPhrase.cpp
Lines changed: 10 additions & 10 deletions
diff --git a/‎OnDiskPt/TargetPhrase.h
Lines changed: 4 additions & 6 deletions b/‎OnDiskPt/TargetPhrase.h
Lines changed: 4 additions & 6 deletions
diff --git a/‎OnDiskPt/Word.cpp
Lines changed: 11 additions & 12 deletions b/‎OnDiskPt/Word.cpp
Lines changed: 11 additions & 12 deletions
diff --git a/‎biconcor/phrase-lookup.cpp
Lines changed: 5 additions & 4 deletions b/‎biconcor/phrase-lookup.cpp
Lines changed: 5 additions & 4 deletions
diff --git a/‎mert/FeatureStats.cpp
Lines changed: 3 additions & 2 deletions b/‎mert/FeatureStats.cpp
Lines changed: 3 additions & 2 deletions
diff --git a/‎mert/ForestRescore.cpp
Lines changed: 39 additions & 29 deletions b/‎mert/ForestRescore.cpp
Lines changed: 39 additions & 29 deletions
@@ -153,19 +153,19 @@ OnDiskPt::PhrasePtr Tokenize(SourcePhrase &sourcePhrase, TargetPhrase &targetPhr
         break;
       }
       case 4: {
-      	// store only the 3rd one (rule count)
-      	float val = Moses::Scan<float>(tok);
-      	misc[0] = val;
-          break;
+        // store only the 3rd one (rule count)
+        float val = Moses::Scan<float>(tok);
+        misc[0] = val;
+        break;
       }
       case 5: {
-      	// sparse features
-      	sparseFeatures << tok << " ";
+        // sparse features
+        sparseFeatures << tok << " ";
         break;
       }
       case 6: {
-	    property << tok << " ";
-	    break;
+        property << tok << " ";
+        break;
       }
       default:
         cerr << "ERROR in line " << line << endl;
 
@@ -166,10 +166,10 @@ char *TargetPhrase::WriteOtherInfoToMemory(OnDiskWrapper &onDiskWrapper, size_t
   size_t propSize = m_property.size();
 
   size_t memNeeded = sizeof(UINT64) // file pos (phrase id)
-  	  	  	  	  + sizeof(UINT64) + 2 * sizeof(UINT64) * numAlign // align
-  	  	  	  	  + sizeof(float) * numScores // scores
-  	  	  	  	  + sizeof(UINT64) + sparseFeatureSize // sparse features string
-  	  	  	  	  + sizeof(UINT64) + propSize; // property string
+                     + sizeof(UINT64) + 2 * sizeof(UINT64) * numAlign // align
+                     + sizeof(float) * numScores // scores
+                     + sizeof(UINT64) + sparseFeatureSize // sparse features string
+                     + sizeof(UINT64) + propSize; // property string
 
   char *mem = (char*) malloc(memNeeded);
   //memset(mem, 0, memNeeded);
@@ -350,13 +350,13 @@ UINT64 TargetPhrase::ReadStringFromFile(std::fstream &fileTPColl, std::string &o
   bytesRead += sizeof(UINT64);
 
   if (strSize) {
-	  char *mem = (char*) malloc(strSize + 1);
-	  mem[strSize] = '\0';
-	  fileTPColl.read(mem, strSize);
-	  outStr = string(mem);
-	  free(mem);
+    char *mem = (char*) malloc(strSize + 1);
+    mem[strSize] = '\0';
+    fileTPColl.read(mem, strSize);
+    outStr = string(mem);
+    free(mem);
 
-	  bytesRead += strSize;
+    bytesRead += strSize;
   }
 
   return bytesRead;
 
@@ -113,14 +113,12 @@ class TargetPhrase: public Phrase
 
   virtual void DebugPrint(std::ostream &out, const Vocab &vocab) const;
 
-  void SetProperty(const std::string &value)
-  {
-	  m_property = value;
+  void SetProperty(const std::string &value) {
+    m_property = value;
   }
 
-  void SetSparseFeatures(const std::string &value)
-  {
-	  m_sparseFeatures = value;
+  void SetSparseFeatures(const std::string &value) {
+    m_sparseFeatures = value;
   }
 };
 
 
@@ -105,18 +105,17 @@ void Word::ConvertToMoses(
   overwrite = Moses::Word(m_isNonTerminal);
 
   if (m_isNonTerminal) {
-	    const std::string &tok = vocab.GetString(m_vocabId);
-		overwrite.SetFactor(0, factorColl.AddFactor(tok, m_isNonTerminal));
-  }
-  else {
-	  // TODO: this conversion should have been done at load time.
-	  util::TokenIter<util::SingleCharacter> tok(vocab.GetString(m_vocabId), '|');
-
-	  for (std::vector<Moses::FactorType>::const_iterator t = outputFactorsVec.begin(); t != outputFactorsVec.end(); ++t, ++tok) {
-		UTIL_THROW_IF2(!tok, "Too few factors in \"" << vocab.GetString(m_vocabId) << "\"; was expecting " << outputFactorsVec.size());
-		overwrite.SetFactor(*t, factorColl.AddFactor(*tok, m_isNonTerminal));
-	  }
-	  UTIL_THROW_IF2(tok, "Too many factors in \"" << vocab.GetString(m_vocabId) << "\"; was expecting " << outputFactorsVec.size());
+    const std::string &tok = vocab.GetString(m_vocabId);
+    overwrite.SetFactor(0, factorColl.AddFactor(tok, m_isNonTerminal));
+  } else {
+    // TODO: this conversion should have been done at load time.
+    util::TokenIter<util::SingleCharacter> tok(vocab.GetString(m_vocabId), '|');
+
+    for (std::vector<Moses::FactorType>::const_iterator t = outputFactorsVec.begin(); t != outputFactorsVec.end(); ++t, ++tok) {
+      UTIL_THROW_IF2(!tok, "Too few factors in \"" << vocab.GetString(m_vocabId) << "\"; was expecting " << outputFactorsVec.size());
+      overwrite.SetFactor(*t, factorColl.AddFactor(*tok, m_isNonTerminal));
+    }
+    UTIL_THROW_IF2(tok, "Too many factors in \"" << vocab.GetString(m_vocabId) << "\"; was expecting " << outputFactorsVec.size());
   }
 }
 
 
@@ -7,7 +7,8 @@ size_t lookup( string );
 vector<string> tokenize( const char input[] );
 SuffixArray suffixArray;
 
-int main(int argc, char* argv[]) {
+int main(int argc, char* argv[])
+{
   // handle parameters
   string query;
   string fileNameSuffix;
@@ -95,14 +96,14 @@ int main(int argc, char* argv[]) {
       }
       cout << lookup( query ) << endl;
     }
-  } 
-  else if (queryFlag) {
+  } else if (queryFlag) {
     cout << lookup( query ) << endl;
   }
   return 0;
 }
 
-size_t lookup( string query ) {
+size_t lookup( string query )
+{
   cerr << "query is " << query << endl;
   vector< string > queryString = tokenize( query.c_str() );
   return suffixArray.Count( queryString );
 
@@ -61,7 +61,8 @@ void SparseVector::set(const string& name, FeatureStatsType value)
   m_fvector[id] = value;
 }
 
-void SparseVector::set(size_t id, FeatureStatsType value) {
+void SparseVector::set(size_t id, FeatureStatsType value)
+{
   assert(m_id_to_name.size() > id);
   m_fvector[id] = value;
 }
@@ -204,7 +205,7 @@ FeatureStats::FeatureStats(const size_t size)
 
 FeatureStats::~FeatureStats()
 {
-   delete [] m_array;
+  delete [] m_array;
 }
 
 void FeatureStats::Copy(const FeatureStats &stats)
 
@@ -31,9 +31,11 @@ Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA  02110-1301  USA
 
 using namespace std;
 
-namespace MosesTuning {
+namespace MosesTuning
+{
 
-std::ostream& operator<<(std::ostream& out, const WordVec& wordVec) {
+std::ostream& operator<<(std::ostream& out, const WordVec& wordVec)
+{
   out << "[";
   for (size_t i = 0; i < wordVec.size(); ++i) {
     out << wordVec[i]->first;
@@ -44,7 +46,8 @@ std::ostream& operator<<(std::ostream& out, const WordVec& wordVec) {
 }
 
 
-void ReferenceSet::Load(const vector<string>& files, Vocab& vocab) {
+void ReferenceSet::Load(const vector<string>& files, Vocab& vocab)
+{
   for (size_t i = 0; i < files.size(); ++i) {
     util::FilePiece fh(files[i].c_str());
     size_t sentenceId = 0;
@@ -55,14 +58,15 @@ void ReferenceSet::Load(const vector<string>& files, Vocab& vocab) {
       } catch (util::EndOfFileException &e) {
         break;
       }
-     AddLine(sentenceId, line, vocab);
-     ++sentenceId;
+      AddLine(sentenceId, line, vocab);
+      ++sentenceId;
     }
   }
 
 }
 
-void ReferenceSet::AddLine(size_t sentenceId, const StringPiece& line, Vocab& vocab) {
+void ReferenceSet::AddLine(size_t sentenceId, const StringPiece& line, Vocab& vocab)
+{
   //cerr << line << endl;
   NgramCounter ngramCounts;
   list<WordVec> openNgrams;
@@ -74,14 +78,14 @@ void ReferenceSet::AddLine(size_t sentenceId, const StringPiece& line, Vocab& vo
     openNgrams.push_front(WordVec());
     for (list<WordVec>::iterator k = openNgrams.begin(); k != openNgrams.end();  ++k) {
       k->push_back(nextTok);
-      ++ngramCounts[*k]; 
+      ++ngramCounts[*k];
     }
     if (openNgrams.size() >=  kBleuNgramOrder) openNgrams.pop_back();
   }
 
   //merge into overall ngram map
   for (NgramCounter::const_iterator ni = ngramCounts.begin();
-    ni != ngramCounts.end(); ++ni) {
+       ni != ngramCounts.end(); ++ni) {
     size_t count = ni->second;
     //cerr << *ni << " " << count <<  endl;
     if (ngramCounts_.size() <= sentenceId) ngramCounts_.resize(sentenceId+1);
@@ -104,8 +108,9 @@ void ReferenceSet::AddLine(size_t sentenceId, const StringPiece& line, Vocab& vo
   //cerr << endl;
 
 }
-  
-size_t ReferenceSet::NgramMatches(size_t sentenceId, const WordVec& ngram, bool clip) const  {
+
+size_t ReferenceSet::NgramMatches(size_t sentenceId, const WordVec& ngram, bool clip) const
+{
   const NgramMap& ngramCounts = ngramCounts_.at(sentenceId);
   NgramMap::const_iterator ngi = ngramCounts.find(ngram);
   if (ngi == ngramCounts.end()) return 0;
@@ -114,7 +119,8 @@ size_t ReferenceSet::NgramMatches(size_t sentenceId, const WordVec& ngram, bool
 
 VertexState::VertexState(): bleuStats(kBleuNgramOrder), targetLength(0) {}
 
-void HgBleuScorer::UpdateMatches(const NgramCounter& counts, vector<FeatureStatsType>& bleuStats ) const {
+void HgBleuScorer::UpdateMatches(const NgramCounter& counts, vector<FeatureStatsType>& bleuStats ) const
+{
   for (NgramCounter::const_iterator ngi = counts.begin(); ngi != counts.end(); ++ngi) {
     //cerr << "Checking: " << *ngi << " matches " << references_.NgramMatches(sentenceId_,*ngi,false) <<  endl;
     size_t order = ngi->first.size();
@@ -124,7 +130,8 @@ void HgBleuScorer::UpdateMatches(const NgramCounter& counts, vector<FeatureStats
   }
 }
 
-size_t HgBleuScorer::GetTargetLength(const Edge& edge) const {
+size_t HgBleuScorer::GetTargetLength(const Edge& edge) const
+{
   size_t targetLength = 0;
   for (size_t i = 0; i < edge.Words().size(); ++i) {
     const Vocab::Entry* word = edge.Words()[i];
@@ -137,7 +144,8 @@ size_t HgBleuScorer::GetTargetLength(const Edge& edge) const {
   return targetLength;
 }
 
-FeatureStatsType HgBleuScorer::Score(const Edge& edge, const Vertex& head, vector<FeatureStatsType>& bleuStats) {
+FeatureStatsType HgBleuScorer::Score(const Edge& edge, const Vertex& head, vector<FeatureStatsType>& bleuStats)
+{
   NgramCounter ngramCounts;
   size_t childId = 0;
   size_t wordId = 0;
@@ -147,7 +155,7 @@ FeatureStatsType HgBleuScorer::Score(const Edge& edge, const Vertex& head, vecto
   bool inRightContext = false;
   list<WordVec> openNgrams;
   const Vocab::Entry* currentWord = NULL;
-  while (wordId < edge.Words().size()) { 
+  while (wordId < edge.Words().size()) {
     currentWord = edge.Words()[wordId];
     if (currentWord != NULL) {
       ++wordId;
@@ -214,7 +222,7 @@ FeatureStatsType HgBleuScorer::Score(const Edge& edge, const Vertex& head, vecto
     }
     if (openNgrams.size() >=  kBleuNgramOrder) openNgrams.pop_back();
   }
-  
+
   //Collect matches
   //This edge
   //cerr << "edge ngrams" << endl;
@@ -227,26 +235,27 @@ FeatureStatsType HgBleuScorer::Score(const Edge& edge, const Vertex& head, vecto
       bleuStats[j] += vertexStates_[edge.Children()[i]].bleuStats[j];
     }
   }
-  
+
 
   FeatureStatsType sourceLength = head.SourceCovered();
   size_t referenceLength = references_.Length(sentenceId_);
-  FeatureStatsType effectiveReferenceLength = 
+  FeatureStatsType effectiveReferenceLength =
     sourceLength / totalSourceLength_ * referenceLength;
 
   bleuStats[bleuStats.size()-1] = effectiveReferenceLength;
-  //backgroundBleu_[backgroundBleu_.size()-1] = 
+  //backgroundBleu_[backgroundBleu_.size()-1] =
   //  backgroundRefLength_ * sourceLength / totalSourceLength_;
   FeatureStatsType bleu = sentenceLevelBackgroundBleu(bleuStats, backgroundBleu_);
 
   return bleu;
 }
 
-void HgBleuScorer::UpdateState(const Edge& winnerEdge, size_t vertexId, const vector<FeatureStatsType>& bleuStats) {
+void HgBleuScorer::UpdateState(const Edge& winnerEdge, size_t vertexId, const vector<FeatureStatsType>& bleuStats)
+{
   //TODO: Maybe more efficient to absorb into the Score() method
   VertexState& vertexState = vertexStates_[vertexId];
   //cerr << "Updating state for " << vertexId << endl;
-  
+
   //leftContext
   int wi = 0;
   const VertexState* childState = NULL;
@@ -263,9 +272,9 @@ void HgBleuScorer::UpdateState(const Edge& winnerEdge, size_t vertexId, const ve
         //start of child state
         childState = &(vertexStates_[winnerEdge.Children()[childi++]]);
         contexti = 0;
-      } 
+      }
       if ((size_t)contexti < childState->leftContext.size()) {
-        vertexState.leftContext.push_back(childState->leftContext[contexti++]); 
+        vertexState.leftContext.push_back(childState->leftContext[contexti++]);
       } else {
         //end of child context
         childState = NULL;
@@ -314,7 +323,8 @@ typedef pair<const Edge*,FeatureStatsType> BackPointer;
  * Recurse through back pointers
  **/
 static void GetBestHypothesis(size_t vertexId, const Graph& graph, const vector<BackPointer>& bps,
-     HgHypothesis* bestHypo) {
+                              HgHypothesis* bestHypo)
+{
   //cerr << "Expanding " << vertexId << " Score: " << bps[vertexId].second << endl;
   //UTIL_THROW_IF(bps[vertexId].second == kMinScore+1, HypergraphException, "Landed at vertex " << vertexId << " which is a dead end");
   if (!bps[vertexId].first) return;
@@ -334,7 +344,7 @@ static void GetBestHypothesis(size_t vertexId, const Graph& graph, const vector<
   }
 }
 
-void Viterbi(const Graph& graph, const SparseVector& weights, float bleuWeight, const ReferenceSet& references , size_t sentenceId, const std::vector<FeatureStatsType>& backgroundBleu,  HgHypothesis* bestHypo) 
+void Viterbi(const Graph& graph, const SparseVector& weights, float bleuWeight, const ReferenceSet& references , size_t sentenceId, const std::vector<FeatureStatsType>& backgroundBleu,  HgHypothesis* bestHypo)
 {
   BackPointer init(NULL,kMinScore);
   vector<BackPointer> backPointers(graph.VertexSize(),init);
@@ -349,7 +359,7 @@ void Viterbi(const Graph& graph, const SparseVector& weights, float bleuWeight,
       //UTIL_THROW(HypergraphException, "Vertex " << vi << " has no incoming edges");
       //If no incoming edges, vertex is a dead end
       backPointers[vi].first = NULL;
-      backPointers[vi].second = kMinScore;  
+      backPointers[vi].second = kMinScore;
     } else {
       //cerr << "\nVertex: " << vi << endl;
       for (size_t ei = 0; ei < incoming.size(); ++ei) {
@@ -362,10 +372,10 @@ void Viterbi(const Graph& graph, const SparseVector& weights, float bleuWeight,
           incomingScore = max(incomingScore + backPointers[childId].second, kMinScore);
         }
         vector<FeatureStatsType> bleuStats(kBleuNgramOrder*2+1);
-       // cerr << "Score: " << incomingScore << " Bleu: ";
-       // if (incomingScore > nonbleuscore) {nonbleuscore = incomingScore; nonbleuid = ei;}
+        // cerr << "Score: " << incomingScore << " Bleu: ";
+        // if (incomingScore > nonbleuscore) {nonbleuscore = incomingScore; nonbleuid = ei;}
         FeatureStatsType totalScore = incomingScore;
-        if (bleuWeight) { 
+        if (bleuWeight) {
           FeatureStatsType bleuScore = bleuScorer.Score(*(incoming[ei]), vertex, bleuStats);
           if (isnan(bleuScore)) {
             cerr << "WARN: bleu score undefined" << endl;
@@ -379,7 +389,7 @@ void Viterbi(const Graph& graph, const SparseVector& weights, float bleuWeight,
           }
           //UTIL_THROW_IF(isnan(bleuScore), util::Exception, "Bleu score undefined, smoothing problem?");
           totalScore += bleuWeight * bleuScore;
-        //  cerr << bleuScore << " Total: " << incomingScore << endl << endl;
+          //  cerr << bleuScore << " Total: " << incomingScore << endl << endl;
           //cerr << "is " << incomingScore << " bs " << bleuScore << endl;
         }
         if (totalScore >= winnerScore) {
Original file line number	Diff line number	Diff line change
`@@ -61,7 +61,8 @@ void SparseVector::set(const string& name, FeatureStatsType value)`
`61`	`61`	`m_fvector[id] = value;`
`62`	`62`	`}`
`63`	`63`
`64`		`-void SparseVector::set(size_t id, FeatureStatsType value) {`
	`64`	`+void SparseVector::set(size_t id, FeatureStatsType value)`
	`65`	`+{`
`65`	`66`	`assert(m_id_to_name.size() > id);`
`66`	`67`	`m_fvector[id] = value;`
`67`	`68`	`}`
`@@ -204,7 +205,7 @@ FeatureStats::FeatureStats(const size_t size)`
`204`	`205`
`205`	`206`	`FeatureStats::~FeatureStats()`
`206`	`207`	`{`
`207`		`- delete [] m_array;`
	`208`	`+ delete [] m_array;`
`208`	`209`	`}`
`209`	`210`
`210`	`211`	`void FeatureStats::Copy(const FeatureStats &stats)`