Hex Artifact Content
Not logged in

Artifact ee93661e27b7758f0592629317a985bfba08c42a:

File src/delta.c part of check-in [dbda8d6ce9] - Initial check-in of m1 sources. by drh on 2007-07-21 14:10:57.

0000: 2f 2a 0a 2a 2a 20 43 6f 70 79 72 69 67 68 74 20  /*.** Copyright 
0010: 28 63 29 20 32 30 30 36 20 44 2e 20 52 69 63 68  (c) 2006 D. Rich
0020: 61 72 64 20 48 69 70 70 0a 2a 2a 0a 2a 2a 20 54  ard Hipp.**.** T
0030: 68 69 73 20 70 72 6f 67 72 61 6d 20 69 73 20 66  his program is f
0040: 72 65 65 20 73 6f 66 74 77 61 72 65 3b 20 79 6f  ree software; yo
0050: 75 20 63 61 6e 20 72 65 64 69 73 74 72 69 62 75  u can redistribu
0060: 74 65 20 69 74 20 61 6e 64 2f 6f 72 0a 2a 2a 20  te it and/or.** 
0070: 6d 6f 64 69 66 79 20 69 74 20 75 6e 64 65 72 20  modify it under 
0080: 74 68 65 20 74 65 72 6d 73 20 6f 66 20 74 68 65  the terms of the
0090: 20 47 4e 55 20 47 65 6e 65 72 61 6c 20 50 75 62   GNU General Pub
00a0: 6c 69 63 0a 2a 2a 20 4c 69 63 65 6e 73 65 20 76  lic.** License v
00b0: 65 72 73 69 6f 6e 20 32 20 61 73 20 70 75 62 6c  ersion 2 as publ
00c0: 69 73 68 65 64 20 62 79 20 74 68 65 20 46 72 65  ished by the Fre
00d0: 65 20 53 6f 66 74 77 61 72 65 20 46 6f 75 6e 64  e Software Found
00e0: 61 74 69 6f 6e 2e 0a 2a 2a 0a 2a 2a 20 54 68 69  ation..**.** Thi
00f0: 73 20 70 72 6f 67 72 61 6d 20 69 73 20 64 69 73  s program is dis
0100: 74 72 69 62 75 74 65 64 20 69 6e 20 74 68 65 20  tributed in the 
0110: 68 6f 70 65 20 74 68 61 74 20 69 74 20 77 69 6c  hope that it wil
0120: 6c 20 62 65 20 75 73 65 66 75 6c 2c 0a 2a 2a 20  l be useful,.** 
0130: 62 75 74 20 57 49 54 48 4f 55 54 20 41 4e 59 20  but WITHOUT ANY 
0140: 57 41 52 52 41 4e 54 59 3b 20 77 69 74 68 6f 75  WARRANTY; withou
0150: 74 20 65 76 65 6e 20 74 68 65 20 69 6d 70 6c 69  t even the impli
0160: 65 64 20 77 61 72 72 61 6e 74 79 20 6f 66 0a 2a  ed warranty of.*
0170: 2a 20 4d 45 52 43 48 41 4e 54 41 42 49 4c 49 54  * MERCHANTABILIT
0180: 59 20 6f 72 20 46 49 54 4e 45 53 53 20 46 4f 52  Y or FITNESS FOR
0190: 20 41 20 50 41 52 54 49 43 55 4c 41 52 20 50 55   A PARTICULAR PU
01a0: 52 50 4f 53 45 2e 20 20 53 65 65 20 74 68 65 20  RPOSE.  See the 
01b0: 47 4e 55 0a 2a 2a 20 47 65 6e 65 72 61 6c 20 50  GNU.** General P
01c0: 75 62 6c 69 63 20 4c 69 63 65 6e 73 65 20 66 6f  ublic License fo
01d0: 72 20 6d 6f 72 65 20 64 65 74 61 69 6c 73 2e 0a  r more details..
01e0: 2a 2a 20 0a 2a 2a 20 59 6f 75 20 73 68 6f 75 6c  ** .** You shoul
01f0: 64 20 68 61 76 65 20 72 65 63 65 69 76 65 64 20  d have received 
0200: 61 20 63 6f 70 79 20 6f 66 20 74 68 65 20 47 4e  a copy of the GN
0210: 55 20 47 65 6e 65 72 61 6c 20 50 75 62 6c 69 63  U General Public
0220: 0a 2a 2a 20 4c 69 63 65 6e 73 65 20 61 6c 6f 6e  .** License alon
0230: 67 20 77 69 74 68 20 74 68 69 73 20 6c 69 62 72  g with this libr
0240: 61 72 79 3b 20 69 66 20 6e 6f 74 2c 20 77 72 69  ary; if not, wri
0250: 74 65 20 74 6f 20 74 68 65 0a 2a 2a 20 46 72 65  te to the.** Fre
0260: 65 20 53 6f 66 74 77 61 72 65 20 46 6f 75 6e 64  e Software Found
0270: 61 74 69 6f 6e 2c 20 49 6e 63 2e 2c 20 35 39 20  ation, Inc., 59 
0280: 54 65 6d 70 6c 65 20 50 6c 61 63 65 20 2d 20 53  Temple Place - S
0290: 75 69 74 65 20 33 33 30 2c 0a 2a 2a 20 42 6f 73  uite 330,.** Bos
02a0: 74 6f 6e 2c 20 4d 41 20 20 30 32 31 31 31 2d 31  ton, MA  02111-1
02b0: 33 30 37 2c 20 55 53 41 2e 0a 2a 2a 0a 2a 2a 20  307, USA..**.** 
02c0: 41 75 74 68 6f 72 20 63 6f 6e 74 61 63 74 20 69  Author contact i
02d0: 6e 66 6f 72 6d 61 74 69 6f 6e 3a 0a 2a 2a 20 20  nformation:.**  
02e0: 20 64 72 68 40 68 77 61 63 69 2e 63 6f 6d 0a 2a   drh@hwaci.com.*
02f0: 2a 20 20 20 68 74 74 70 3a 2f 2f 77 77 77 2e 68  *   http://www.h
0300: 77 61 63 69 2e 63 6f 6d 2f 64 72 68 2f 0a 2a 2a  waci.com/drh/.**
0310: 0a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a  .***************
0320: 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a  ****************
0330: 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a  ****************
0340: 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a  ****************
0350: 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a  ****************
0360: 0a 2a 2a 0a 2a 2a 20 54 68 69 73 20 6d 6f 64 75  .**.** This modu
0370: 6c 65 20 69 6d 70 6c 65 6d 65 6e 74 73 20 74 68  le implements th
0380: 65 20 64 65 6c 74 61 20 63 6f 6d 70 72 65 73 73  e delta compress
0390: 20 61 6c 67 6f 72 69 74 68 6d 2e 0a 2a 2a 0a 2a   algorithm..**.*
03a0: 2a 20 54 68 6f 75 67 68 20 64 65 76 65 6c 6f 70  * Though develop
03b0: 65 64 20 73 70 65 63 69 66 69 63 61 6c 6c 79 20  ed specifically 
03c0: 66 6f 72 20 66 6f 73 73 69 6c 2c 20 74 68 65 20  for fossil, the 
03d0: 63 6f 64 65 20 69 6e 20 74 68 69 73 20 66 69 6c  code in this fil
03e0: 65 0a 2a 2a 20 69 73 20 67 65 6e 65 72 61 6c 6c  e.** is generall
03f0: 79 20 61 70 70 6c 69 61 62 6c 65 20 61 6e 64 20  y appliable and 
0400: 69 73 20 74 68 75 73 20 65 61 73 69 6c 79 20 73  is thus easily s
0410: 65 70 61 72 61 74 65 64 20 66 72 6f 6d 20 74 68  eparated from th
0420: 65 0a 2a 2a 20 66 6f 73 73 69 6c 20 73 6f 75 72  e.** fossil sour
0430: 63 65 20 63 6f 64 65 20 62 61 73 65 2e 20 20 4e  ce code base.  N
0440: 6f 74 68 69 6e 67 20 69 6e 20 74 68 69 73 20 66  othing in this f
0450: 69 6c 65 20 64 65 70 65 6e 64 73 20 6f 6e 20 61  ile depends on a
0460: 6e 79 74 68 69 6e 67 0a 2a 2a 20 65 6c 73 65 20  nything.** else 
0470: 69 6e 20 66 6f 73 73 69 6c 2e 0a 2a 2f 0a 23 69  in fossil..*/.#i
0480: 6e 63 6c 75 64 65 20 3c 73 74 64 69 6f 2e 68 3e  nclude <stdio.h>
0490: 0a 23 69 6e 63 6c 75 64 65 20 3c 61 73 73 65 72  .#include <asser
04a0: 74 2e 68 3e 0a 23 69 6e 63 6c 75 64 65 20 3c 73  t.h>.#include <s
04b0: 74 64 6c 69 62 2e 68 3e 0a 23 69 6e 63 6c 75 64  tdlib.h>.#includ
04c0: 65 20 3c 73 74 72 69 6e 67 2e 68 3e 0a 0a 2f 2a  e <string.h>../*
04d0: 0a 2a 2a 20 4d 61 63 72 6f 73 20 66 6f 72 20 74  .** Macros for t
04e0: 75 72 6e 69 6e 67 20 64 65 62 75 67 67 69 6e 67  urning debugging
04f0: 20 70 72 69 6e 74 66 73 20 6f 6e 20 61 6e 64 20   printfs on and 
0500: 6f 66 66 0a 2a 2f 0a 23 69 66 20 30 0a 23 20 64  off.*/.#if 0.# d
0510: 65 66 69 6e 65 20 44 45 42 55 47 31 28 58 29 20  efine DEBUG1(X) 
0520: 58 0a 23 65 6c 73 65 0a 23 20 64 65 66 69 6e 65  X.#else.# define
0530: 20 44 45 42 55 47 31 28 58 29 0a 23 65 6e 64 69   DEBUG1(X).#endi
0540: 66 0a 23 69 66 20 30 0a 23 64 65 66 69 6e 65 20  f.#if 0.#define 
0550: 44 45 42 55 47 32 28 58 29 20 58 0a 2f 2a 0a 2a  DEBUG2(X) X./*.*
0560: 2a 20 46 6f 72 20 64 65 62 75 67 67 69 6e 67 3a  * For debugging:
0570: 0a 2a 2a 20 50 72 69 6e 74 20 31 36 20 63 68 61  .** Print 16 cha
0580: 72 61 63 74 65 72 73 20 6f 66 20 74 65 78 74 20  racters of text 
0590: 66 72 6f 6d 20 7a 42 75 66 0a 2a 2f 0a 73 74 61  from zBuf.*/.sta
05a0: 74 69 63 20 63 6f 6e 73 74 20 63 68 61 72 20 2a  tic const char *
05b0: 70 72 69 6e 74 31 36 28 63 6f 6e 73 74 20 63 68  print16(const ch
05c0: 61 72 20 2a 7a 29 7b 0a 20 20 69 6e 74 20 69 3b  ar *z){.  int i;
05d0: 0a 20 20 73 74 61 74 69 63 20 63 68 61 72 20 7a  .  static char z
05e0: 42 75 66 5b 32 30 5d 3b 0a 20 20 66 6f 72 28 69  Buf[20];.  for(i
05f0: 3d 30 3b 20 69 3c 31 36 3b 20 69 2b 2b 29 7b 0a  =0; i<16; i++){.
0600: 20 20 20 20 69 66 28 20 7a 5b 69 5d 3e 3d 30 78      if( z[i]>=0x
0610: 32 30 20 26 26 20 7a 5b 69 5d 3c 3d 30 78 37 65  20 && z[i]<=0x7e
0620: 20 29 7b 0a 20 20 20 20 20 20 7a 42 75 66 5b 69   ){.      zBuf[i
0630: 5d 20 3d 20 7a 5b 69 5d 3b 0a 20 20 20 20 7d 65  ] = z[i];.    }e
0640: 6c 73 65 7b 0a 20 20 20 20 20 20 7a 42 75 66 5b  lse{.      zBuf[
0650: 69 5d 20 3d 20 27 2e 27 3b 0a 20 20 20 20 7d 0a  i] = '.';.    }.
0660: 20 20 7d 0a 20 20 7a 42 75 66 5b 69 5d 20 3d 20    }.  zBuf[i] = 
0670: 30 3b 0a 20 20 72 65 74 75 72 6e 20 7a 42 75 66  0;.  return zBuf
0680: 3b 0a 7d 0a 23 65 6c 73 65 0a 23 20 64 65 66 69  ;.}.#else.# defi
0690: 6e 65 20 44 45 42 55 47 32 28 58 29 0a 23 65 6e  ne DEBUG2(X).#en
06a0: 64 69 66 0a 0a 0a 2f 2a 0a 2a 2a 20 54 68 65 20  dif.../*.** The 
06b0: 22 75 33 32 22 20 74 79 70 65 20 6d 75 73 74 20  "u32" type must 
06c0: 62 65 20 61 6e 20 75 6e 73 69 67 6e 65 64 20 33  be an unsigned 3
06d0: 32 2d 62 69 74 20 69 6e 74 65 67 65 72 2e 20 20  2-bit integer.  
06e0: 41 64 6a 75 73 74 20 74 68 69 73 0a 2a 2f 0a 74  Adjust this.*/.t
06f0: 79 70 65 64 65 66 20 75 6e 73 69 67 6e 65 64 20  ypedef unsigned 
0700: 69 6e 74 20 75 33 32 3b 0a 0a 2f 2a 0a 2a 2a 20  int u32;../*.** 
0710: 4d 75 73 74 20 62 65 20 61 20 31 36 2d 62 69 74  Must be a 16-bit
0720: 20 76 61 6c 75 65 20 0a 2a 2f 0a 74 79 70 65 64   value .*/.typed
0730: 65 66 20 73 68 6f 72 74 20 69 6e 74 20 73 31 36  ef short int s16
0740: 3b 0a 74 79 70 65 64 65 66 20 75 6e 73 69 67 6e  ;.typedef unsign
0750: 65 64 20 73 68 6f 72 74 20 69 6e 74 20 75 31 36  ed short int u16
0760: 3b 0a 0a 2f 2a 0a 2a 2a 20 54 68 65 20 77 69 64  ;../*.** The wid
0770: 74 68 20 6f 66 20 61 20 68 61 73 68 20 77 69 6e  th of a hash win
0780: 64 6f 77 20 69 6e 20 62 79 74 65 73 2e 20 20 54  dow in bytes.  T
0790: 68 65 20 61 6c 67 6f 72 69 74 68 6d 20 6f 6e 6c  he algorithm onl
07a0: 79 20 77 6f 72 6b 73 20 69 66 20 74 68 69 73 0a  y works if this.
07b0: 2a 2a 20 69 73 20 61 20 70 6f 77 65 72 20 6f 66  ** is a power of
07c0: 20 32 2e 0a 2a 2f 0a 23 64 65 66 69 6e 65 20 4e   2..*/.#define N
07d0: 48 41 53 48 20 31 36 0a 0a 2f 2a 0a 2a 2a 20 54  HASH 16../*.** T
07e0: 68 65 20 63 75 72 72 65 6e 74 20 73 74 61 74 65  he current state
07f0: 20 6f 66 20 74 68 65 20 72 6f 6c 6c 69 6e 67 20   of the rolling 
0800: 68 61 73 68 2e 0a 2a 2a 0a 2a 2a 20 7a 5b 5d 20  hash..**.** z[] 
0810: 68 6f 6c 64 73 20 74 68 65 20 76 61 6c 75 65 73  holds the values
0820: 20 74 68 61 74 20 68 61 76 65 20 62 65 65 6e 20   that have been 
0830: 68 61 73 68 65 64 2e 20 20 7a 5b 5d 20 69 73 20  hashed.  z[] is 
0840: 61 20 63 69 72 63 75 6c 61 72 20 62 75 66 66 65  a circular buffe
0850: 72 2e 0a 2a 2a 20 7a 5b 69 5d 20 69 73 20 74 68  r..** z[i] is th
0860: 65 20 66 69 72 73 74 20 65 6e 74 72 79 20 61 6e  e first entry an
0870: 64 20 7a 5b 28 69 2b 4e 48 41 53 48 2d 31 29 25  d z[(i+NHASH-1)%
0880: 4e 48 41 53 48 5d 20 69 73 20 74 68 65 20 6c 61  NHASH] is the la
0890: 73 74 20 65 6e 74 72 79 20 6f 66 20 0a 2a 2a 20  st entry of .** 
08a0: 74 68 65 20 77 69 6e 64 6f 77 2e 0a 2a 2a 0a 2a  the window..**.*
08b0: 2a 20 48 61 73 68 2e 61 20 69 73 20 74 68 65 20  * Hash.a is the 
08c0: 73 75 6d 20 6f 66 20 61 6c 6c 20 65 6c 65 6d 65  sum of all eleme
08d0: 6e 74 73 20 6f 66 20 68 61 73 68 2e 7a 5b 5d 2e  nts of hash.z[].
08e0: 20 20 48 61 73 68 2e 62 20 69 73 20 61 20 77 65    Hash.b is a we
08f0: 69 67 68 74 65 64 0a 2a 2a 20 73 75 6d 2e 20 20  ighted.** sum.  
0900: 48 61 73 68 2e 62 20 69 73 20 7a 5b 69 5d 2a 4e  Hash.b is z[i]*N
0910: 48 41 53 48 20 2b 20 7a 5b 69 2b 31 5d 2a 28 4e  HASH + z[i+1]*(N
0920: 48 41 53 48 2d 31 29 20 2b 20 2e 2e 2e 20 2b 20  HASH-1) + ... + 
0930: 7a 5b 69 2b 4e 48 41 53 48 2d 31 5d 2a 31 2e 0a  z[i+NHASH-1]*1..
0940: 2a 2a 20 28 45 61 63 68 20 69 6e 64 65 78 20 66  ** (Each index f
0950: 6f 72 20 7a 5b 5d 20 73 68 6f 75 6c 64 20 62 65  or z[] should be
0960: 20 6d 6f 64 75 6c 65 20 4e 48 41 53 48 2c 20 6f   module NHASH, o
0970: 66 20 63 6f 75 72 73 65 2e 20 20 54 68 65 20 25  f course.  The %
0980: 4e 48 41 53 48 20 6f 70 65 72 61 74 6f 72 0a 2a  NHASH operator.*
0990: 2a 20 69 73 20 6f 6d 69 74 74 65 64 20 69 6e 20  * is omitted in 
09a0: 74 68 65 20 70 72 69 6f 72 20 65 78 70 72 65 73  the prior expres
09b0: 73 69 6f 6e 20 66 6f 72 20 62 72 65 76 69 74 79  sion for brevity
09c0: 2e 29 0a 2a 2f 0a 74 79 70 65 64 65 66 20 73 74  .).*/.typedef st
09d0: 72 75 63 74 20 68 61 73 68 20 68 61 73 68 3b 0a  ruct hash hash;.
09e0: 73 74 72 75 63 74 20 68 61 73 68 20 7b 0a 20 20  struct hash {.  
09f0: 75 31 36 20 61 2c 20 62 3b 20 20 20 20 20 20 20  u16 a, b;       
0a00: 20 20 2f 2a 20 48 61 73 68 20 76 61 6c 75 65 73    /* Hash values
0a10: 20 2a 2f 0a 20 20 75 31 36 20 69 3b 20 20 20 20   */.  u16 i;    
0a20: 20 20 20 20 20 20 20 20 2f 2a 20 53 74 61 72 74          /* Start
0a30: 20 6f 66 20 74 68 65 20 68 61 73 68 20 77 69 6e   of the hash win
0a40: 64 6f 77 20 2a 2f 0a 20 20 63 68 61 72 20 7a 5b  dow */.  char z[
0a50: 4e 48 41 53 48 5d 3b 20 20 20 20 2f 2a 20 54 68  NHASH];    /* Th
0a60: 65 20 76 61 6c 75 65 73 20 74 68 61 74 20 68 61  e values that ha
0a70: 76 65 20 62 65 65 6e 20 68 61 73 68 65 64 20 2a  ve been hashed *
0a80: 2f 0a 7d 3b 0a 0a 2f 2a 0a 2a 2a 20 49 6e 69 74  /.};../*.** Init
0a90: 69 61 6c 69 7a 65 20 74 68 65 20 72 6f 6c 6c 69  ialize the rolli
0aa0: 6e 67 20 68 61 73 68 20 75 73 69 6e 67 20 74 68  ng hash using th
0ab0: 65 20 66 69 72 73 74 20 4e 48 41 53 48 20 63 68  e first NHASH ch
0ac0: 61 72 61 63 74 65 72 73 20 6f 66 20 7a 5b 5d 0a  aracters of z[].
0ad0: 2a 2f 0a 73 74 61 74 69 63 20 76 6f 69 64 20 68  */.static void h
0ae0: 61 73 68 5f 69 6e 69 74 28 68 61 73 68 20 2a 70  ash_init(hash *p
0af0: 48 61 73 68 2c 20 63 6f 6e 73 74 20 63 68 61 72  Hash, const char
0b00: 20 2a 7a 29 7b 0a 20 20 75 31 36 20 61 2c 20 62   *z){.  u16 a, b
0b10: 2c 20 69 3b 0a 20 20 61 20 3d 20 62 20 3d 20 30  , i;.  a = b = 0
0b20: 3b 0a 20 20 66 6f 72 28 69 3d 30 3b 20 69 3c 4e  ;.  for(i=0; i<N
0b30: 48 41 53 48 3b 20 69 2b 2b 29 7b 0a 20 20 20 20  HASH; i++){.    
0b40: 61 20 2b 3d 20 7a 5b 69 5d 3b 0a 20 20 20 20 62  a += z[i];.    b
0b50: 20 2b 3d 20 28 4e 48 41 53 48 2d 69 29 2a 7a 5b   += (NHASH-i)*z[
0b60: 69 5d 3b 0a 20 20 20 20 70 48 61 73 68 2d 3e 7a  i];.    pHash->z
0b70: 5b 69 5d 20 3d 20 7a 5b 69 5d 3b 0a 20 20 7d 0a  [i] = z[i];.  }.
0b80: 20 20 70 48 61 73 68 2d 3e 61 20 3d 20 61 20 26    pHash->a = a &
0b90: 20 30 78 66 66 66 66 3b 0a 20 20 70 48 61 73 68   0xffff;.  pHash
0ba0: 2d 3e 62 20 3d 20 62 20 26 20 30 78 66 66 66 66  ->b = b & 0xffff
0bb0: 3b 0a 20 20 70 48 61 73 68 2d 3e 69 20 3d 20 30  ;.  pHash->i = 0
0bc0: 3b 0a 7d 0a 0a 2f 2a 0a 2a 2a 20 41 64 76 61 6e  ;.}../*.** Advan
0bd0: 63 65 20 74 68 65 20 72 6f 6c 6c 69 6e 67 20 68  ce the rolling h
0be0: 61 73 68 20 62 79 20 61 20 73 69 6e 67 6c 65 20  ash by a single 
0bf0: 63 68 61 72 61 63 74 65 72 20 22 63 22 0a 2a 2f  character "c".*/
0c00: 0a 73 74 61 74 69 63 20 76 6f 69 64 20 68 61 73  .static void has
0c10: 68 5f 6e 65 78 74 28 68 61 73 68 20 2a 70 48 61  h_next(hash *pHa
0c20: 73 68 2c 20 69 6e 74 20 63 29 7b 0a 20 20 75 31  sh, int c){.  u1
0c30: 36 20 6f 6c 64 20 3d 20 70 48 61 73 68 2d 3e 7a  6 old = pHash->z
0c40: 5b 70 48 61 73 68 2d 3e 69 5d 3b 0a 20 20 70 48  [pHash->i];.  pH
0c50: 61 73 68 2d 3e 7a 5b 70 48 61 73 68 2d 3e 69 5d  ash->z[pHash->i]
0c60: 20 3d 20 63 3b 0a 20 20 70 48 61 73 68 2d 3e 69   = c;.  pHash->i
0c70: 20 3d 20 28 70 48 61 73 68 2d 3e 69 2b 31 29 26   = (pHash->i+1)&
0c80: 28 4e 48 41 53 48 2d 31 29 3b 0a 20 20 70 48 61  (NHASH-1);.  pHa
0c90: 73 68 2d 3e 61 20 3d 20 70 48 61 73 68 2d 3e 61  sh->a = pHash->a
0ca0: 20 2d 20 6f 6c 64 20 2b 20 63 3b 0a 20 20 70 48   - old + c;.  pH
0cb0: 61 73 68 2d 3e 62 20 3d 20 70 48 61 73 68 2d 3e  ash->b = pHash->
0cc0: 62 20 2d 20 4e 48 41 53 48 2a 6f 6c 64 20 2b 20  b - NHASH*old + 
0cd0: 70 48 61 73 68 2d 3e 61 3b 0a 7d 0a 0a 2f 2a 0a  pHash->a;.}../*.
0ce0: 2a 2a 20 52 65 74 75 72 6e 20 61 20 33 32 2d 62  ** Return a 32-b
0cf0: 69 74 20 68 61 73 68 20 76 61 6c 75 65 0a 2a 2f  it hash value.*/
0d00: 0a 73 74 61 74 69 63 20 75 33 32 20 68 61 73 68  .static u32 hash
0d10: 5f 33 32 62 69 74 28 68 61 73 68 20 2a 70 48 61  _32bit(hash *pHa
0d20: 73 68 29 7b 0a 20 20 72 65 74 75 72 6e 20 28 70  sh){.  return (p
0d30: 48 61 73 68 2d 3e 61 20 26 20 30 78 66 66 66 66  Hash->a & 0xffff
0d40: 29 20 7c 20 28 28 28 75 33 32 29 28 70 48 61 73  ) | (((u32)(pHas
0d50: 68 2d 3e 62 20 26 20 30 78 66 66 66 66 29 29 3c  h->b & 0xffff))<
0d60: 3c 31 36 29 3b 0a 7d 0a 0a 2f 2a 0a 2a 2a 20 57  <16);.}../*.** W
0d70: 72 69 74 65 20 61 6e 20 62 61 73 65 2d 36 34 20  rite an base-64 
0d80: 69 6e 74 65 67 65 72 20 69 6e 74 6f 20 74 68 65  integer into the
0d90: 20 67 69 76 65 6e 20 62 75 66 66 65 72 2e 0a 2a   given buffer..*
0da0: 2f 0a 73 74 61 74 69 63 20 76 6f 69 64 20 70 75  /.static void pu
0db0: 74 49 6e 74 28 75 6e 73 69 67 6e 65 64 20 69 6e  tInt(unsigned in
0dc0: 74 20 76 2c 20 63 68 61 72 20 2a 2a 70 7a 29 7b  t v, char **pz){
0dd0: 0a 20 20 73 74 61 74 69 63 20 63 6f 6e 73 74 20  .  static const 
0de0: 63 68 61 72 20 7a 44 69 67 69 74 73 5b 5d 20 3d  char zDigits[] =
0df0: 20 0a 20 20 20 20 22 30 31 32 33 34 35 36 37 38   .    "012345678
0e00: 39 41 42 43 44 45 46 47 48 49 4a 4b 4c 4d 4e 4f  9ABCDEFGHIJKLMNO
0e10: 50 51 52 53 54 55 56 57 58 59 5a 5f 61 62 63 64  PQRSTUVWXYZ_abcd
0e20: 65 66 67 68 69 6a 6b 6c 6d 6e 6f 70 71 72 73 74  efghijklmnopqrst
0e30: 75 76 77 78 79 7a 7e 22 3b 0a 20 20 2f 2a 20 20  uvwxyz~";.  /*  
0e40: 31 32 33 34 35 36 37 38 39 20 31 32 33 34 35 36  123456789 123456
0e50: 37 38 39 20 31 32 33 34 35 36 37 38 39 20 31 32  789 123456789 12
0e60: 33 34 35 36 37 38 39 20 31 32 33 34 35 36 37 38  3456789 12345678
0e70: 39 20 31 32 33 34 35 36 37 38 39 20 31 32 33 20  9 123456789 123 
0e80: 2a 2f 0a 20 20 69 6e 74 20 69 2c 20 6a 3b 0a 20  */.  int i, j;. 
0e90: 20 63 68 61 72 20 7a 42 75 66 5b 32 30 5d 3b 0a   char zBuf[20];.
0ea0: 20 20 69 66 28 20 76 3d 3d 30 20 29 7b 0a 20 20    if( v==0 ){.  
0eb0: 20 20 2a 28 2a 70 7a 29 2b 2b 20 3d 20 27 30 27    *(*pz)++ = '0'
0ec0: 3b 0a 20 20 20 20 72 65 74 75 72 6e 3b 0a 20 20  ;.    return;.  
0ed0: 7d 0a 20 20 66 6f 72 28 69 3d 30 3b 20 76 3e 30  }.  for(i=0; v>0
0ee0: 3b 20 69 2b 2b 2c 20 76 3e 3e 3d 36 29 7b 0a 20  ; i++, v>>=6){. 
0ef0: 20 20 20 7a 42 75 66 5b 69 5d 20 3d 20 7a 44 69     zBuf[i] = zDi
0f00: 67 69 74 73 5b 76 26 30 78 33 66 5d 3b 0a 20 20  gits[v&0x3f];.  
0f10: 7d 0a 20 20 66 6f 72 28 6a 3d 69 2d 31 3b 20 6a  }.  for(j=i-1; j
0f20: 3e 3d 30 3b 20 6a 2d 2d 29 7b 0a 20 20 20 20 2a  >=0; j--){.    *
0f30: 28 2a 70 7a 29 2b 2b 20 3d 20 7a 42 75 66 5b 6a  (*pz)++ = zBuf[j
0f40: 5d 3b 0a 20 20 7d 0a 7d 0a 0a 2f 2a 0a 2a 2a 20  ];.  }.}../*.** 
0f50: 52 65 61 64 20 62 79 74 65 73 20 66 72 6f 6d 20  Read bytes from 
0f60: 2a 70 7a 20 61 6e 64 20 63 6f 6e 76 65 72 74 20  *pz and convert 
0f70: 74 68 65 6d 20 69 6e 74 6f 20 61 20 70 6f 73 69  them into a posi
0f80: 74 69 76 65 20 69 6e 74 65 67 65 72 2e 20 20 57  tive integer.  W
0f90: 68 65 6e 0a 2a 2a 20 66 69 6e 69 73 68 65 64 2c  hen.** finished,
0fa0: 20 6c 65 61 76 65 20 2a 70 7a 20 70 6f 69 6e 74   leave *pz point
0fb0: 69 6e 67 20 74 6f 20 74 68 65 20 66 69 72 73 74  ing to the first
0fc0: 20 63 68 61 72 61 63 74 65 72 20 70 61 73 74 20   character past 
0fd0: 74 68 65 20 65 6e 64 20 6f 66 0a 2a 2a 20 74 68  the end of.** th
0fe0: 65 20 69 6e 74 65 67 65 72 2e 20 20 54 68 65 20  e integer.  The 
0ff0: 2a 70 4c 65 6e 20 70 61 72 61 6d 65 74 65 72 20  *pLen parameter 
1000: 68 6f 6c 64 73 20 74 68 65 20 6c 65 6e 67 74 68  holds the length
1010: 20 6f 66 20 74 68 65 20 73 74 72 69 6e 67 0a 2a   of the string.*
1020: 2a 20 69 6e 20 2a 70 7a 20 61 6e 64 20 69 73 20  * in *pz and is 
1030: 64 65 63 72 65 6d 65 6e 74 65 64 20 6f 6e 63 65  decremented once
1040: 20 66 6f 72 20 65 61 63 68 20 63 68 61 72 61 63   for each charac
1050: 74 65 72 20 69 6e 20 74 68 65 20 69 6e 74 65 67  ter in the integ
1060: 65 72 2e 0a 2a 2f 0a 73 74 61 74 69 63 20 75 6e  er..*/.static un
1070: 73 69 67 6e 65 64 20 69 6e 74 20 67 65 74 49 6e  signed int getIn
1080: 74 28 63 6f 6e 73 74 20 63 68 61 72 20 2a 2a 70  t(const char **p
1090: 7a 2c 20 69 6e 74 20 2a 70 4c 65 6e 29 7b 0a 20  z, int *pLen){. 
10a0: 20 73 74 61 74 69 63 20 63 6f 6e 73 74 20 73 69   static const si
10b0: 67 6e 65 64 20 63 68 61 72 20 7a 56 61 6c 75 65  gned char zValue
10c0: 5b 5d 20 3d 20 7b 0a 20 20 20 20 2d 31 2c 20 2d  [] = {.    -1, -
10d0: 31 2c 20 2d 31 2c 20 2d 31 2c 20 2d 31 2c 20 2d  1, -1, -1, -1, -
10e0: 31 2c 20 2d 31 2c 20 2d 31 2c 20 20 20 2d 31 2c  1, -1, -1,   -1,
10f0: 20 2d 31 2c 20 2d 31 2c 20 2d 31 2c 20 2d 31 2c   -1, -1, -1, -1,
1100: 20 2d 31 2c 20 2d 31 2c 20 2d 31 2c 0a 20 20 20   -1, -1, -1,.   
1110: 20 2d 31 2c 20 2d 31 2c 20 2d 31 2c 20 2d 31 2c   -1, -1, -1, -1,
1120: 20 2d 31 2c 20 2d 31 2c 20 2d 31 2c 20 2d 31 2c   -1, -1, -1, -1,
1130: 20 20 20 2d 31 2c 20 2d 31 2c 20 2d 31 2c 20 2d     -1, -1, -1, -
1140: 31 2c 20 2d 31 2c 20 2d 31 2c 20 2d 31 2c 20 2d  1, -1, -1, -1, -
1150: 31 2c 0a 20 20 20 20 2d 31 2c 20 2d 31 2c 20 2d  1,.    -1, -1, -
1160: 31 2c 20 2d 31 2c 20 2d 31 2c 20 2d 31 2c 20 2d  1, -1, -1, -1, -
1170: 31 2c 20 2d 31 2c 20 20 20 2d 31 2c 20 2d 31 2c  1, -1,   -1, -1,
1180: 20 2d 31 2c 20 2d 31 2c 20 2d 31 2c 20 2d 31 2c   -1, -1, -1, -1,
1190: 20 2d 31 2c 20 2d 31 2c 0a 20 20 20 20 20 30 2c   -1, -1,.     0,
11a0: 20 20 31 2c 20 20 32 2c 20 20 33 2c 20 20 34 2c    1,  2,  3,  4,
11b0: 20 20 35 2c 20 20 36 2c 20 20 37 2c 20 20 20 20    5,  6,  7,    
11c0: 38 2c 20 20 39 2c 20 2d 31 2c 20 2d 31 2c 20 2d  8,  9, -1, -1, -
11d0: 31 2c 20 2d 31 2c 20 2d 31 2c 20 2d 31 2c 0a 20  1, -1, -1, -1,. 
11e0: 20 20 20 2d 31 2c 20 31 30 2c 20 31 31 2c 20 31     -1, 10, 11, 1
11f0: 32 2c 20 31 33 2c 20 31 34 2c 20 31 35 2c 20 31  2, 13, 14, 15, 1
1200: 36 2c 20 20 20 31 37 2c 20 31 38 2c 20 31 39 2c  6,   17, 18, 19,
1210: 20 32 30 2c 20 32 31 2c 20 32 32 2c 20 32 33 2c   20, 21, 22, 23,
1220: 20 32 34 2c 0a 20 20 20 20 32 35 2c 20 32 36 2c   24,.    25, 26,
1230: 20 32 37 2c 20 32 38 2c 20 32 39 2c 20 33 30 2c   27, 28, 29, 30,
1240: 20 33 31 2c 20 33 32 2c 20 20 20 33 33 2c 20 33   31, 32,   33, 3
1250: 34 2c 20 33 35 2c 20 2d 31 2c 20 2d 31 2c 20 2d  4, 35, -1, -1, -
1260: 31 2c 20 2d 31 2c 20 33 36 2c 0a 20 20 20 20 2d  1, -1, 36,.    -
1270: 31 2c 20 33 37 2c 20 33 38 2c 20 33 39 2c 20 34  1, 37, 38, 39, 4
1280: 30 2c 20 34 31 2c 20 34 32 2c 20 34 33 2c 20 20  0, 41, 42, 43,  
1290: 20 34 34 2c 20 34 35 2c 20 34 36 2c 20 34 37 2c   44, 45, 46, 47,
12a0: 20 34 38 2c 20 34 39 2c 20 35 30 2c 20 35 31 2c   48, 49, 50, 51,
12b0: 0a 20 20 20 20 35 32 2c 20 35 33 2c 20 35 34 2c  .    52, 53, 54,
12c0: 20 35 35 2c 20 35 36 2c 20 35 37 2c 20 35 38 2c   55, 56, 57, 58,
12d0: 20 35 39 2c 20 20 20 36 30 2c 20 36 31 2c 20 36   59,   60, 61, 6
12e0: 32 2c 20 2d 31 2c 20 2d 31 2c 20 2d 31 2c 20 36  2, -1, -1, -1, 6
12f0: 33 2c 20 2d 31 2c 0a 20 20 7d 3b 0a 20 20 75 6e  3, -1,.  };.  un
1300: 73 69 67 6e 65 64 20 69 6e 74 20 76 20 3d 20 30  signed int v = 0
1310: 3b 0a 20 20 69 6e 74 20 63 3b 0a 20 20 75 6e 73  ;.  int c;.  uns
1320: 69 67 6e 65 64 20 63 68 61 72 20 2a 7a 20 3d 20  igned char *z = 
1330: 28 75 6e 73 69 67 6e 65 64 20 63 68 61 72 2a 29  (unsigned char*)
1340: 2a 70 7a 3b 0a 20 20 75 6e 73 69 67 6e 65 64 20  *pz;.  unsigned 
1350: 63 68 61 72 20 2a 7a 53 74 61 72 74 20 3d 20 7a  char *zStart = z
1360: 3b 0a 20 20 77 68 69 6c 65 28 20 28 63 20 3d 20  ;.  while( (c = 
1370: 7a 56 61 6c 75 65 5b 30 78 37 66 26 2a 28 7a 2b  zValue[0x7f&*(z+
1380: 2b 29 5d 29 3e 3d 30 20 29 7b 0a 20 20 20 20 20  +)])>=0 ){.     
1390: 76 20 3d 20 28 76 3c 3c 36 29 20 2b 20 63 3b 0a  v = (v<<6) + c;.
13a0: 20 20 7d 0a 20 20 7a 2d 2d 3b 0a 20 20 2a 70 4c    }.  z--;.  *pL
13b0: 65 6e 20 2d 3d 20 7a 20 2d 20 7a 53 74 61 72 74  en -= z - zStart
13c0: 3b 0a 20 20 2a 70 7a 20 3d 20 28 63 68 61 72 2a  ;.  *pz = (char*
13d0: 29 7a 3b 0a 20 20 72 65 74 75 72 6e 20 76 3b 0a  )z;.  return v;.
13e0: 7d 0a 0a 2f 2a 0a 2a 2a 20 52 65 74 75 72 6e 20  }../*.** Return 
13f0: 74 68 65 20 6e 75 6d 62 65 72 20 64 69 67 69 74  the number digit
1400: 73 20 69 6e 20 74 68 65 20 62 61 73 65 2d 34 36  s in the base-46
1410: 20 72 65 70 72 65 73 65 6e 74 61 74 69 6f 6e 20   representation 
1420: 6f 66 20 61 20 70 6f 73 69 74 69 76 65 20 69 6e  of a positive in
1430: 74 65 67 65 72 0a 2a 2f 0a 73 74 61 74 69 63 20  teger.*/.static 
1440: 69 6e 74 20 64 69 67 69 74 5f 63 6f 75 6e 74 28  int digit_count(
1450: 69 6e 74 20 76 29 7b 0a 20 20 75 6e 73 69 67 6e  int v){.  unsign
1460: 65 64 20 69 6e 74 20 69 2c 20 78 3b 0a 20 20 66  ed int i, x;.  f
1470: 6f 72 28 69 3d 31 2c 20 78 3d 36 34 3b 20 76 3e  or(i=1, x=64; v>
1480: 3d 78 3b 20 69 2b 2b 2c 20 78 20 3c 3c 3d 20 36  =x; i++, x <<= 6
1490: 29 7b 7d 0a 20 20 72 65 74 75 72 6e 20 69 3b 0a  ){}.  return i;.
14a0: 7d 0a 0a 2f 2a 0a 2a 2a 20 43 6f 6d 70 75 74 65  }../*.** Compute
14b0: 20 61 20 33 32 2d 62 69 74 20 63 68 65 63 6b 73   a 32-bit checks
14c0: 75 6d 20 6f 6e 20 74 68 65 20 4e 2d 62 79 74 65  um on the N-byte
14d0: 20 62 75 66 66 65 72 2e 20 20 52 65 74 75 72 6e   buffer.  Return
14e0: 20 74 68 65 20 72 65 73 75 6c 74 2e 0a 2a 2f 0a   the result..*/.
14f0: 73 74 61 74 69 63 20 75 6e 73 69 67 6e 65 64 20  static unsigned 
1500: 69 6e 74 20 63 68 65 63 6b 73 75 6d 28 63 6f 6e  int checksum(con
1510: 73 74 20 63 68 61 72 20 2a 7a 49 6e 2c 20 69 6e  st char *zIn, in
1520: 74 20 4e 29 7b 0a 20 20 63 6f 6e 73 74 20 75 6e  t N){.  const un
1530: 73 69 67 6e 65 64 20 63 68 61 72 20 2a 7a 20 3d  signed char *z =
1540: 20 28 63 6f 6e 73 74 20 75 6e 73 69 67 6e 65 64   (const unsigned
1550: 20 63 68 61 72 2a 29 7a 49 6e 3b 0a 20 20 75 6e   char*)zIn;.  un
1560: 73 69 67 6e 65 64 20 69 6e 74 20 73 75 6d 20 3d  signed int sum =
1570: 20 30 3b 0a 20 20 77 68 69 6c 65 28 20 4e 3e 3d   0;.  while( N>=
1580: 34 20 29 7b 0a 20 20 20 20 73 75 6d 20 2b 3d 20  4 ){.    sum += 
1590: 28 7a 5b 30 5d 3c 3c 32 34 29 20 7c 20 28 7a 5b  (z[0]<<24) | (z[
15a0: 31 5d 3c 3c 31 36 29 20 7c 20 28 7a 5b 32 5d 3c  1]<<16) | (z[2]<
15b0: 3c 38 29 20 7c 20 7a 5b 33 5d 3b 0a 20 20 20 20  <8) | z[3];.    
15c0: 7a 20 2b 3d 20 34 3b 0a 20 20 20 20 4e 20 2d 3d  z += 4;.    N -=
15d0: 20 34 3b 0a 20 20 7d 0a 20 20 69 66 28 20 4e 3e   4;.  }.  if( N>
15e0: 30 20 29 7b 0a 20 20 20 20 75 6e 73 69 67 6e 65  0 ){.    unsigne
15f0: 64 20 63 68 61 72 20 7a 42 75 66 5b 34 5d 3b 0a  d char zBuf[4];.
1600: 20 20 20 20 6d 65 6d 73 65 74 28 7a 42 75 66 2c      memset(zBuf,
1610: 20 30 2c 20 73 69 7a 65 6f 66 28 7a 42 75 66 29   0, sizeof(zBuf)
1620: 29 3b 0a 20 20 20 20 6d 65 6d 63 70 79 28 7a 42  );.    memcpy(zB
1630: 75 66 2c 20 7a 2c 20 4e 29 3b 0a 20 20 20 20 7a  uf, z, N);.    z
1640: 20 3d 20 7a 42 75 66 3b 0a 20 20 20 20 73 75 6d   = zBuf;.    sum
1650: 20 2b 3d 20 28 7a 5b 30 5d 3c 3c 32 34 29 20 7c   += (z[0]<<24) |
1660: 20 28 7a 5b 31 5d 3c 3c 31 36 29 20 7c 20 28 7a   (z[1]<<16) | (z
1670: 5b 32 5d 3c 3c 38 29 20 7c 20 7a 5b 33 5d 3b 0a  [2]<<8) | z[3];.
1680: 20 20 7d 0a 20 20 72 65 74 75 72 6e 20 73 75 6d    }.  return sum
1690: 3b 0a 7d 0a 0a 2f 2a 0a 2a 2a 20 4d 61 78 69 6d  ;.}../*.** Maxim
16a0: 75 6d 20 6e 75 6d 62 65 72 20 6f 66 20 6c 61 6e  um number of lan
16b0: 64 6d 61 72 6b 73 20 74 6f 20 73 65 74 20 69 6e  dmarks to set in
16c0: 20 74 68 65 20 73 6f 75 72 63 65 20 66 69 6c 65   the source file
16d0: 2e 0a 2a 2f 0a 23 64 65 66 69 6e 65 20 4d 58 5f  ..*/.#define MX_
16e0: 4c 41 4e 44 4d 41 52 4b 20 28 31 30 32 34 2a 31  LANDMARK (1024*1
16f0: 32 38 29 0a 0a 2f 2a 0a 2a 2a 20 43 72 65 61 74  28)../*.** Creat
1700: 65 20 61 20 6e 65 77 20 64 65 6c 74 61 2e 0a 2a  e a new delta..*
1710: 2a 0a 2a 2a 20 54 68 65 20 64 65 6c 74 61 20 69  *.** The delta i
1720: 73 20 77 72 69 74 74 65 6e 20 69 6e 74 6f 20 61  s written into a
1730: 20 70 72 65 61 6c 6c 6f 63 61 74 65 64 20 62 75   preallocated bu
1740: 66 66 65 72 2c 20 7a 44 65 6c 74 61 2c 20 77 68  ffer, zDelta, wh
1750: 69 63 68 20 0a 2a 2a 20 73 68 6f 75 6c 64 20 62  ich .** should b
1760: 65 20 61 74 20 6c 65 61 73 74 20 36 30 20 62 79  e at least 60 by
1770: 74 65 73 20 6c 6f 6e 67 65 72 20 74 68 61 6e 20  tes longer than 
1780: 74 68 65 20 74 61 72 67 65 74 20 66 69 6c 65 2c  the target file,
1790: 20 7a 4f 75 74 2e 0a 2a 2a 20 54 68 65 20 64 65   zOut..** The de
17a0: 6c 74 61 20 73 74 72 69 6e 67 20 77 69 6c 6c 20  lta string will 
17b0: 62 65 20 4e 55 4c 2d 74 65 72 6d 69 6e 61 74 65  be NUL-terminate
17c0: 64 2c 20 62 75 74 20 69 74 20 6d 69 67 68 74 20  d, but it might 
17d0: 61 6c 73 6f 20 63 6f 6e 74 61 69 6e 0a 2a 2a 20  also contain.** 
17e0: 65 6d 62 65 64 64 65 64 20 4e 55 4c 20 63 68 61  embedded NUL cha
17f0: 72 61 63 74 65 72 73 20 69 66 20 65 69 74 68 65  racters if eithe
1800: 72 20 74 68 65 20 7a 53 72 63 20 6f 72 20 7a 4f  r the zSrc or zO
1810: 75 74 20 66 69 6c 65 73 20 61 72 65 0a 2a 2a 20  ut files are.** 
1820: 62 69 6e 61 72 79 2e 20 20 54 68 69 73 20 66 75  binary.  This fu
1830: 6e 63 74 69 6f 6e 20 72 65 74 75 72 6e 73 20 74  nction returns t
1840: 68 65 20 6c 65 6e 67 74 68 20 6f 66 20 74 68 65  he length of the
1850: 20 64 65 6c 74 61 20 73 74 72 69 6e 67 0a 2a 2a   delta string.**
1860: 20 69 6e 20 62 79 74 65 73 2c 20 65 78 63 6c 75   in bytes, exclu
1870: 64 69 6e 67 20 74 68 65 20 66 69 6e 61 6c 20 4e  ding the final N
1880: 55 4c 20 74 65 72 6d 69 6e 61 74 6f 72 20 63 68  UL terminator ch
1890: 61 72 61 63 74 65 72 2e 0a 2a 2a 0a 2a 2a 20 4f  aracter..**.** O
18a0: 75 74 70 75 74 20 46 6f 72 6d 61 74 3a 0a 2a 2a  utput Format:.**
18b0: 0a 2a 2a 20 54 68 65 20 64 65 6c 74 61 20 62 65  .** The delta be
18c0: 67 69 6e 73 20 77 69 74 68 20 61 20 62 61 73 65  gins with a base
18d0: 36 34 20 6e 75 6d 62 65 72 20 66 6f 6c 6c 6f 77  64 number follow
18e0: 65 64 20 62 79 20 61 20 6e 65 77 6c 69 6e 65 2e  ed by a newline.
18f0: 20 20 54 68 69 73 0a 2a 2a 20 6e 75 6d 62 65 72    This.** number
1900: 20 69 73 20 74 68 65 20 6e 75 6d 62 65 72 20 6f   is the number o
1910: 66 20 62 79 74 65 73 20 69 6e 20 74 68 65 20 54  f bytes in the T
1920: 41 52 47 45 54 20 66 69 6c 65 2e 20 20 54 68 75  ARGET file.  Thu
1930: 73 2c 20 67 69 76 65 6e 20 61 0a 2a 2a 20 64 65  s, given a.** de
1940: 6c 74 61 20 66 69 6c 65 20 7a 2c 20 61 20 70 72  lta file z, a pr
1950: 6f 67 72 61 6d 20 63 61 6e 20 63 6f 6d 70 75 74  ogram can comput
1960: 65 20 74 68 65 20 73 69 7a 65 20 6f 66 20 74 68  e the size of th
1970: 65 20 6f 75 74 70 75 74 20 66 69 6c 65 0a 2a 2a  e output file.**
1980: 20 73 69 6d 70 6c 79 20 62 79 20 63 61 6c 6c 69   simply by calli
1990: 6e 67 20 72 65 61 64 69 6e 67 20 74 68 65 20 66  ng reading the f
19a0: 69 72 73 74 20 6c 69 6e 65 20 61 6e 64 20 64 65  irst line and de
19b0: 63 6f 64 69 6e 67 20 74 68 65 20 62 61 73 65 2d  coding the base-
19c0: 36 34 0a 2a 2a 20 6e 75 6d 62 65 72 20 66 6f 75  64.** number fou
19d0: 6e 64 20 74 68 65 72 65 2e 20 20 54 68 65 20 64  nd there.  The d
19e0: 65 6c 74 61 5f 6f 75 74 70 75 74 5f 73 69 7a 65  elta_output_size
19f0: 28 29 20 72 6f 75 74 69 6e 65 20 64 6f 65 73 20  () routine does 
1a00: 65 78 61 63 74 6c 79 0a 2a 2a 20 74 68 69 73 2e  exactly.** this.
1a10: 0a 2a 2a 0a 2a 2a 20 41 66 74 65 72 20 74 68 65  .**.** After the
1a20: 20 69 6e 69 74 69 61 6c 20 73 69 7a 65 20 6e 75   initial size nu
1a30: 6d 62 65 72 2c 20 74 68 65 20 64 65 6c 74 61 20  mber, the delta 
1a40: 63 6f 6e 73 69 73 74 73 20 6f 66 20 61 20 73 65  consists of a se
1a50: 72 69 65 73 20 6f 66 0a 2a 2a 20 6c 69 74 65 72  ries of.** liter
1a60: 61 6c 20 74 65 78 74 20 73 65 67 6d 65 6e 74 73  al text segments
1a70: 20 61 6e 64 20 63 6f 6d 6d 61 6e 64 73 20 74 6f   and commands to
1a80: 20 63 6f 70 79 20 66 72 6f 6d 20 74 68 65 20 53   copy from the S
1a90: 4f 55 52 43 45 20 66 69 6c 65 2e 20 20 0a 2a 2a  OURCE file.  .**
1aa0: 20 41 20 63 6f 70 79 20 63 6f 6d 6d 61 6e 64 20   A copy command 
1ab0: 6c 6f 6f 6b 73 20 6c 69 6b 65 20 74 68 69 73 3a  looks like this:
1ac0: 0a 2a 2a 0a 2a 2a 20 20 20 20 20 4e 4e 4e 40 4d  .**.**     NNN@M
1ad0: 4d 4d 2c 0a 2a 2a 0a 2a 2a 20 77 68 65 72 65 20  MM,.**.** where 
1ae0: 4e 4e 4e 20 69 73 20 74 68 65 20 6e 75 6d 62 65  NNN is the numbe
1af0: 72 20 6f 66 20 62 79 74 65 73 20 74 6f 20 62 65  r of bytes to be
1b00: 20 63 6f 70 69 65 64 20 61 6e 64 20 4d 4d 4d 20   copied and MMM 
1b10: 69 73 20 74 68 65 20 6f 66 66 73 65 74 0a 2a 2a  is the offset.**
1b20: 20 69 6e 74 6f 20 74 68 65 20 73 6f 75 72 63 65   into the source
1b30: 20 66 69 6c 65 20 6f 66 20 74 68 65 20 66 69 72   file of the fir
1b40: 73 74 20 62 79 74 65 20 28 62 6f 74 68 20 62 61  st byte (both ba
1b50: 73 65 2d 36 34 29 2e 20 20 20 49 66 20 4e 4e 4e  se-64).   If NNN
1b60: 20 69 73 20 30 0a 2a 2a 20 69 74 20 6d 65 61 6e   is 0.** it mean
1b70: 73 20 63 6f 70 79 20 74 68 65 20 72 65 73 74 20  s copy the rest 
1b80: 6f 66 20 74 68 65 20 69 6e 70 75 74 20 66 69 6c  of the input fil
1b90: 65 2e 20 20 4c 69 74 65 72 61 6c 20 74 65 78 74  e.  Literal text
1ba0: 20 69 73 20 6c 69 6b 65 20 74 68 69 73 3a 0a 2a   is like this:.*
1bb0: 2a 0a 2a 2a 20 20 20 20 20 4e 4e 4e 3a 54 54 54  *.**     NNN:TTT
1bc0: 54 54 0a 2a 2a 0a 2a 2a 20 77 68 65 72 65 20 4e  TT.**.** where N
1bd0: 4e 4e 20 69 73 20 74 68 65 20 6e 75 6d 62 65 72  NN is the number
1be0: 20 6f 66 20 62 79 74 65 73 20 6f 66 20 74 65 78   of bytes of tex
1bf0: 74 20 28 62 61 73 65 2d 36 34 29 20 61 6e 64 20  t (base-64) and 
1c00: 54 54 54 54 54 20 69 73 20 74 68 65 20 74 65 78  TTTTT is the tex
1c10: 74 2e 0a 2a 2a 0a 2a 2a 20 54 68 65 20 6c 61 73  t..**.** The las
1c20: 74 20 74 65 72 6d 20 69 73 20 6f 66 20 74 68 65  t term is of the
1c30: 20 66 6f 72 6d 0a 2a 2a 0a 2a 2a 20 20 20 20 20   form.**.**     
1c40: 4e 4e 4e 3b 0a 2a 2a 0a 2a 2a 20 49 6e 20 74 68  NNN;.**.** In th
1c50: 69 73 20 63 61 73 65 2c 20 4e 4e 4e 20 69 73 20  is case, NNN is 
1c60: 61 20 33 32 2d 62 69 74 20 62 69 67 65 6e 64 69  a 32-bit bigendi
1c70: 61 6e 20 63 68 65 63 6b 73 75 6d 20 6f 66 20 74  an checksum of t
1c80: 68 65 20 6f 75 74 70 75 74 20 66 69 6c 65 0a 2a  he output file.*
1c90: 2a 20 74 68 61 74 20 63 61 6e 20 62 65 20 75 73  * that can be us
1ca0: 65 64 20 74 6f 20 76 65 72 69 66 79 20 74 68 61  ed to verify tha
1cb0: 74 20 74 68 65 20 64 65 6c 74 61 20 61 70 70 6c  t the delta appl
1cc0: 69 65 64 20 63 6f 72 72 65 63 74 6c 79 2e 20 20  ied correctly.  
1cd0: 41 6c 6c 0a 2a 2a 20 6e 75 6d 62 65 72 73 20 61  All.** numbers a
1ce0: 72 65 20 69 6e 20 62 61 73 65 2d 36 34 2e 0a 2a  re in base-64..*
1cf0: 2a 0a 2a 2a 20 50 75 72 65 20 74 65 78 74 20 66  *.** Pure text f
1d00: 69 6c 65 73 20 67 65 6e 65 72 61 74 65 20 61 20  iles generate a 
1d10: 70 75 72 65 20 74 65 78 74 20 64 65 6c 74 61 2e  pure text delta.
1d20: 20 20 42 69 6e 61 72 79 20 66 69 6c 65 73 20 67    Binary files g
1d30: 65 6e 65 72 61 74 65 20 61 0a 2a 2a 20 64 65 6c  enerate a.** del
1d40: 74 61 20 74 68 61 74 20 6d 61 79 20 63 6f 6e 74  ta that may cont
1d50: 61 69 6e 20 73 6f 6d 65 20 62 69 6e 61 72 79 20  ain some binary 
1d60: 64 61 74 61 2e 0a 2a 2a 0a 2a 2a 20 41 6c 67 6f  data..**.** Algo
1d70: 72 69 74 68 6d 3a 0a 2a 2a 0a 2a 2a 20 54 68 65  rithm:.**.** The
1d80: 20 65 6e 63 6f 64 65 72 20 66 69 72 73 74 20 62   encoder first b
1d90: 75 69 6c 64 73 20 61 20 68 61 73 68 20 74 61 62  uilds a hash tab
1da0: 6c 65 20 74 6f 20 68 65 6c 70 20 69 74 20 66 69  le to help it fi
1db0: 6e 64 20 6d 61 74 63 68 69 6e 67 0a 2a 2a 20 70  nd matching.** p
1dc0: 61 74 74 65 72 6e 73 20 69 6e 20 74 68 65 20 73  atterns in the s
1dd0: 6f 75 72 63 65 20 66 69 6c 65 2e 20 20 31 36 2d  ource file.  16-
1de0: 62 79 74 65 20 63 68 75 63 6b 73 20 6f 66 20 74  byte chucks of t
1df0: 68 65 20 73 6f 75 72 63 65 20 66 69 6c 65 0a 2a  he source file.*
1e00: 2a 20 73 61 6d 70 6c 65 64 20 61 74 20 65 76 65  * sampled at eve
1e10: 6e 6c 79 20 73 70 61 63 65 64 20 69 6e 74 65 72  nly spaced inter
1e20: 76 61 6c 73 20 61 72 65 20 75 73 65 64 20 74 6f  vals are used to
1e30: 20 70 6f 70 75 6c 61 74 65 20 74 68 65 20 68 61   populate the ha
1e40: 73 68 0a 2a 2a 20 74 61 62 6c 65 2e 0a 2a 2a 0a  sh.** table..**.
1e50: 2a 2a 20 4e 65 78 74 20 77 65 20 62 65 67 69 6e  ** Next we begin
1e60: 20 73 63 61 6e 6e 69 6e 67 20 74 68 65 20 74 61   scanning the ta
1e70: 72 67 65 74 20 66 69 6c 65 20 75 73 69 6e 67 20  rget file using 
1e80: 61 20 73 6c 69 64 69 6e 67 20 31 36 2d 62 79 74  a sliding 16-byt
1e90: 65 0a 2a 2a 20 77 69 6e 64 6f 77 2e 20 20 54 68  e.** window.  Th
1ea0: 65 20 68 61 73 68 20 6f 66 20 74 68 65 20 31 36  e hash of the 16
1eb0: 2d 62 79 74 65 20 77 69 6e 64 6f 77 20 69 6e 20  -byte window in 
1ec0: 74 68 65 20 74 61 72 67 65 74 20 69 73 20 75 73  the target is us
1ed0: 65 64 20 74 6f 0a 2a 2a 20 73 65 61 72 63 68 20  ed to.** search 
1ee0: 66 6f 72 20 61 20 6d 61 74 63 68 69 6e 67 20 73  for a matching s
1ef0: 65 63 74 69 6f 6e 20 69 6e 20 74 68 65 20 73 6f  ection in the so
1f00: 75 72 63 65 20 66 69 6c 65 2e 20 20 57 68 65 6e  urce file.  When
1f10: 20 61 20 6d 61 74 63 68 0a 2a 2a 20 69 73 20 66   a match.** is f
1f20: 6f 75 6e 64 2c 20 61 20 63 6f 70 79 20 63 6f 6d  ound, a copy com
1f30: 6d 61 6e 64 20 69 73 20 61 64 64 65 64 20 74 6f  mand is added to
1f40: 20 74 68 65 20 64 65 6c 74 61 2e 20 20 41 6e 20   the delta.  An 
1f50: 65 66 66 6f 72 74 20 69 73 0a 2a 2a 20 6d 61 64  effort is.** mad
1f60: 65 20 74 6f 20 65 78 74 65 6e 64 20 74 68 65 20  e to extend the 
1f70: 6d 61 74 63 68 69 6e 67 20 73 65 63 74 69 6f 6e  matching section
1f80: 20 74 6f 20 72 65 67 69 6f 6e 73 20 74 68 61 74   to regions that
1f90: 20 63 6f 6d 65 20 62 65 66 6f 72 65 0a 2a 2a 20   come before.** 
1fa0: 61 6e 64 20 61 66 74 65 72 20 74 68 65 20 31 36  and after the 16
1fb0: 2d 62 79 74 65 20 68 61 73 68 20 77 69 6e 64 6f  -byte hash windo
1fc0: 77 2e 20 20 41 20 63 6f 70 79 20 63 6f 6d 6d 61  w.  A copy comma
1fd0: 6e 64 20 69 73 20 6f 6e 6c 79 20 69 73 73 75 65  nd is only issue
1fe0: 64 0a 2a 2a 20 69 66 20 74 68 65 20 72 65 73 75  d.** if the resu
1ff0: 6c 74 20 77 6f 75 6c 64 20 75 73 65 20 6c 65 73  lt would use les
2000: 73 20 73 70 61 63 65 20 74 68 61 74 20 6a 75 73  s space that jus
2010: 74 20 71 75 6f 74 69 6e 67 20 74 68 65 20 74 65  t quoting the te
2020: 78 74 0a 2a 2a 20 6c 69 74 65 72 61 6c 6c 79 2e  xt.** literally.
2030: 20 4c 69 74 65 72 61 6c 20 74 65 78 74 20 69 73   Literal text is
2040: 20 61 64 64 65 64 20 74 6f 20 74 68 65 20 64 65   added to the de
2050: 6c 74 61 20 66 6f 72 20 73 65 63 74 69 6f 6e 73  lta for sections
2060: 20 74 68 61 74 20 0a 2a 2a 20 64 6f 20 6e 6f 74   that .** do not
2070: 20 6d 61 74 63 68 20 6f 72 20 77 68 69 63 68 20   match or which 
2080: 63 61 6e 20 6e 6f 74 20 62 65 20 65 6e 63 6f 64  can not be encod
2090: 65 64 20 65 66 66 69 63 69 65 6e 74 6c 79 20 75  ed efficiently u
20a0: 73 69 6e 67 20 63 6f 70 79 0a 2a 2a 20 63 6f 6d  sing copy.** com
20b0: 6d 61 6e 64 73 2e 0a 2a 2f 0a 69 6e 74 20 64 65  mands..*/.int de
20c0: 6c 74 61 5f 63 72 65 61 74 65 28 0a 20 20 63 6f  lta_create(.  co
20d0: 6e 73 74 20 63 68 61 72 20 2a 7a 53 72 63 2c 20  nst char *zSrc, 
20e0: 20 20 20 20 20 2f 2a 20 54 68 65 20 73 6f 75 72       /* The sour
20f0: 63 65 20 6f 72 20 70 61 74 74 65 72 6e 20 66 69  ce or pattern fi
2100: 6c 65 20 2a 2f 0a 20 20 75 6e 73 69 67 6e 65 64  le */.  unsigned
2110: 20 69 6e 74 20 6c 65 6e 53 72 63 2c 20 20 20 2f   int lenSrc,   /
2120: 2a 20 4c 65 6e 67 74 68 20 6f 66 20 74 68 65 20  * Length of the 
2130: 73 6f 75 72 63 65 20 66 69 6c 65 20 2a 2f 0a 20  source file */. 
2140: 20 63 6f 6e 73 74 20 63 68 61 72 20 2a 7a 4f 75   const char *zOu
2150: 74 2c 20 20 20 20 20 20 2f 2a 20 54 68 65 20 74  t,      /* The t
2160: 61 72 67 65 74 20 66 69 6c 65 20 2a 2f 0a 20 20  arget file */.  
2170: 75 6e 73 69 67 6e 65 64 20 69 6e 74 20 6c 65 6e  unsigned int len
2180: 4f 75 74 2c 20 20 20 2f 2a 20 4c 65 6e 67 74 68  Out,   /* Length
2190: 20 6f 66 20 74 68 65 20 74 61 72 67 65 74 20 66   of the target f
21a0: 69 6c 65 20 2a 2f 0a 20 20 63 68 61 72 20 2a 7a  ile */.  char *z
21b0: 44 65 6c 74 61 20 20 20 20 20 20 20 20 20 20 20  Delta           
21c0: 2f 2a 20 57 72 69 74 65 20 74 68 65 20 64 65 6c  /* Write the del
21d0: 74 61 20 69 6e 74 6f 20 74 68 69 73 20 62 75 66  ta into this buf
21e0: 66 65 72 20 2a 2f 0a 29 7b 0a 20 20 69 6e 74 20  fer */.){.  int 
21f0: 69 2c 20 62 61 73 65 3b 0a 20 20 63 68 61 72 20  i, base;.  char 
2200: 2a 7a 4f 72 69 67 44 65 6c 74 61 20 3d 20 7a 44  *zOrigDelta = zD
2210: 65 6c 74 61 3b 0a 20 20 68 61 73 68 20 68 3b 0a  elta;.  hash h;.
2220: 20 20 69 6e 74 20 2a 63 6f 6c 6c 69 64 65 3b 0a    int *collide;.
2230: 20 20 69 6e 74 20 6c 61 73 74 52 65 61 64 20 3d    int lastRead =
2240: 20 2d 31 3b 20 20 20 20 20 20 20 20 20 2f 2a 20   -1;         /* 
2250: 4c 61 73 74 20 62 79 74 65 20 6f 66 20 7a 53 72  Last byte of zSr
2260: 63 20 72 65 61 64 20 62 79 20 61 20 43 4f 50 59  c read by a COPY
2270: 20 63 6f 6d 6d 61 6e 64 20 2a 2f 0a 20 20 69 6e   command */.  in
2280: 74 20 6c 61 6e 64 6d 61 72 6b 5b 4d 58 5f 4c 41  t landmark[MX_LA
2290: 4e 44 4d 41 52 4b 5d 3b 0a 0a 20 20 2f 2a 20 41  NDMARK];..  /* A
22a0: 64 64 20 74 68 65 20 74 61 72 67 65 74 20 66 69  dd the target fi
22b0: 6c 65 20 73 69 7a 65 20 74 6f 20 74 68 65 20 62  le size to the b
22c0: 65 67 69 6e 6e 69 6e 67 20 6f 66 20 74 68 65 20  eginning of the 
22d0: 64 65 6c 74 61 0a 20 20 2a 2f 0a 20 20 70 75 74  delta.  */.  put
22e0: 49 6e 74 28 6c 65 6e 4f 75 74 2c 20 26 7a 44 65  Int(lenOut, &zDe
22f0: 6c 74 61 29 3b 0a 20 20 2a 28 7a 44 65 6c 74 61  lta);.  *(zDelta
2300: 2b 2b 29 20 3d 20 27 5c 6e 27 3b 0a 0a 20 20 2f  ++) = '\n';..  /
2310: 2a 20 49 66 20 74 68 65 20 73 6f 75 72 63 65 20  * If the source 
2320: 66 69 6c 65 20 69 73 20 76 65 72 79 20 73 6d 61  file is very sma
2330: 6c 6c 2c 20 69 74 20 6d 65 61 6e 73 20 74 68 61  ll, it means tha
2340: 74 20 77 65 20 68 61 76 65 20 6e 6f 0a 20 20 2a  t we have no.  *
2350: 2a 20 63 68 61 6e 63 65 20 6f 66 20 65 76 65 72  * chance of ever
2360: 20 64 6f 69 6e 67 20 61 20 63 6f 70 79 20 63 6f   doing a copy co
2370: 6d 6d 61 6e 64 2e 20 20 4a 75 73 74 20 6f 75 74  mmand.  Just out
2380: 70 75 74 20 61 20 73 69 6e 67 6c 65 0a 20 20 2a  put a single.  *
2390: 2a 20 6c 69 74 65 72 61 6c 20 73 65 67 6d 65 6e  * literal segmen
23a0: 74 20 66 6f 72 20 74 68 65 20 65 6e 74 69 72 65  t for the entire
23b0: 20 74 61 72 67 65 74 20 61 6e 64 20 65 78 69 74   target and exit
23c0: 2e 0a 20 20 2a 2f 0a 20 20 69 66 28 20 6c 65 6e  ..  */.  if( len
23d0: 53 72 63 3c 3d 4e 48 41 53 48 20 29 7b 0a 20 20  Src<=NHASH ){.  
23e0: 20 20 70 75 74 49 6e 74 28 6c 65 6e 4f 75 74 2c    putInt(lenOut,
23f0: 20 26 7a 44 65 6c 74 61 29 3b 0a 20 20 20 20 2a   &zDelta);.    *
2400: 28 7a 44 65 6c 74 61 2b 2b 29 20 3d 20 27 3a 27  (zDelta++) = ':'
2410: 3b 0a 20 20 20 20 6d 65 6d 63 70 79 28 7a 44 65  ;.    memcpy(zDe
2420: 6c 74 61 2c 20 7a 4f 75 74 2c 20 6c 65 6e 4f 75  lta, zOut, lenOu
2430: 74 29 3b 0a 20 20 20 20 7a 44 65 6c 74 61 20 2b  t);.    zDelta +
2440: 3d 20 6c 65 6e 4f 75 74 3b 0a 20 20 20 20 70 75  = lenOut;.    pu
2450: 74 49 6e 74 28 63 68 65 63 6b 73 75 6d 28 7a 4f  tInt(checksum(zO
2460: 75 74 2c 20 6c 65 6e 4f 75 74 29 2c 20 26 7a 44  ut, lenOut), &zD
2470: 65 6c 74 61 29 3b 0a 20 20 20 20 2a 28 7a 44 65  elta);.    *(zDe
2480: 6c 74 61 2b 2b 29 20 3d 20 27 3b 27 3b 0a 20 20  lta++) = ';';.  
2490: 20 20 72 65 74 75 72 6e 20 7a 44 65 6c 74 61 20    return zDelta 
24a0: 2d 20 7a 4f 72 69 67 44 65 6c 74 61 3b 0a 20 20  - zOrigDelta;.  
24b0: 7d 0a 0a 20 20 2f 2a 20 43 6f 6d 70 75 74 65 20  }..  /* Compute 
24c0: 74 68 65 20 68 61 73 68 20 74 61 62 6c 65 20 75  the hash table u
24d0: 73 65 64 20 74 6f 20 6c 6f 63 61 74 65 20 6d 61  sed to locate ma
24e0: 74 63 68 69 6e 67 20 73 65 63 74 69 6f 6e 73 20  tching sections 
24f0: 69 6e 20 74 68 65 0a 20 20 2a 2a 20 73 6f 75 72  in the.  ** sour
2500: 63 65 20 66 69 6c 65 2e 0a 20 20 2a 2f 0a 20 20  ce file..  */.  
2510: 63 6f 6c 6c 69 64 65 20 3d 20 6d 61 6c 6c 6f 63  collide = malloc
2520: 28 20 6c 65 6e 53 72 63 2a 73 69 7a 65 6f 66 28  ( lenSrc*sizeof(
2530: 69 6e 74 29 2f 4e 48 41 53 48 20 29 3b 0a 20 20  int)/NHASH );.  
2540: 69 66 28 20 63 6f 6c 6c 69 64 65 3d 3d 30 20 29  if( collide==0 )
2550: 20 72 65 74 75 72 6e 20 2d 31 3b 0a 20 20 6d 65   return -1;.  me
2560: 6d 73 65 74 28 6c 61 6e 64 6d 61 72 6b 2c 20 2d  mset(landmark, -
2570: 31 2c 20 73 69 7a 65 6f 66 28 6c 61 6e 64 6d 61  1, sizeof(landma
2580: 72 6b 29 29 3b 0a 20 20 6d 65 6d 73 65 74 28 63  rk));.  memset(c
2590: 6f 6c 6c 69 64 65 2c 20 2d 31 2c 20 6c 65 6e 53  ollide, -1, lenS
25a0: 72 63 2a 73 69 7a 65 6f 66 28 69 6e 74 29 2f 4e  rc*sizeof(int)/N
25b0: 48 41 53 48 20 29 3b 0a 20 20 66 6f 72 28 69 3d  HASH );.  for(i=
25c0: 30 3b 20 69 3c 6c 65 6e 53 72 63 2d 4e 48 41 53  0; i<lenSrc-NHAS
25d0: 48 3b 20 69 2b 3d 4e 48 41 53 48 29 7b 0a 20 20  H; i+=NHASH){.  
25e0: 20 20 69 6e 74 20 68 76 3b 0a 20 20 20 20 68 61    int hv;.    ha
25f0: 73 68 5f 69 6e 69 74 28 26 68 2c 20 26 7a 53 72  sh_init(&h, &zSr
2600: 63 5b 69 5d 29 3b 0a 20 20 20 20 68 76 20 3d 20  c[i]);.    hv = 
2610: 68 61 73 68 5f 33 32 62 69 74 28 26 68 29 20 26  hash_32bit(&h) &
2620: 20 28 4d 58 5f 4c 41 4e 44 4d 41 52 4b 2d 31 29   (MX_LANDMARK-1)
2630: 3b 0a 20 20 20 20 63 6f 6c 6c 69 64 65 5b 69 2f  ;.    collide[i/
2640: 4e 48 41 53 48 5d 20 3d 20 6c 61 6e 64 6d 61 72  NHASH] = landmar
2650: 6b 5b 68 76 5d 3b 0a 20 20 20 20 6c 61 6e 64 6d  k[hv];.    landm
2660: 61 72 6b 5b 68 76 5d 20 3d 20 69 2f 4e 48 41 53  ark[hv] = i/NHAS
2670: 48 3b 0a 20 20 7d 0a 0a 20 20 2f 2a 20 42 65 67  H;.  }..  /* Beg
2680: 69 6e 20 73 63 61 6e 6e 69 6e 67 20 74 68 65 20  in scanning the 
2690: 74 61 72 67 65 74 20 66 69 6c 65 20 61 6e 64 20  target file and 
26a0: 67 65 6e 65 72 61 74 69 6e 67 20 63 6f 70 79 20  generating copy 
26b0: 63 6f 6d 6d 61 6e 64 73 20 61 6e 64 0a 20 20 2a  commands and.  *
26c0: 2a 20 6c 69 74 65 72 61 6c 20 73 65 63 74 69 6f  * literal sectio
26d0: 6e 73 20 6f 66 20 74 68 65 20 64 65 6c 74 61 2e  ns of the delta.
26e0: 0a 20 20 2a 2f 0a 20 20 62 61 73 65 20 3d 20 30  .  */.  base = 0
26f0: 3b 20 20 20 20 2f 2a 20 57 65 20 68 61 76 65 20  ;    /* We have 
2700: 61 6c 72 65 61 64 79 20 67 65 6e 65 72 61 74 65  already generate
2710: 64 20 65 76 65 72 79 74 68 69 6e 67 20 62 65 66  d everything bef
2720: 6f 72 65 20 7a 4f 75 74 5b 62 61 73 65 5d 20 2a  ore zOut[base] *
2730: 2f 0a 20 20 77 68 69 6c 65 28 20 62 61 73 65 3c  /.  while( base<
2740: 6c 65 6e 4f 75 74 2d 4e 48 41 53 48 20 29 7b 0a  lenOut-NHASH ){.
2750: 20 20 20 20 69 6e 74 20 69 53 72 63 2c 20 69 42      int iSrc, iB
2760: 6c 6f 63 6b 3b 0a 20 20 20 20 75 6e 73 69 67 6e  lock;.    unsign
2770: 65 64 20 69 6e 74 20 62 65 73 74 43 6e 74 2c 20  ed int bestCnt, 
2780: 62 65 73 74 4f 66 73 74 2c 20 62 65 73 74 4c 69  bestOfst, bestLi
2790: 74 73 7a 3b 0a 20 20 20 20 68 61 73 68 5f 69 6e  tsz;.    hash_in
27a0: 69 74 28 26 68 2c 20 26 7a 4f 75 74 5b 62 61 73  it(&h, &zOut[bas
27b0: 65 5d 29 3b 0a 20 20 20 20 69 20 3d 20 30 3b 20  e]);.    i = 0; 
27c0: 20 20 20 20 2f 2a 20 54 72 79 69 6e 67 20 74 6f      /* Trying to
27d0: 20 6d 61 74 63 68 20 61 20 6c 61 6e 64 6d 61 72   match a landmar
27e0: 6b 20 61 67 61 69 6e 73 74 20 7a 4f 75 74 5b 62  k against zOut[b
27f0: 61 73 65 2b 69 5d 20 2a 2f 0a 20 20 20 20 62 65  ase+i] */.    be
2800: 73 74 43 6e 74 20 3d 20 30 3b 0a 20 20 20 20 77  stCnt = 0;.    w
2810: 68 69 6c 65 28 20 31 20 29 7b 0a 20 20 20 20 20  hile( 1 ){.     
2820: 20 69 6e 74 20 68 76 3b 0a 0a 20 20 20 20 20 20   int hv;..      
2830: 68 76 20 3d 20 68 61 73 68 5f 33 32 62 69 74 28  hv = hash_32bit(
2840: 26 68 29 20 26 20 28 4d 58 5f 4c 41 4e 44 4d 41  &h) & (MX_LANDMA
2850: 52 4b 2d 31 29 3b 0a 20 20 20 20 20 20 44 45 42  RK-1);.      DEB
2860: 55 47 32 28 20 70 72 69 6e 74 66 28 22 4c 4f 4f  UG2( printf("LOO
2870: 4b 49 4e 47 3a 20 25 34 64 20 5b 25 73 5d 5c 6e  KING: %4d [%s]\n
2880: 22 2c 20 62 61 73 65 2b 69 2c 20 70 72 69 6e 74  ", base+i, print
2890: 31 36 28 26 7a 4f 75 74 5b 62 61 73 65 2b 69 5d  16(&zOut[base+i]
28a0: 29 29 3b 20 29 0a 20 20 20 20 20 20 69 42 6c 6f  )); ).      iBlo
28b0: 63 6b 20 3d 20 6c 61 6e 64 6d 61 72 6b 5b 68 76  ck = landmark[hv
28c0: 5d 3b 0a 20 20 20 20 20 20 77 68 69 6c 65 28 20  ];.      while( 
28d0: 69 42 6c 6f 63 6b 3e 3d 30 20 29 7b 0a 20 20 20  iBlock>=0 ){.   
28e0: 20 20 20 20 20 2f 2a 0a 20 20 20 20 20 20 20 20       /*.        
28f0: 2a 2a 20 54 68 65 20 68 61 73 68 20 77 69 6e 64  ** The hash wind
2900: 6f 77 20 68 61 73 20 69 64 65 6e 74 69 66 69 65  ow has identifie
2910: 64 20 61 20 70 6f 74 65 6e 74 69 61 6c 20 6d 61  d a potential ma
2920: 74 63 68 20 61 67 61 69 6e 73 74 20 0a 20 20 20  tch against .   
2930: 20 20 20 20 20 2a 2a 20 6c 61 6e 64 6d 61 72 6b       ** landmark
2940: 20 62 6c 6f 63 6b 20 69 42 6c 6f 63 6b 2e 20 20   block iBlock.  
2950: 42 75 74 20 77 65 20 6e 65 65 64 20 74 6f 20 69  But we need to i
2960: 6e 76 65 73 74 69 67 61 74 65 20 66 75 72 74 68  nvestigate furth
2970: 65 72 2e 0a 20 20 20 20 20 20 20 20 2a 2a 20 0a  er..        ** .
2980: 20 20 20 20 20 20 20 20 2a 2a 20 4c 6f 6f 6b 20          ** Look 
2990: 66 6f 72 20 61 20 72 65 67 69 6f 6e 20 69 6e 20  for a region in 
29a0: 7a 4f 75 74 20 74 68 61 74 20 6d 61 74 63 68 65  zOut that matche
29b0: 73 20 7a 53 72 63 2e 20 41 6e 63 68 6f 72 20 74  s zSrc. Anchor t
29c0: 68 65 20 73 65 61 72 63 68 0a 20 20 20 20 20 20  he search.      
29d0: 20 20 2a 2a 20 61 74 20 7a 53 72 63 5b 69 53 72    ** at zSrc[iSr
29e0: 63 5d 20 61 6e 64 20 7a 4f 75 74 5b 62 61 73 65  c] and zOut[base
29f0: 2b 69 5d 2e 20 20 44 6f 20 6e 6f 74 20 69 6e 63  +i].  Do not inc
2a00: 6c 75 64 65 20 61 6e 79 74 68 69 6e 67 20 70 72  lude anything pr
2a10: 69 6f 72 20 74 6f 0a 20 20 20 20 20 20 20 20 2a  ior to.        *
2a20: 2a 20 7a 4f 75 74 5b 62 61 73 65 5d 20 6f 72 20  * zOut[base] or 
2a30: 61 66 74 65 72 20 7a 4f 75 74 5b 6f 75 74 4c 65  after zOut[outLe
2a40: 6e 5d 20 6e 6f 72 20 61 6e 79 74 68 69 6e 67 20  n] nor anything 
2a50: 61 66 74 65 72 20 7a 53 72 63 5b 73 72 63 4c 65  after zSrc[srcLe
2a60: 6e 5d 2e 0a 20 20 20 20 20 20 20 20 2a 2a 0a 20  n]..        **. 
2a70: 20 20 20 20 20 20 20 2a 2a 20 53 65 74 20 63 6e         ** Set cn
2a80: 74 20 65 71 75 61 6c 20 74 6f 20 74 68 65 20 6c  t equal to the l
2a90: 65 6e 67 74 68 20 6f 66 20 74 68 65 20 6d 61 74  ength of the mat
2aa0: 63 68 20 61 6e 64 20 73 65 74 20 6f 66 73 74 20  ch and set ofst 
2ab0: 73 6f 20 74 68 61 74 0a 20 20 20 20 20 20 20 20  so that.        
2ac0: 2a 2a 20 7a 53 72 63 5b 6f 66 73 74 5d 20 69 73  ** zSrc[ofst] is
2ad0: 20 74 68 65 20 66 69 72 73 74 20 65 6c 65 6d 65   the first eleme
2ae0: 6e 74 20 6f 66 20 74 68 65 20 6d 61 74 63 68 2e  nt of the match.
2af0: 20 20 6c 69 74 73 7a 20 69 73 20 74 68 65 20 6e    litsz is the n
2b00: 75 6d 62 65 72 0a 20 20 20 20 20 20 20 20 2a 2a  umber.        **
2b10: 20 6f 66 20 63 68 61 72 61 63 74 65 72 73 20 62   of characters b
2b20: 65 74 77 65 65 6e 20 7a 4f 75 74 5b 62 61 73 65  etween zOut[base
2b30: 5d 20 61 6e 64 20 74 68 65 20 62 65 67 69 6e 6e  ] and the beginn
2b40: 69 6e 67 20 6f 66 20 74 68 65 20 6d 61 74 63 68  ing of the match
2b50: 2e 0a 20 20 20 20 20 20 20 20 2a 2a 20 73 7a 20  ..        ** sz 
2b60: 77 69 6c 6c 20 62 65 20 74 68 65 20 6f 76 65 72  will be the over
2b70: 68 65 61 64 20 28 69 6e 20 62 79 74 65 73 29 20  head (in bytes) 
2b80: 6e 65 65 64 65 64 20 74 6f 20 65 6e 63 6f 64 65  needed to encode
2b90: 20 74 68 65 20 63 6f 70 79 0a 20 20 20 20 20 20   the copy.      
2ba0: 20 20 2a 2a 20 63 6f 6d 6d 61 6e 64 2e 20 20 4f    ** command.  O
2bb0: 6e 6c 79 20 67 65 6e 65 72 61 74 65 20 63 6f 70  nly generate cop
2bc0: 79 20 63 6f 6d 6d 61 6e 64 20 69 66 20 74 68 65  y command if the
2bd0: 20 6f 76 65 72 68 65 61 64 20 6f 66 20 74 68 65   overhead of the
2be0: 0a 20 20 20 20 20 20 20 20 2a 2a 20 63 6f 70 79  .        ** copy
2bf0: 20 63 6f 6d 6d 61 6e 64 20 69 73 20 6c 65 73 73   command is less
2c00: 20 74 68 61 6e 20 74 68 65 20 61 6d 6f 75 6e 74   than the amount
2c10: 20 6f 66 20 6c 69 74 65 72 61 6c 20 74 65 78 74   of literal text
2c20: 20 74 6f 20 62 65 20 63 6f 70 69 65 64 2e 0a 20   to be copied.. 
2c30: 20 20 20 20 20 20 20 2a 2f 0a 20 20 20 20 20 20         */.      
2c40: 20 20 69 6e 74 20 63 6e 74 2c 20 6f 66 73 74 2c    int cnt, ofst,
2c50: 20 6c 69 74 73 7a 3b 0a 20 20 20 20 20 20 20 20   litsz;.        
2c60: 69 6e 74 20 6a 2c 20 6b 2c 20 78 2c 20 79 3b 0a  int j, k, x, y;.
2c70: 20 20 20 20 20 20 20 20 69 6e 74 20 73 7a 3b 0a          int sz;.
2c80: 0a 20 20 20 20 20 20 20 20 2f 2a 20 42 65 67 69  .        /* Begi
2c90: 6e 6e 69 6e 67 20 61 74 20 69 53 72 63 2c 20 6d  nning at iSrc, m
2ca0: 61 74 63 68 20 66 6f 72 77 61 72 64 73 20 61 73  atch forwards as
2cb0: 20 66 61 72 20 61 73 20 77 65 20 63 61 6e 2e 20   far as we can. 
2cc0: 20 6a 20 63 6f 75 6e 74 73 0a 20 20 20 20 20 20   j counts.      
2cd0: 20 20 2a 2a 20 74 68 65 20 6e 75 6d 62 65 72 20    ** the number 
2ce0: 6f 66 20 63 68 61 72 61 63 74 65 72 73 20 74 68  of characters th
2cf0: 61 74 20 6d 61 74 63 68 20 2a 2f 0a 20 20 20 20  at match */.    
2d00: 20 20 20 20 69 53 72 63 20 3d 20 69 42 6c 6f 63      iSrc = iBloc
2d10: 6b 2a 4e 48 41 53 48 3b 0a 20 20 20 20 20 20 20  k*NHASH;.       
2d20: 20 66 6f 72 28 6a 3d 30 2c 20 78 3d 69 53 72 63   for(j=0, x=iSrc
2d30: 2c 20 79 3d 62 61 73 65 2b 69 3b 20 78 3c 6c 65  , y=base+i; x<le
2d40: 6e 53 72 63 20 26 26 20 79 3c 6c 65 6e 4f 75 74  nSrc && y<lenOut
2d50: 3b 20 6a 2b 2b 2c 20 78 2b 2b 2c 20 79 2b 2b 29  ; j++, x++, y++)
2d60: 7b 0a 20 20 20 20 20 20 20 20 20 20 69 66 28 20  {.          if( 
2d70: 7a 53 72 63 5b 78 5d 21 3d 7a 4f 75 74 5b 79 5d  zSrc[x]!=zOut[y]
2d80: 20 29 20 62 72 65 61 6b 3b 0a 20 20 20 20 20 20   ) break;.      
2d90: 20 20 7d 0a 20 20 20 20 20 20 20 20 6a 2d 2d 3b    }.        j--;
2da0: 0a 0a 20 20 20 20 20 20 20 20 2f 2a 20 42 65 67  ..        /* Beg
2db0: 69 6e 6e 69 6e 67 20 61 74 20 69 53 72 63 2d 31  inning at iSrc-1
2dc0: 2c 20 6d 61 74 63 68 20 62 61 63 6b 77 61 72 64  , match backward
2dd0: 73 20 61 73 20 66 61 72 20 61 73 20 77 65 20 63  s as far as we c
2de0: 61 6e 2e 20 20 6b 20 63 6f 75 6e 74 73 0a 20 20  an.  k counts.  
2df0: 20 20 20 20 20 20 2a 2a 20 74 68 65 20 6e 75 6d        ** the num
2e00: 62 65 72 20 6f 66 20 63 68 61 72 61 63 74 65 72  ber of character
2e10: 73 20 74 68 61 74 20 6d 61 74 63 68 20 2a 2f 0a  s that match */.
2e20: 20 20 20 20 20 20 20 20 66 6f 72 28 6b 3d 31 3b          for(k=1;
2e30: 20 6b 3c 69 53 72 63 20 26 26 20 6b 3c 3d 69 3b   k<iSrc && k<=i;
2e40: 20 6b 2b 2b 29 7b 0a 20 20 20 20 20 20 20 20 20   k++){.         
2e50: 20 69 66 28 20 7a 53 72 63 5b 69 53 72 63 2d 6b   if( zSrc[iSrc-k
2e60: 5d 21 3d 7a 4f 75 74 5b 62 61 73 65 2b 69 2d 6b  ]!=zOut[base+i-k
2e70: 5d 20 29 20 62 72 65 61 6b 3b 0a 20 20 20 20 20  ] ) break;.     
2e80: 20 20 20 7d 0a 20 20 20 20 20 20 20 20 6b 2d 2d     }.        k--
2e90: 3b 0a 0a 20 20 20 20 20 20 20 20 2f 2a 20 43 6f  ;..        /* Co
2ea0: 6d 70 75 74 65 20 74 68 65 20 6f 66 66 73 65 74  mpute the offset
2eb0: 20 61 6e 64 20 73 69 7a 65 20 6f 66 20 74 68 65   and size of the
2ec0: 20 6d 61 74 63 68 69 6e 67 20 72 65 67 69 6f 6e   matching region
2ed0: 20 2a 2f 0a 20 20 20 20 20 20 20 20 6f 66 73 74   */.        ofst
2ee0: 20 3d 20 69 53 72 63 2d 6b 3b 0a 20 20 20 20 20   = iSrc-k;.     
2ef0: 20 20 20 63 6e 74 20 3d 20 6a 2b 6b 2b 31 3b 0a     cnt = j+k+1;.
2f00: 20 20 20 20 20 20 20 20 6c 69 74 73 7a 20 3d 20          litsz = 
2f10: 69 2d 6b 3b 20 20 2f 2a 20 4e 75 6d 62 65 72 20  i-k;  /* Number 
2f20: 6f 66 20 62 79 74 65 73 20 6f 66 20 6c 69 74 65  of bytes of lite
2f30: 72 61 6c 20 74 65 78 74 20 62 65 66 6f 72 65 20  ral text before 
2f40: 74 68 65 20 63 6f 70 79 20 2a 2f 0a 20 20 20 20  the copy */.    
2f50: 20 20 20 20 44 45 42 55 47 32 28 20 70 72 69 6e      DEBUG2( prin
2f60: 74 66 28 22 4d 41 54 43 48 20 25 64 20 62 79 74  tf("MATCH %d byt
2f70: 65 73 20 61 74 20 25 64 3a 20 5b 25 73 5d 20 6c  es at %d: [%s] l
2f80: 69 74 73 7a 3d 25 64 5c 6e 22 2c 0a 20 20 20 20  itsz=%d\n",.    
2f90: 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20                  
2fa0: 20 20 20 20 63 6e 74 2c 20 6f 66 73 74 2c 20 70      cnt, ofst, p
2fb0: 72 69 6e 74 31 36 28 26 7a 53 72 63 5b 6f 66 73  rint16(&zSrc[ofs
2fc0: 74 5d 29 2c 20 6c 69 74 73 7a 29 3b 20 29 0a 20  t]), litsz); ). 
2fd0: 20 20 20 20 20 20 20 2f 2a 20 73 7a 20 77 69 6c         /* sz wil
2fe0: 6c 20 68 6f 6c 64 20 74 68 65 20 6e 75 6d 62 65  l hold the numbe
2ff0: 72 20 6f 66 20 62 79 74 65 73 20 6e 65 65 64 65  r of bytes neede
3000: 64 20 74 6f 20 65 6e 63 6f 64 65 20 74 68 65 20  d to encode the 
3010: 22 69 6e 73 65 72 74 22 0a 20 20 20 20 20 20 20  "insert".       
3020: 20 2a 2a 20 63 6f 6d 6d 61 6e 64 20 61 6e 64 20   ** command and 
3030: 74 68 65 20 63 6f 70 79 20 63 6f 6d 6d 61 6e 64  the copy command
3040: 2c 20 6e 6f 74 20 63 6f 75 6e 74 69 6e 67 20 74  , not counting t
3050: 68 65 20 22 69 6e 73 65 72 74 22 20 74 65 78 74  he "insert" text
3060: 20 2a 2f 0a 20 20 20 20 20 20 20 20 73 7a 20 3d   */.        sz =
3070: 20 64 69 67 69 74 5f 63 6f 75 6e 74 28 69 2d 6b   digit_count(i-k
3080: 29 2b 64 69 67 69 74 5f 63 6f 75 6e 74 28 63 6e  )+digit_count(cn
3090: 74 29 2b 64 69 67 69 74 5f 63 6f 75 6e 74 28 6f  t)+digit_count(o
30a0: 66 73 74 29 2b 33 3b 0a 20 20 20 20 20 20 20 20  fst)+3;.        
30b0: 69 66 28 20 63 6e 74 3e 3d 73 7a 20 26 26 20 63  if( cnt>=sz && c
30c0: 6e 74 3e 62 65 73 74 43 6e 74 20 29 7b 0a 20 20  nt>bestCnt ){.  
30d0: 20 20 20 20 20 20 20 20 2f 2a 20 52 65 6d 65 6d          /* Remem
30e0: 62 65 72 20 74 68 69 73 20 6d 61 74 63 68 20 6f  ber this match o
30f0: 6e 6c 79 20 69 66 20 69 74 20 69 73 20 74 68 65  nly if it is the
3100: 20 62 65 73 74 20 73 6f 20 66 61 72 20 61 6e 64   best so far and
3110: 20 69 74 0a 20 20 20 20 20 20 20 20 20 20 2a 2a   it.          **
3120: 20 64 6f 65 73 20 6e 6f 74 20 69 6e 63 72 65 61   does not increa
3130: 73 65 20 74 68 65 20 66 69 6c 65 20 73 69 7a 65  se the file size
3140: 20 2a 2f 0a 20 20 20 20 20 20 20 20 20 20 62 65   */.          be
3150: 73 74 43 6e 74 20 3d 20 63 6e 74 3b 0a 20 20 20  stCnt = cnt;.   
3160: 20 20 20 20 20 20 20 62 65 73 74 4f 66 73 74 20         bestOfst 
3170: 3d 20 69 53 72 63 2d 6b 3b 0a 20 20 20 20 20 20  = iSrc-k;.      
3180: 20 20 20 20 62 65 73 74 4c 69 74 73 7a 20 3d 20      bestLitsz = 
3190: 6c 69 74 73 7a 3b 0a 20 20 20 20 20 20 20 20 20  litsz;.         
31a0: 20 44 45 42 55 47 32 28 20 70 72 69 6e 74 66 28   DEBUG2( printf(
31b0: 22 2e 2e 2e 20 42 45 53 54 20 53 4f 20 46 41 52  "... BEST SO FAR
31c0: 5c 6e 22 29 3b 20 29 0a 20 20 20 20 20 20 20 20  \n"); ).        
31d0: 7d 0a 0a 20 20 20 20 20 20 20 20 2f 2a 20 43 68  }..        /* Ch
31e0: 65 63 6b 20 74 68 65 20 6e 65 78 74 20 6d 61 74  eck the next mat
31f0: 63 68 69 6e 67 20 62 6c 6f 63 6b 20 2a 2f 0a 20  ching block */. 
3200: 20 20 20 20 20 20 20 69 42 6c 6f 63 6b 20 3d 20         iBlock = 
3210: 63 6f 6c 6c 69 64 65 5b 69 42 6c 6f 63 6b 5d 3b  collide[iBlock];
3220: 0a 20 20 20 20 20 20 7d 0a 0a 20 20 20 20 20 20  .      }..      
3230: 2f 2a 20 57 65 20 68 61 76 65 20 61 20 63 6f 70  /* We have a cop
3240: 79 20 63 6f 6d 6d 61 6e 64 20 74 68 61 74 20 64  y command that d
3250: 6f 65 73 20 6e 6f 74 20 63 61 75 73 65 20 74 68  oes not cause th
3260: 65 20 64 65 6c 74 61 20 74 6f 20 62 65 20 6c 61  e delta to be la
3270: 72 67 65 72 0a 20 20 20 20 20 20 2a 2a 20 74 68  rger.      ** th
3280: 61 6e 20 61 20 6c 69 74 65 72 61 6c 20 69 6e 73  an a literal ins
3290: 65 72 74 2e 20 20 53 6f 20 61 64 64 20 74 68 65  ert.  So add the
32a0: 20 63 6f 70 79 20 63 6f 6d 6d 61 6e 64 20 74 6f   copy command to
32b0: 20 74 68 65 20 64 65 6c 74 61 2e 0a 20 20 20 20   the delta..    
32c0: 20 20 2a 2f 0a 20 20 20 20 20 20 69 66 28 20 62    */.      if( b
32d0: 65 73 74 43 6e 74 3e 30 20 26 26 20 62 61 73 65  estCnt>0 && base
32e0: 2b 69 3e 3d 62 65 73 74 4f 66 73 74 2b 4e 48 41  +i>=bestOfst+NHA
32f0: 53 48 20 29 7b 0a 20 20 20 20 20 20 20 20 69 66  SH ){.        if
3300: 28 20 62 65 73 74 4c 69 74 73 7a 3e 30 20 29 7b  ( bestLitsz>0 ){
3310: 0a 20 20 20 20 20 20 20 20 20 20 2f 2a 20 41 64  .          /* Ad
3320: 64 20 61 6e 20 69 6e 73 65 72 74 20 63 6f 6d 6d  d an insert comm
3330: 61 6e 64 20 62 65 66 6f 72 65 20 74 68 65 20 63  and before the c
3340: 6f 70 79 20 2a 2f 0a 20 20 20 20 20 20 20 20 20  opy */.         
3350: 20 70 75 74 49 6e 74 28 62 65 73 74 4c 69 74 73   putInt(bestLits
3360: 7a 2c 26 7a 44 65 6c 74 61 29 3b 0a 20 20 20 20  z,&zDelta);.    
3370: 20 20 20 20 20 20 2a 28 7a 44 65 6c 74 61 2b 2b        *(zDelta++
3380: 29 20 3d 20 27 3a 27 3b 0a 20 20 20 20 20 20 20  ) = ':';.       
3390: 20 20 20 6d 65 6d 63 70 79 28 7a 44 65 6c 74 61     memcpy(zDelta
33a0: 2c 20 26 7a 4f 75 74 5b 62 61 73 65 5d 2c 20 62  , &zOut[base], b
33b0: 65 73 74 4c 69 74 73 7a 29 3b 0a 20 20 20 20 20  estLitsz);.     
33c0: 20 20 20 20 20 7a 44 65 6c 74 61 20 2b 3d 20 62       zDelta += b
33d0: 65 73 74 4c 69 74 73 7a 3b 0a 20 20 20 20 20 20  estLitsz;.      
33e0: 20 20 20 20 62 61 73 65 20 2b 3d 20 62 65 73 74      base += best
33f0: 4c 69 74 73 7a 3b 0a 20 20 20 20 20 20 20 20 20  Litsz;.         
3400: 20 44 45 42 55 47 32 28 20 70 72 69 6e 74 66 28   DEBUG2( printf(
3410: 22 69 6e 73 65 72 74 20 25 64 5c 6e 22 2c 20 62  "insert %d\n", b
3420: 65 73 74 4c 69 74 73 7a 29 3b 20 29 0a 20 20 20  estLitsz); ).   
3430: 20 20 20 20 20 7d 0a 20 20 20 20 20 20 20 20 62       }.        b
3440: 61 73 65 20 2b 3d 20 62 65 73 74 43 6e 74 3b 0a  ase += bestCnt;.
3450: 20 20 20 20 20 20 20 20 70 75 74 49 6e 74 28 62          putInt(b
3460: 65 73 74 43 6e 74 2c 20 26 7a 44 65 6c 74 61 29  estCnt, &zDelta)
3470: 3b 0a 20 20 20 20 20 20 20 20 2a 28 7a 44 65 6c  ;.        *(zDel
3480: 74 61 2b 2b 29 20 3d 20 27 40 27 3b 0a 20 20 20  ta++) = '@';.   
3490: 20 20 20 20 20 70 75 74 49 6e 74 28 62 65 73 74       putInt(best
34a0: 4f 66 73 74 2c 20 26 7a 44 65 6c 74 61 29 3b 0a  Ofst, &zDelta);.
34b0: 20 20 20 20 20 20 20 20 44 45 42 55 47 32 28 20          DEBUG2( 
34c0: 70 72 69 6e 74 66 28 22 63 6f 70 79 20 25 64 20  printf("copy %d 
34d0: 62 79 74 65 73 20 66 72 6f 6d 20 25 64 5c 6e 22  bytes from %d\n"
34e0: 2c 20 62 65 73 74 43 6e 74 2c 20 62 65 73 74 4f  , bestCnt, bestO
34f0: 66 73 74 29 3b 20 29 0a 20 20 20 20 20 20 20 20  fst); ).        
3500: 2a 28 7a 44 65 6c 74 61 2b 2b 29 20 3d 20 27 2c  *(zDelta++) = ',
3510: 27 3b 0a 20 20 20 20 20 20 20 20 69 66 28 20 62  ';.        if( b
3520: 65 73 74 4f 66 73 74 20 2b 20 62 65 73 74 43 6e  estOfst + bestCn
3530: 74 20 2d 31 20 3e 20 6c 61 73 74 52 65 61 64 20  t -1 > lastRead 
3540: 29 7b 0a 20 20 20 20 20 20 20 20 20 20 6c 61 73  ){.          las
3550: 74 52 65 61 64 20 3d 20 62 65 73 74 4f 66 73 74  tRead = bestOfst
3560: 20 2b 20 62 65 73 74 43 6e 74 20 2d 20 31 3b 0a   + bestCnt - 1;.
3570: 20 20 20 20 20 20 20 20 20 20 44 45 42 55 47 32            DEBUG2
3580: 28 20 70 72 69 6e 74 66 28 22 6c 61 73 74 52 65  ( printf("lastRe
3590: 61 64 20 62 65 63 6f 6d 65 73 20 25 64 5c 6e 22  ad becomes %d\n"
35a0: 2c 20 6c 61 73 74 52 65 61 64 29 3b 20 29 0a 20  , lastRead); ). 
35b0: 20 20 20 20 20 20 20 7d 0a 20 20 20 20 20 20 20         }.       
35c0: 20 62 65 73 74 43 6e 74 20 3d 20 30 3b 0a 20 20   bestCnt = 0;.  
35d0: 20 20 20 20 20 20 62 72 65 61 6b 3b 0a 20 20 20        break;.   
35e0: 20 20 20 7d 0a 0a 20 20 20 20 20 20 2f 2a 20 49     }..      /* I
35f0: 66 20 77 65 20 72 65 61 63 68 20 74 68 69 73 20  f we reach this 
3600: 70 6f 69 6e 74 2c 20 69 74 20 6d 65 61 6e 73 20  point, it means 
3610: 6e 6f 20 6d 61 74 63 68 20 69 73 20 66 6f 75 6e  no match is foun
3620: 64 20 73 6f 20 66 61 72 20 2a 2f 0a 20 20 20 20  d so far */.    
3630: 20 20 69 66 28 20 62 61 73 65 2b 69 2b 4e 48 41    if( base+i+NHA
3640: 53 48 3e 6c 65 6e 4f 75 74 20 29 7b 0a 20 20 20  SH>lenOut ){.   
3650: 20 20 20 20 20 2f 2a 20 57 65 20 68 61 76 65 20       /* We have 
3660: 72 65 61 63 68 65 64 20 74 68 65 20 65 6e 64 20  reached the end 
3670: 6f 66 20 74 68 65 20 66 69 6c 65 20 61 6e 64 20  of the file and 
3680: 68 61 76 65 20 6e 6f 74 20 66 6f 75 6e 64 20 61  have not found a
3690: 6e 79 0a 20 20 20 20 20 20 20 20 2a 2a 20 6d 61  ny.        ** ma
36a0: 74 63 68 65 73 2e 20 20 44 6f 20 61 6e 20 22 69  tches.  Do an "i
36b0: 6e 73 65 72 74 22 20 66 6f 72 20 65 76 65 72 79  nsert" for every
36c0: 74 68 69 6e 67 20 74 68 61 74 20 64 6f 65 73 20  thing that does 
36d0: 6e 6f 74 20 6d 61 74 63 68 20 2a 2f 0a 20 20 20  not match */.   
36e0: 20 20 20 20 20 70 75 74 49 6e 74 28 6c 65 6e 4f       putInt(lenO
36f0: 75 74 2d 62 61 73 65 2c 20 26 7a 44 65 6c 74 61  ut-base, &zDelta
3700: 29 3b 0a 20 20 20 20 20 20 20 20 2a 28 7a 44 65  );.        *(zDe
3710: 6c 74 61 2b 2b 29 20 3d 20 27 3a 27 3b 0a 20 20  lta++) = ':';.  
3720: 20 20 20 20 20 20 6d 65 6d 63 70 79 28 7a 44 65        memcpy(zDe
3730: 6c 74 61 2c 20 26 7a 4f 75 74 5b 62 61 73 65 5d  lta, &zOut[base]
3740: 2c 20 6c 65 6e 4f 75 74 2d 62 61 73 65 29 3b 0a  , lenOut-base);.
3750: 20 20 20 20 20 20 20 20 7a 44 65 6c 74 61 20 2b          zDelta +
3760: 3d 20 6c 65 6e 4f 75 74 2d 62 61 73 65 3b 0a 20  = lenOut-base;. 
3770: 20 20 20 20 20 20 20 62 61 73 65 20 3d 20 6c 65         base = le
3780: 6e 4f 75 74 3b 0a 20 20 20 20 20 20 20 20 62 72  nOut;.        br
3790: 65 61 6b 3b 0a 20 20 20 20 20 20 7d 0a 0a 20 20  eak;.      }..  
37a0: 20 20 20 20 2f 2a 20 41 64 76 61 6e 63 65 20 74      /* Advance t
37b0: 68 65 20 68 61 73 68 20 62 79 20 6f 6e 65 20 63  he hash by one c
37c0: 68 61 72 61 63 74 65 72 2e 20 20 4b 65 65 70 20  haracter.  Keep 
37d0: 6c 6f 6f 6b 69 6e 67 20 66 6f 72 20 61 20 6d 61  looking for a ma
37e0: 74 63 68 20 2a 2f 0a 20 20 20 20 20 20 68 61 73  tch */.      has
37f0: 68 5f 6e 65 78 74 28 26 68 2c 20 7a 4f 75 74 5b  h_next(&h, zOut[
3800: 62 61 73 65 2b 69 2b 4e 48 41 53 48 5d 29 3b 0a  base+i+NHASH]);.
3810: 20 20 20 20 20 20 69 2b 2b 3b 0a 20 20 20 20 7d        i++;.    }
3820: 0a 20 20 7d 0a 20 20 2f 2a 20 4f 75 74 70 75 74  .  }.  /* Output
3830: 20 61 20 66 69 6e 61 6c 20 22 69 6e 73 65 72 74   a final "insert
3840: 22 20 72 65 63 6f 72 64 20 74 6f 20 67 65 74 20  " record to get 
3850: 61 6c 6c 20 74 68 65 20 74 65 78 74 20 61 74 20  all the text at 
3860: 74 68 65 20 65 6e 64 20 6f 66 0a 20 20 2a 2a 20  the end of.  ** 
3870: 74 68 65 20 66 69 6c 65 20 74 68 61 74 20 64 6f  the file that do
3880: 65 73 20 6e 6f 74 20 6d 61 74 63 68 20 61 6e 79  es not match any
3890: 74 68 69 6e 67 20 69 6e 20 74 68 65 20 73 6f 75  thing in the sou
38a0: 72 63 65 20 66 69 6c 65 2e 0a 20 20 2a 2f 0a 20  rce file..  */. 
38b0: 20 69 66 28 20 62 61 73 65 3c 6c 65 6e 4f 75 74   if( base<lenOut
38c0: 20 29 7b 0a 20 20 20 20 70 75 74 49 6e 74 28 6c   ){.    putInt(l
38d0: 65 6e 4f 75 74 2d 62 61 73 65 2c 20 26 7a 44 65  enOut-base, &zDe
38e0: 6c 74 61 29 3b 0a 20 20 20 20 2a 28 7a 44 65 6c  lta);.    *(zDel
38f0: 74 61 2b 2b 29 20 3d 20 27 3a 27 3b 0a 20 20 20  ta++) = ':';.   
3900: 20 6d 65 6d 63 70 79 28 7a 44 65 6c 74 61 2c 20   memcpy(zDelta, 
3910: 26 7a 4f 75 74 5b 62 61 73 65 5d 2c 20 6c 65 6e  &zOut[base], len
3920: 4f 75 74 2d 62 61 73 65 29 3b 0a 20 20 20 20 7a  Out-base);.    z
3930: 44 65 6c 74 61 20 2b 3d 20 6c 65 6e 4f 75 74 2d  Delta += lenOut-
3940: 62 61 73 65 3b 0a 20 20 7d 0a 20 20 2f 2a 20 4f  base;.  }.  /* O
3950: 75 74 70 75 74 20 74 68 65 20 66 69 6e 61 6c 20  utput the final 
3960: 63 68 65 63 6b 73 75 6d 20 72 65 63 6f 72 64 2e  checksum record.
3970: 20 2a 2f 0a 20 20 70 75 74 49 6e 74 28 63 68 65   */.  putInt(che
3980: 63 6b 73 75 6d 28 7a 4f 75 74 2c 20 6c 65 6e 4f  cksum(zOut, lenO
3990: 75 74 29 2c 20 26 7a 44 65 6c 74 61 29 3b 0a 20  ut), &zDelta);. 
39a0: 20 2a 28 7a 44 65 6c 74 61 2b 2b 29 20 3d 20 27   *(zDelta++) = '
39b0: 3b 27 3b 0a 20 20 66 72 65 65 28 63 6f 6c 6c 69  ;';.  free(colli
39c0: 64 65 29 3b 0a 20 20 72 65 74 75 72 6e 20 7a 44  de);.  return zD
39d0: 65 6c 74 61 20 2d 20 7a 4f 72 69 67 44 65 6c 74  elta - zOrigDelt
39e0: 61 3b 20 0a 7d 0a 0a 2f 2a 0a 2a 2a 20 52 65 74  a; .}../*.** Ret
39f0: 75 72 6e 20 74 68 65 20 73 69 7a 65 20 28 69 6e  urn the size (in
3a00: 20 62 79 74 65 73 29 20 6f 66 20 74 68 65 20 6f   bytes) of the o
3a10: 75 74 70 75 74 20 66 72 6f 6d 20 61 70 70 6c 79  utput from apply
3a20: 69 6e 67 0a 2a 2a 20 61 20 64 65 6c 74 61 2e 20  ing.** a delta. 
3a30: 0a 2a 2a 0a 2a 2a 20 54 68 69 73 20 72 6f 75 74  .**.** This rout
3a40: 69 6e 65 20 69 73 20 70 72 6f 76 69 64 65 64 20  ine is provided 
3a50: 73 6f 20 74 68 61 74 20 61 6e 20 70 72 6f 63 65  so that an proce
3a60: 64 75 72 65 20 74 68 61 74 20 69 73 20 61 62 6c  dure that is abl
3a70: 65 0a 2a 2a 20 74 6f 20 63 61 6c 6c 20 64 65 6c  e.** to call del
3a80: 74 61 5f 61 70 70 6c 79 28 29 20 63 61 6e 20 6c  ta_apply() can l
3a90: 65 61 72 6e 20 68 6f 77 20 6d 75 63 68 20 73 70  earn how much sp
3aa0: 61 63 65 20 69 73 20 72 65 71 75 69 72 65 64 0a  ace is required.
3ab0: 2a 2a 20 66 6f 72 20 74 68 65 20 6f 75 74 70 75  ** for the outpu
3ac0: 74 20 61 6e 64 20 68 65 6e 63 65 20 61 6c 6c 6f  t and hence allo
3ad0: 63 61 74 65 20 6e 6f 72 20 6d 6f 72 65 20 73 70  cate nor more sp
3ae0: 61 63 65 20 74 68 61 74 20 69 73 20 72 65 61 6c  ace that is real
3af0: 6c 79 0a 2a 2a 20 6e 65 65 64 65 64 2e 0a 2a 2f  ly.** needed..*/
3b00: 0a 69 6e 74 20 64 65 6c 74 61 5f 6f 75 74 70 75  .int delta_outpu
3b10: 74 5f 73 69 7a 65 28 63 6f 6e 73 74 20 63 68 61  t_size(const cha
3b20: 72 20 2a 7a 44 65 6c 74 61 2c 20 69 6e 74 20 6c  r *zDelta, int l
3b30: 65 6e 44 65 6c 74 61 29 7b 0a 20 20 69 6e 74 20  enDelta){.  int 
3b40: 73 69 7a 65 3b 0a 20 20 73 69 7a 65 20 3d 20 67  size;.  size = g
3b50: 65 74 49 6e 74 28 26 7a 44 65 6c 74 61 2c 20 26  etInt(&zDelta, &
3b60: 6c 65 6e 44 65 6c 74 61 29 3b 0a 20 20 69 66 28  lenDelta);.  if(
3b70: 20 2a 7a 44 65 6c 74 61 21 3d 27 5c 6e 27 20 29   *zDelta!='\n' )
3b80: 7b 0a 20 20 20 20 2f 2a 20 45 52 52 4f 52 3a 20  {.    /* ERROR: 
3b90: 73 69 7a 65 20 69 6e 74 65 67 65 72 20 6e 6f 74  size integer not
3ba0: 20 74 65 72 6d 69 6e 61 74 65 64 20 62 79 20 22   terminated by "
3bb0: 5c 6e 22 20 2a 2f 0a 20 20 20 20 72 65 74 75 72  \n" */.    retur
3bc0: 6e 20 2d 31 3b 0a 20 20 7d 0a 20 20 72 65 74 75  n -1;.  }.  retu
3bd0: 72 6e 20 73 69 7a 65 3b 0a 7d 0a 0a 0a 2f 2a 0a  rn size;.}.../*.
3be0: 2a 2a 20 41 70 70 6c 79 20 61 20 64 65 6c 74 61  ** Apply a delta
3bf0: 2e 0a 2a 2a 0a 2a 2a 20 54 68 65 20 6f 75 74 70  ..**.** The outp
3c00: 75 74 20 62 75 66 66 65 72 20 73 68 6f 75 6c 64  ut buffer should
3c10: 20 62 65 20 62 69 67 20 65 6e 6f 75 67 68 20 74   be big enough t
3c20: 6f 20 68 6f 6c 64 20 74 68 65 20 77 68 6f 6c 65  o hold the whole
3c30: 20 6f 75 74 70 75 74 0a 2a 2a 20 66 69 6c 65 20   output.** file 
3c40: 61 6e 64 20 61 20 4e 55 4c 20 74 65 72 6d 69 6e  and a NUL termin
3c50: 61 74 6f 72 20 61 74 20 74 68 65 20 65 6e 64 2e  ator at the end.
3c60: 20 20 54 68 65 20 64 65 6c 74 61 5f 6f 75 74 70    The delta_outp
3c70: 75 74 5f 73 69 7a 65 28 29 0a 2a 2a 20 72 6f 75  ut_size().** rou
3c80: 74 69 6e 65 20 77 69 6c 6c 20 64 65 74 65 72 6d  tine will determ
3c90: 69 6e 65 20 74 68 69 73 20 73 69 7a 65 20 66 6f  ine this size fo
3ca0: 72 20 79 6f 75 2e 0a 2a 2a 0a 2a 2a 20 54 68 65  r you..**.** The
3cb0: 20 64 65 6c 74 61 20 73 74 72 69 6e 67 20 73 68   delta string sh
3cc0: 6f 75 6c 64 20 62 65 20 6e 75 6c 6c 2d 74 65 72  ould be null-ter
3cd0: 6d 69 6e 61 74 65 64 2e 20 20 42 75 74 20 74 68  minated.  But th
3ce0: 65 20 64 65 6c 74 61 20 73 74 72 69 6e 67 0a 2a  e delta string.*
3cf0: 2a 20 6d 61 79 20 63 6f 6e 74 61 69 6e 20 65 6d  * may contain em
3d00: 62 65 64 64 65 64 20 4e 55 4c 20 63 68 61 72 61  bedded NUL chara
3d10: 63 74 65 72 73 20 28 69 66 20 74 68 65 20 69 6e  cters (if the in
3d20: 70 75 74 20 61 6e 64 20 6f 75 74 70 75 74 20 61  put and output a
3d30: 72 65 0a 2a 2a 20 62 69 6e 61 72 79 20 66 69 6c  re.** binary fil
3d40: 65 73 29 20 73 6f 20 77 65 20 61 6c 73 6f 20 68  es) so we also h
3d50: 61 76 65 20 74 6f 20 70 61 73 73 20 69 6e 20 74  ave to pass in t
3d60: 68 65 20 6c 65 6e 67 74 68 20 6f 66 20 74 68 65  he length of the
3d70: 20 64 65 6c 74 61 20 69 6e 0a 2a 2a 20 74 68 65   delta in.** the
3d80: 20 6c 65 6e 44 65 6c 74 61 20 70 61 72 61 6d 65   lenDelta parame
3d90: 74 65 72 2e 0a 2a 2a 0a 2a 2a 20 54 68 69 73 20  ter..**.** This 
3da0: 66 75 6e 63 74 69 6f 6e 20 72 65 74 75 72 6e 73  function returns
3db0: 20 74 68 65 20 73 69 7a 65 20 6f 66 20 74 68 65   the size of the
3dc0: 20 6f 75 74 70 75 74 20 66 69 6c 65 20 69 6e 20   output file in 
3dd0: 62 79 74 65 73 20 28 65 78 63 6c 75 64 69 6e 67  bytes (excluding
3de0: 0a 2a 2a 20 74 68 65 20 66 69 6e 61 6c 20 4e 55  .** the final NU
3df0: 4c 20 74 65 72 6d 69 6e 61 74 6f 72 20 63 68 61  L terminator cha
3e00: 72 61 63 74 65 72 29 2e 20 20 45 78 63 65 70 74  racter).  Except
3e10: 2c 20 69 66 20 74 68 65 20 64 65 6c 74 61 20 73  , if the delta s
3e20: 74 72 69 6e 67 20 69 73 0a 2a 2a 20 6d 61 6c 66  tring is.** malf
3e30: 6f 72 6d 65 64 20 6f 72 20 69 6e 74 65 6e 64 65  ormed or intende
3e40: 64 20 66 6f 72 20 75 73 65 20 77 69 74 68 20 61  d for use with a
3e50: 20 73 6f 75 72 63 65 20 66 69 6c 65 20 6f 74 68   source file oth
3e60: 65 72 20 74 68 61 6e 20 7a 53 72 63 2c 0a 2a 2a  er than zSrc,.**
3e70: 20 74 68 65 6e 20 74 68 69 73 20 72 6f 75 74 69   then this routi
3e80: 6e 65 20 72 65 74 75 72 6e 73 20 2d 31 2e 0a 2a  ne returns -1..*
3e90: 2a 0a 2a 2a 20 52 65 66 65 72 20 74 6f 20 74 68  *.** Refer to th
3ea0: 65 20 64 65 6c 74 61 5f 63 72 65 61 74 65 28 29  e delta_create()
3eb0: 20 64 6f 63 75 6d 65 6e 74 61 74 69 6f 6e 20 61   documentation a
3ec0: 62 6f 76 65 20 66 6f 72 20 61 20 64 65 73 63 72  bove for a descr
3ed0: 69 70 74 69 6f 6e 0a 2a 2a 20 6f 66 20 74 68 65  iption.** of the
3ee0: 20 64 65 6c 74 61 20 66 69 6c 65 20 66 6f 72 6d   delta file form
3ef0: 61 74 2e 0a 2a 2f 0a 69 6e 74 20 64 65 6c 74 61  at..*/.int delta
3f00: 5f 61 70 70 6c 79 28 0a 20 20 63 6f 6e 73 74 20  _apply(.  const 
3f10: 63 68 61 72 20 2a 7a 53 72 63 2c 20 20 20 20 20  char *zSrc,     
3f20: 20 2f 2a 20 54 68 65 20 73 6f 75 72 63 65 20 6f   /* The source o
3f30: 72 20 70 61 74 74 65 72 6e 20 66 69 6c 65 20 2a  r pattern file *
3f40: 2f 0a 20 20 69 6e 74 20 6c 65 6e 53 72 63 2c 20  /.  int lenSrc, 
3f50: 20 20 20 20 20 20 20 20 20 20 20 2f 2a 20 4c 65             /* Le
3f60: 6e 67 74 68 20 6f 66 20 74 68 65 20 73 6f 75 72  ngth of the sour
3f70: 63 65 20 66 69 6c 65 20 2a 2f 0a 20 20 63 6f 6e  ce file */.  con
3f80: 73 74 20 63 68 61 72 20 2a 7a 44 65 6c 74 61 2c  st char *zDelta,
3f90: 20 20 20 20 2f 2a 20 44 65 6c 74 61 20 74 6f 20      /* Delta to 
3fa0: 61 70 70 6c 79 20 74 6f 20 74 68 65 20 70 61 74  apply to the pat
3fb0: 74 65 72 6e 20 2a 2f 0a 20 20 69 6e 74 20 6c 65  tern */.  int le
3fc0: 6e 44 65 6c 74 61 2c 20 20 20 20 20 20 20 20 20  nDelta,         
3fd0: 20 2f 2a 20 4c 65 6e 67 74 68 20 6f 66 20 74 68   /* Length of th
3fe0: 65 20 64 65 6c 74 61 20 2a 2f 0a 20 20 63 68 61  e delta */.  cha
3ff0: 72 20 2a 7a 4f 75 74 20 20 20 20 20 20 20 20 20  r *zOut         
4000: 20 20 20 20 2f 2a 20 57 72 69 74 65 20 74 68 65      /* Write the
4010: 20 6f 75 74 70 75 74 20 69 6e 74 6f 20 74 68 69   output into thi
4020: 73 20 70 72 65 61 6c 6c 6f 63 61 74 65 64 20 62  s preallocated b
4030: 75 66 66 65 72 20 2a 2f 0a 29 7b 0a 20 20 75 6e  uffer */.){.  un
4040: 73 69 67 6e 65 64 20 69 6e 74 20 6c 69 6d 69 74  signed int limit
4050: 3b 0a 20 20 75 6e 73 69 67 6e 65 64 20 69 6e 74  ;.  unsigned int
4060: 20 74 6f 74 61 6c 20 3d 20 30 3b 0a 20 20 63 68   total = 0;.  ch
4070: 61 72 20 2a 7a 4f 72 69 67 4f 75 74 20 3d 20 7a  ar *zOrigOut = z
4080: 4f 75 74 3b 0a 0a 20 20 6c 69 6d 69 74 20 3d 20  Out;..  limit = 
4090: 67 65 74 49 6e 74 28 26 7a 44 65 6c 74 61 2c 20  getInt(&zDelta, 
40a0: 26 6c 65 6e 44 65 6c 74 61 29 3b 0a 20 20 69 66  &lenDelta);.  if
40b0: 28 20 2a 7a 44 65 6c 74 61 21 3d 27 5c 6e 27 20  ( *zDelta!='\n' 
40c0: 29 7b 0a 20 20 20 20 2f 2a 20 45 52 52 4f 52 3a  ){.    /* ERROR:
40d0: 20 73 69 7a 65 20 69 6e 74 65 67 65 72 20 6e 6f   size integer no
40e0: 74 20 74 65 72 6d 69 6e 61 74 65 64 20 62 79 20  t terminated by 
40f0: 22 5c 6e 22 20 2a 2f 0a 20 20 20 20 72 65 74 75  "\n" */.    retu
4100: 72 6e 20 2d 31 3b 0a 20 20 7d 0a 20 20 7a 44 65  rn -1;.  }.  zDe
4110: 6c 74 61 2b 2b 3b 20 6c 65 6e 44 65 6c 74 61 2d  lta++; lenDelta-
4120: 2d 3b 0a 20 20 77 68 69 6c 65 28 20 2a 7a 44 65  -;.  while( *zDe
4130: 6c 74 61 20 26 26 20 6c 65 6e 44 65 6c 74 61 3e  lta && lenDelta>
4140: 30 20 29 7b 0a 20 20 20 20 75 6e 73 69 67 6e 65  0 ){.    unsigne
4150: 64 20 69 6e 74 20 63 6e 74 2c 20 6f 66 73 74 3b  d int cnt, ofst;
4160: 0a 20 20 20 20 63 6e 74 20 3d 20 67 65 74 49 6e  .    cnt = getIn
4170: 74 28 26 7a 44 65 6c 74 61 2c 20 26 6c 65 6e 44  t(&zDelta, &lenD
4180: 65 6c 74 61 29 3b 0a 20 20 20 20 73 77 69 74 63  elta);.    switc
4190: 68 28 20 7a 44 65 6c 74 61 5b 30 5d 20 29 7b 0a  h( zDelta[0] ){.
41a0: 20 20 20 20 20 20 63 61 73 65 20 27 40 27 3a 20        case '@': 
41b0: 7b 0a 20 20 20 20 20 20 20 20 7a 44 65 6c 74 61  {.        zDelta
41c0: 2b 2b 3b 20 6c 65 6e 44 65 6c 74 61 2d 2d 3b 0a  ++; lenDelta--;.
41d0: 20 20 20 20 20 20 20 20 6f 66 73 74 20 3d 20 67          ofst = g
41e0: 65 74 49 6e 74 28 26 7a 44 65 6c 74 61 2c 20 26  etInt(&zDelta, &
41f0: 6c 65 6e 44 65 6c 74 61 29 3b 0a 20 20 20 20 20  lenDelta);.     
4200: 20 20 20 69 66 28 20 7a 44 65 6c 74 61 5b 30 5d     if( zDelta[0]
4210: 21 3d 27 2c 27 20 29 7b 0a 20 20 20 20 20 20 20  !=',' ){.       
4220: 20 20 20 2f 2a 20 45 52 52 4f 52 3a 20 63 6f 70     /* ERROR: cop
4230: 79 20 63 6f 6d 6d 61 6e 64 20 6e 6f 74 20 74 65  y command not te
4240: 72 6d 69 6e 61 74 65 64 20 62 79 20 27 2c 27 20  rminated by ',' 
4250: 2a 2f 0a 20 20 20 20 20 20 20 20 20 20 72 65 74  */.          ret
4260: 75 72 6e 20 2d 31 3b 0a 20 20 20 20 20 20 20 20  urn -1;.        
4270: 7d 0a 20 20 20 20 20 20 20 20 7a 44 65 6c 74 61  }.        zDelta
4280: 2b 2b 3b 20 6c 65 6e 44 65 6c 74 61 2d 2d 3b 0a  ++; lenDelta--;.
4290: 20 20 20 20 20 20 20 20 44 45 42 55 47 31 28 20          DEBUG1( 
42a0: 70 72 69 6e 74 66 28 22 43 4f 50 59 20 25 64 20  printf("COPY %d 
42b0: 66 72 6f 6d 20 25 64 5c 6e 22 2c 20 63 6e 74 2c  from %d\n", cnt,
42c0: 20 6f 66 73 74 29 3b 20 29 0a 20 20 20 20 20 20   ofst); ).      
42d0: 20 20 74 6f 74 61 6c 20 2b 3d 20 63 6e 74 3b 0a    total += cnt;.
42e0: 20 20 20 20 20 20 20 20 69 66 28 20 74 6f 74 61          if( tota
42f0: 6c 3e 6c 69 6d 69 74 20 29 7b 0a 20 20 20 20 20  l>limit ){.     
4300: 20 20 20 20 20 2f 2a 20 45 52 52 4f 52 3a 20 63       /* ERROR: c
4310: 6f 70 79 20 65 78 63 65 65 64 73 20 6f 75 74 70  opy exceeds outp
4320: 75 74 20 66 69 6c 65 20 73 69 7a 65 20 2a 2f 0a  ut file size */.
4330: 20 20 20 20 20 20 20 20 20 20 72 65 74 75 72 6e            return
4340: 20 2d 31 3b 0a 20 20 20 20 20 20 20 20 7d 0a 20   -1;.        }. 
4350: 20 20 20 20 20 20 20 69 66 28 20 6f 66 73 74 2b         if( ofst+
4360: 63 6e 74 20 3e 20 6c 65 6e 53 72 63 20 29 7b 0a  cnt > lenSrc ){.
4370: 20 20 20 20 20 20 20 20 20 20 2f 2a 20 45 52 52            /* ERR
4380: 4f 52 3a 20 63 6f 70 79 20 65 78 74 65 6e 64 73  OR: copy extends
4390: 20 70 61 73 74 20 65 6e 64 20 6f 66 20 69 6e 70   past end of inp
43a0: 75 74 20 2a 2f 0a 20 20 20 20 20 20 20 20 20 20  ut */.          
43b0: 72 65 74 75 72 6e 20 2d 31 3b 0a 20 20 20 20 20  return -1;.     
43c0: 20 20 20 7d 0a 20 20 20 20 20 20 20 20 6d 65 6d     }.        mem
43d0: 63 70 79 28 7a 4f 75 74 2c 20 26 7a 53 72 63 5b  cpy(zOut, &zSrc[
43e0: 6f 66 73 74 5d 2c 20 63 6e 74 29 3b 0a 20 20 20  ofst], cnt);.   
43f0: 20 20 20 20 20 7a 4f 75 74 20 2b 3d 20 63 6e 74       zOut += cnt
4400: 3b 0a 20 20 20 20 20 20 20 20 62 72 65 61 6b 3b  ;.        break;
4410: 0a 20 20 20 20 20 20 7d 0a 20 20 20 20 20 20 63  .      }.      c
4420: 61 73 65 20 27 3a 27 3a 20 7b 0a 20 20 20 20 20  ase ':': {.     
4430: 20 20 20 7a 44 65 6c 74 61 2b 2b 3b 20 6c 65 6e     zDelta++; len
4440: 44 65 6c 74 61 2d 2d 3b 0a 20 20 20 20 20 20 20  Delta--;.       
4450: 20 74 6f 74 61 6c 20 2b 3d 20 63 6e 74 3b 0a 20   total += cnt;. 
4460: 20 20 20 20 20 20 20 69 66 28 20 74 6f 74 61 6c         if( total
4470: 3e 6c 69 6d 69 74 20 29 7b 0a 20 20 20 20 20 20  >limit ){.      
4480: 20 20 20 20 2f 2a 20 45 52 52 4f 52 3a 20 20 69      /* ERROR:  i
4490: 6e 73 65 72 74 20 63 6f 6d 6d 61 6e 64 20 67 69  nsert command gi
44a0: 76 65 73 20 61 6e 20 6f 75 74 70 75 74 20 6c 61  ves an output la
44b0: 72 67 65 72 20 74 68 61 6e 20 70 72 65 64 69 63  rger than predic
44c0: 74 65 64 20 2a 2f 0a 20 20 20 20 20 20 20 20 20  ted */.         
44d0: 20 72 65 74 75 72 6e 20 2d 31 3b 0a 20 20 20 20   return -1;.    
44e0: 20 20 20 20 7d 0a 20 20 20 20 20 20 20 20 44 45      }.        DE
44f0: 42 55 47 31 28 20 70 72 69 6e 74 66 28 22 49 4e  BUG1( printf("IN
4500: 53 45 52 54 20 25 64 5c 6e 22 2c 20 63 6e 74 29  SERT %d\n", cnt)
4510: 3b 20 29 0a 20 20 20 20 20 20 20 20 69 66 28 20  ; ).        if( 
4520: 63 6e 74 3e 6c 65 6e 44 65 6c 74 61 20 29 7b 0a  cnt>lenDelta ){.
4530: 20 20 20 20 20 20 20 20 20 20 2f 2a 20 45 52 52            /* ERR
4540: 4f 52 3a 20 69 6e 73 65 72 74 20 63 6f 75 6e 74  OR: insert count
4550: 20 65 78 63 65 65 64 73 20 73 69 7a 65 20 6f 66   exceeds size of
4560: 20 64 65 6c 74 61 20 2a 2f 0a 20 20 20 20 20 20   delta */.      
4570: 20 20 20 20 72 65 74 75 72 6e 20 2d 31 3b 0a 20      return -1;. 
4580: 20 20 20 20 20 20 20 7d 0a 20 20 20 20 20 20 20         }.       
4590: 20 6d 65 6d 63 70 79 28 7a 4f 75 74 2c 20 7a 44   memcpy(zOut, zD
45a0: 65 6c 74 61 2c 20 63 6e 74 29 3b 0a 20 20 20 20  elta, cnt);.    
45b0: 20 20 20 20 7a 4f 75 74 20 2b 3d 20 63 6e 74 3b      zOut += cnt;
45c0: 0a 20 20 20 20 20 20 20 20 7a 44 65 6c 74 61 20  .        zDelta 
45d0: 2b 3d 20 63 6e 74 3b 0a 20 20 20 20 20 20 20 20  += cnt;.        
45e0: 6c 65 6e 44 65 6c 74 61 20 2d 3d 20 63 6e 74 3b  lenDelta -= cnt;
45f0: 0a 20 20 20 20 20 20 20 20 62 72 65 61 6b 3b 0a  .        break;.
4600: 20 20 20 20 20 20 7d 0a 20 20 20 20 20 20 63 61        }.      ca
4610: 73 65 20 27 3b 27 3a 20 7b 0a 20 20 20 20 20 20  se ';': {.      
4620: 20 20 7a 44 65 6c 74 61 2b 2b 3b 20 6c 65 6e 44    zDelta++; lenD
4630: 65 6c 74 61 2d 2d 3b 0a 20 20 20 20 20 20 20 20  elta--;.        
4640: 7a 4f 75 74 5b 30 5d 20 3d 20 30 3b 0a 20 20 20  zOut[0] = 0;.   
4650: 20 20 20 20 20 69 66 28 20 63 6e 74 21 3d 63 68       if( cnt!=ch
4660: 65 63 6b 73 75 6d 28 7a 4f 72 69 67 4f 75 74 2c  ecksum(zOrigOut,
4670: 20 74 6f 74 61 6c 29 20 29 7b 0a 20 20 20 20 20   total) ){.     
4680: 20 20 20 20 20 2f 2a 20 45 52 52 4f 52 3a 20 20       /* ERROR:  
4690: 62 61 64 20 63 68 65 63 6b 73 75 6d 20 2a 2f 0a  bad checksum */.
46a0: 20 20 20 20 20 20 20 20 20 20 72 65 74 75 72 6e            return
46b0: 20 2d 31 3b 0a 20 20 20 20 20 20 20 20 7d 0a 20   -1;.        }. 
46c0: 20 20 20 20 20 20 20 69 66 28 20 74 6f 74 61 6c         if( total
46d0: 21 3d 6c 69 6d 69 74 20 29 7b 0a 20 20 20 20 20  !=limit ){.     
46e0: 20 20 20 20 20 2f 2a 20 45 52 52 4f 52 3a 20 67       /* ERROR: g
46f0: 65 6e 65 72 61 74 65 64 20 73 69 7a 65 20 64 6f  enerated size do
4700: 65 73 20 6e 6f 74 20 6d 61 74 63 68 20 70 72 65  es not match pre
4710: 64 69 63 74 65 64 20 73 69 7a 65 20 2a 2f 0a 20  dicted size */. 
4720: 20 20 20 20 20 20 20 20 20 72 65 74 75 72 6e 20           return 
4730: 2d 31 3b 0a 20 20 20 20 20 20 20 20 7d 0a 20 20  -1;.        }.  
4740: 20 20 20 20 20 20 72 65 74 75 72 6e 20 74 6f 74        return tot
4750: 61 6c 3b 0a 20 20 20 20 20 20 7d 0a 20 20 20 20  al;.      }.    
4760: 20 20 64 65 66 61 75 6c 74 3a 20 7b 0a 20 20 20    default: {.   
4770: 20 20 20 20 20 2f 2a 20 45 52 52 4f 52 3a 20 75       /* ERROR: u
4780: 6e 6b 6e 6f 77 6e 20 64 65 6c 74 61 20 6f 70 65  nknown delta ope
4790: 72 61 74 6f 72 20 2a 2f 0a 20 20 20 20 20 20 20  rator */.       
47a0: 20 72 65 74 75 72 6e 20 2d 31 3b 0a 20 20 20 20   return -1;.    
47b0: 20 20 7d 0a 20 20 20 20 7d 0a 20 20 7d 0a 20 20    }.    }.  }.  
47c0: 2f 2a 20 45 52 52 4f 52 3a 20 75 6e 74 65 72 6d  /* ERROR: unterm
47d0: 69 6e 61 74 65 64 20 64 65 6c 74 61 20 2a 2f 0a  inated delta */.
47e0: 20 20 72 65 74 75 72 6e 20 2d 31 3b 0a 7d 0a       return -1;.}.