0000: 2f 2a 0a 2a 2a 20 43 6f 70 79 72 69 67 68 74 20 /*.** Copyright
0010: 28 63 29 20 32 30 30 36 20 44 2e 20 52 69 63 68 (c) 2006 D. Rich
0020: 61 72 64 20 48 69 70 70 0a 2a 2a 0a 2a 2a 20 54 ard Hipp.**.** T
0030: 68 69 73 20 70 72 6f 67 72 61 6d 20 69 73 20 66 his program is f
0040: 72 65 65 20 73 6f 66 74 77 61 72 65 3b 20 79 6f ree software; yo
0050: 75 20 63 61 6e 20 72 65 64 69 73 74 72 69 62 75 u can redistribu
0060: 74 65 20 69 74 20 61 6e 64 2f 6f 72 0a 2a 2a 20 te it and/or.**
0070: 6d 6f 64 69 66 79 20 69 74 20 75 6e 64 65 72 20 modify it under
0080: 74 68 65 20 74 65 72 6d 73 20 6f 66 20 74 68 65 the terms of the
0090: 20 47 4e 55 20 47 65 6e 65 72 61 6c 20 50 75 62 GNU General Pub
00a0: 6c 69 63 0a 2a 2a 20 4c 69 63 65 6e 73 65 20 76 lic.** License v
00b0: 65 72 73 69 6f 6e 20 32 20 61 73 20 70 75 62 6c ersion 2 as publ
00c0: 69 73 68 65 64 20 62 79 20 74 68 65 20 46 72 65 ished by the Fre
00d0: 65 20 53 6f 66 74 77 61 72 65 20 46 6f 75 6e 64 e Software Found
00e0: 61 74 69 6f 6e 2e 0a 2a 2a 0a 2a 2a 20 54 68 69 ation..**.** Thi
00f0: 73 20 70 72 6f 67 72 61 6d 20 69 73 20 64 69 73 s program is dis
0100: 74 72 69 62 75 74 65 64 20 69 6e 20 74 68 65 20 tributed in the
0110: 68 6f 70 65 20 74 68 61 74 20 69 74 20 77 69 6c hope that it wil
0120: 6c 20 62 65 20 75 73 65 66 75 6c 2c 0a 2a 2a 20 l be useful,.**
0130: 62 75 74 20 57 49 54 48 4f 55 54 20 41 4e 59 20 but WITHOUT ANY
0140: 57 41 52 52 41 4e 54 59 3b 20 77 69 74 68 6f 75 WARRANTY; withou
0150: 74 20 65 76 65 6e 20 74 68 65 20 69 6d 70 6c 69 t even the impli
0160: 65 64 20 77 61 72 72 61 6e 74 79 20 6f 66 0a 2a ed warranty of.*
0170: 2a 20 4d 45 52 43 48 41 4e 54 41 42 49 4c 49 54 * MERCHANTABILIT
0180: 59 20 6f 72 20 46 49 54 4e 45 53 53 20 46 4f 52 Y or FITNESS FOR
0190: 20 41 20 50 41 52 54 49 43 55 4c 41 52 20 50 55 A PARTICULAR PU
01a0: 52 50 4f 53 45 2e 20 20 53 65 65 20 74 68 65 20 RPOSE. See the
01b0: 47 4e 55 0a 2a 2a 20 47 65 6e 65 72 61 6c 20 50 GNU.** General P
01c0: 75 62 6c 69 63 20 4c 69 63 65 6e 73 65 20 66 6f ublic License fo
01d0: 72 20 6d 6f 72 65 20 64 65 74 61 69 6c 73 2e 0a r more details..
01e0: 2a 2a 20 0a 2a 2a 20 59 6f 75 20 73 68 6f 75 6c ** .** You shoul
01f0: 64 20 68 61 76 65 20 72 65 63 65 69 76 65 64 20 d have received
0200: 61 20 63 6f 70 79 20 6f 66 20 74 68 65 20 47 4e a copy of the GN
0210: 55 20 47 65 6e 65 72 61 6c 20 50 75 62 6c 69 63 U General Public
0220: 0a 2a 2a 20 4c 69 63 65 6e 73 65 20 61 6c 6f 6e .** License alon
0230: 67 20 77 69 74 68 20 74 68 69 73 20 6c 69 62 72 g with this libr
0240: 61 72 79 3b 20 69 66 20 6e 6f 74 2c 20 77 72 69 ary; if not, wri
0250: 74 65 20 74 6f 20 74 68 65 0a 2a 2a 20 46 72 65 te to the.** Fre
0260: 65 20 53 6f 66 74 77 61 72 65 20 46 6f 75 6e 64 e Software Found
0270: 61 74 69 6f 6e 2c 20 49 6e 63 2e 2c 20 35 39 20 ation, Inc., 59
0280: 54 65 6d 70 6c 65 20 50 6c 61 63 65 20 2d 20 53 Temple Place - S
0290: 75 69 74 65 20 33 33 30 2c 0a 2a 2a 20 42 6f 73 uite 330,.** Bos
02a0: 74 6f 6e 2c 20 4d 41 20 20 30 32 31 31 31 2d 31 ton, MA 02111-1
02b0: 33 30 37 2c 20 55 53 41 2e 0a 2a 2a 0a 2a 2a 20 307, USA..**.**
02c0: 41 75 74 68 6f 72 20 63 6f 6e 74 61 63 74 20 69 Author contact i
02d0: 6e 66 6f 72 6d 61 74 69 6f 6e 3a 0a 2a 2a 20 20 nformation:.**
02e0: 20 64 72 68 40 68 77 61 63 69 2e 63 6f 6d 0a 2a drh@hwaci.com.*
02f0: 2a 20 20 20 68 74 74 70 3a 2f 2f 77 77 77 2e 68 * http://www.h
0300: 77 61 63 69 2e 63 6f 6d 2f 64 72 68 2f 0a 2a 2a waci.com/drh/.**
0310: 0a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a .***************
0320: 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a ****************
0330: 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a ****************
0340: 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a ****************
0350: 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a 2a ****************
0360: 0a 2a 2a 0a 2a 2a 20 54 68 69 73 20 6d 6f 64 75 .**.** This modu
0370: 6c 65 20 69 6d 70 6c 65 6d 65 6e 74 73 20 74 68 le implements th
0380: 65 20 64 65 6c 74 61 20 63 6f 6d 70 72 65 73 73 e delta compress
0390: 20 61 6c 67 6f 72 69 74 68 6d 2e 0a 2a 2a 0a 2a algorithm..**.*
03a0: 2a 20 54 68 6f 75 67 68 20 64 65 76 65 6c 6f 70 * Though develop
03b0: 65 64 20 73 70 65 63 69 66 69 63 61 6c 6c 79 20 ed specifically
03c0: 66 6f 72 20 66 6f 73 73 69 6c 2c 20 74 68 65 20 for fossil, the
03d0: 63 6f 64 65 20 69 6e 20 74 68 69 73 20 66 69 6c code in this fil
03e0: 65 0a 2a 2a 20 69 73 20 67 65 6e 65 72 61 6c 6c e.** is generall
03f0: 79 20 61 70 70 6c 69 61 62 6c 65 20 61 6e 64 20 y appliable and
0400: 69 73 20 74 68 75 73 20 65 61 73 69 6c 79 20 73 is thus easily s
0410: 65 70 61 72 61 74 65 64 20 66 72 6f 6d 20 74 68 eparated from th
0420: 65 0a 2a 2a 20 66 6f 73 73 69 6c 20 73 6f 75 72 e.** fossil sour
0430: 63 65 20 63 6f 64 65 20 62 61 73 65 2e 20 20 4e ce code base. N
0440: 6f 74 68 69 6e 67 20 69 6e 20 74 68 69 73 20 66 othing in this f
0450: 69 6c 65 20 64 65 70 65 6e 64 73 20 6f 6e 20 61 ile depends on a
0460: 6e 79 74 68 69 6e 67 0a 2a 2a 20 65 6c 73 65 20 nything.** else
0470: 69 6e 20 66 6f 73 73 69 6c 2e 0a 2a 2f 0a 23 69 in fossil..*/.#i
0480: 6e 63 6c 75 64 65 20 3c 73 74 64 69 6f 2e 68 3e nclude <stdio.h>
0490: 0a 23 69 6e 63 6c 75 64 65 20 3c 61 73 73 65 72 .#include <asser
04a0: 74 2e 68 3e 0a 23 69 6e 63 6c 75 64 65 20 3c 73 t.h>.#include <s
04b0: 74 64 6c 69 62 2e 68 3e 0a 23 69 6e 63 6c 75 64 tdlib.h>.#includ
04c0: 65 20 3c 73 74 72 69 6e 67 2e 68 3e 0a 0a 2f 2a e <string.h>../*
04d0: 0a 2a 2a 20 4d 61 63 72 6f 73 20 66 6f 72 20 74 .** Macros for t
04e0: 75 72 6e 69 6e 67 20 64 65 62 75 67 67 69 6e 67 urning debugging
04f0: 20 70 72 69 6e 74 66 73 20 6f 6e 20 61 6e 64 20 printfs on and
0500: 6f 66 66 0a 2a 2f 0a 23 69 66 20 30 0a 23 20 64 off.*/.#if 0.# d
0510: 65 66 69 6e 65 20 44 45 42 55 47 31 28 58 29 20 efine DEBUG1(X)
0520: 58 0a 23 65 6c 73 65 0a 23 20 64 65 66 69 6e 65 X.#else.# define
0530: 20 44 45 42 55 47 31 28 58 29 0a 23 65 6e 64 69 DEBUG1(X).#endi
0540: 66 0a 23 69 66 20 30 0a 23 64 65 66 69 6e 65 20 f.#if 0.#define
0550: 44 45 42 55 47 32 28 58 29 20 58 0a 2f 2a 0a 2a DEBUG2(X) X./*.*
0560: 2a 20 46 6f 72 20 64 65 62 75 67 67 69 6e 67 3a * For debugging:
0570: 0a 2a 2a 20 50 72 69 6e 74 20 31 36 20 63 68 61 .** Print 16 cha
0580: 72 61 63 74 65 72 73 20 6f 66 20 74 65 78 74 20 racters of text
0590: 66 72 6f 6d 20 7a 42 75 66 0a 2a 2f 0a 73 74 61 from zBuf.*/.sta
05a0: 74 69 63 20 63 6f 6e 73 74 20 63 68 61 72 20 2a tic const char *
05b0: 70 72 69 6e 74 31 36 28 63 6f 6e 73 74 20 63 68 print16(const ch
05c0: 61 72 20 2a 7a 29 7b 0a 20 20 69 6e 74 20 69 3b ar *z){. int i;
05d0: 0a 20 20 73 74 61 74 69 63 20 63 68 61 72 20 7a . static char z
05e0: 42 75 66 5b 32 30 5d 3b 0a 20 20 66 6f 72 28 69 Buf[20];. for(i
05f0: 3d 30 3b 20 69 3c 31 36 3b 20 69 2b 2b 29 7b 0a =0; i<16; i++){.
0600: 20 20 20 20 69 66 28 20 7a 5b 69 5d 3e 3d 30 78 if( z[i]>=0x
0610: 32 30 20 26 26 20 7a 5b 69 5d 3c 3d 30 78 37 65 20 && z[i]<=0x7e
0620: 20 29 7b 0a 20 20 20 20 20 20 7a 42 75 66 5b 69 ){. zBuf[i
0630: 5d 20 3d 20 7a 5b 69 5d 3b 0a 20 20 20 20 7d 65 ] = z[i];. }e
0640: 6c 73 65 7b 0a 20 20 20 20 20 20 7a 42 75 66 5b lse{. zBuf[
0650: 69 5d 20 3d 20 27 2e 27 3b 0a 20 20 20 20 7d 0a i] = '.';. }.
0660: 20 20 7d 0a 20 20 7a 42 75 66 5b 69 5d 20 3d 20 }. zBuf[i] =
0670: 30 3b 0a 20 20 72 65 74 75 72 6e 20 7a 42 75 66 0;. return zBuf
0680: 3b 0a 7d 0a 23 65 6c 73 65 0a 23 20 64 65 66 69 ;.}.#else.# defi
0690: 6e 65 20 44 45 42 55 47 32 28 58 29 0a 23 65 6e ne DEBUG2(X).#en
06a0: 64 69 66 0a 0a 0a 2f 2a 0a 2a 2a 20 54 68 65 20 dif.../*.** The
06b0: 22 75 33 32 22 20 74 79 70 65 20 6d 75 73 74 20 "u32" type must
06c0: 62 65 20 61 6e 20 75 6e 73 69 67 6e 65 64 20 33 be an unsigned 3
06d0: 32 2d 62 69 74 20 69 6e 74 65 67 65 72 2e 20 20 2-bit integer.
06e0: 41 64 6a 75 73 74 20 74 68 69 73 0a 2a 2f 0a 74 Adjust this.*/.t
06f0: 79 70 65 64 65 66 20 75 6e 73 69 67 6e 65 64 20 ypedef unsigned
0700: 69 6e 74 20 75 33 32 3b 0a 0a 2f 2a 0a 2a 2a 20 int u32;../*.**
0710: 4d 75 73 74 20 62 65 20 61 20 31 36 2d 62 69 74 Must be a 16-bit
0720: 20 76 61 6c 75 65 20 0a 2a 2f 0a 74 79 70 65 64 value .*/.typed
0730: 65 66 20 73 68 6f 72 74 20 69 6e 74 20 73 31 36 ef short int s16
0740: 3b 0a 74 79 70 65 64 65 66 20 75 6e 73 69 67 6e ;.typedef unsign
0750: 65 64 20 73 68 6f 72 74 20 69 6e 74 20 75 31 36 ed short int u16
0760: 3b 0a 0a 2f 2a 0a 2a 2a 20 54 68 65 20 77 69 64 ;../*.** The wid
0770: 74 68 20 6f 66 20 61 20 68 61 73 68 20 77 69 6e th of a hash win
0780: 64 6f 77 20 69 6e 20 62 79 74 65 73 2e 20 20 54 dow in bytes. T
0790: 68 65 20 61 6c 67 6f 72 69 74 68 6d 20 6f 6e 6c he algorithm onl
07a0: 79 20 77 6f 72 6b 73 20 69 66 20 74 68 69 73 0a y works if this.
07b0: 2a 2a 20 69 73 20 61 20 70 6f 77 65 72 20 6f 66 ** is a power of
07c0: 20 32 2e 0a 2a 2f 0a 23 64 65 66 69 6e 65 20 4e 2..*/.#define N
07d0: 48 41 53 48 20 31 36 0a 0a 2f 2a 0a 2a 2a 20 54 HASH 16../*.** T
07e0: 68 65 20 63 75 72 72 65 6e 74 20 73 74 61 74 65 he current state
07f0: 20 6f 66 20 74 68 65 20 72 6f 6c 6c 69 6e 67 20 of the rolling
0800: 68 61 73 68 2e 0a 2a 2a 0a 2a 2a 20 7a 5b 5d 20 hash..**.** z[]
0810: 68 6f 6c 64 73 20 74 68 65 20 76 61 6c 75 65 73 holds the values
0820: 20 74 68 61 74 20 68 61 76 65 20 62 65 65 6e 20 that have been
0830: 68 61 73 68 65 64 2e 20 20 7a 5b 5d 20 69 73 20 hashed. z[] is
0840: 61 20 63 69 72 63 75 6c 61 72 20 62 75 66 66 65 a circular buffe
0850: 72 2e 0a 2a 2a 20 7a 5b 69 5d 20 69 73 20 74 68 r..** z[i] is th
0860: 65 20 66 69 72 73 74 20 65 6e 74 72 79 20 61 6e e first entry an
0870: 64 20 7a 5b 28 69 2b 4e 48 41 53 48 2d 31 29 25 d z[(i+NHASH-1)%
0880: 4e 48 41 53 48 5d 20 69 73 20 74 68 65 20 6c 61 NHASH] is the la
0890: 73 74 20 65 6e 74 72 79 20 6f 66 20 0a 2a 2a 20 st entry of .**
08a0: 74 68 65 20 77 69 6e 64 6f 77 2e 0a 2a 2a 0a 2a the window..**.*
08b0: 2a 20 48 61 73 68 2e 61 20 69 73 20 74 68 65 20 * Hash.a is the
08c0: 73 75 6d 20 6f 66 20 61 6c 6c 20 65 6c 65 6d 65 sum of all eleme
08d0: 6e 74 73 20 6f 66 20 68 61 73 68 2e 7a 5b 5d 2e nts of hash.z[].
08e0: 20 20 48 61 73 68 2e 62 20 69 73 20 61 20 77 65 Hash.b is a we
08f0: 69 67 68 74 65 64 0a 2a 2a 20 73 75 6d 2e 20 20 ighted.** sum.
0900: 48 61 73 68 2e 62 20 69 73 20 7a 5b 69 5d 2a 4e Hash.b is z[i]*N
0910: 48 41 53 48 20 2b 20 7a 5b 69 2b 31 5d 2a 28 4e HASH + z[i+1]*(N
0920: 48 41 53 48 2d 31 29 20 2b 20 2e 2e 2e 20 2b 20 HASH-1) + ... +
0930: 7a 5b 69 2b 4e 48 41 53 48 2d 31 5d 2a 31 2e 0a z[i+NHASH-1]*1..
0940: 2a 2a 20 28 45 61 63 68 20 69 6e 64 65 78 20 66 ** (Each index f
0950: 6f 72 20 7a 5b 5d 20 73 68 6f 75 6c 64 20 62 65 or z[] should be
0960: 20 6d 6f 64 75 6c 65 20 4e 48 41 53 48 2c 20 6f module NHASH, o
0970: 66 20 63 6f 75 72 73 65 2e 20 20 54 68 65 20 25 f course. The %
0980: 4e 48 41 53 48 20 6f 70 65 72 61 74 6f 72 0a 2a NHASH operator.*
0990: 2a 20 69 73 20 6f 6d 69 74 74 65 64 20 69 6e 20 * is omitted in
09a0: 74 68 65 20 70 72 69 6f 72 20 65 78 70 72 65 73 the prior expres
09b0: 73 69 6f 6e 20 66 6f 72 20 62 72 65 76 69 74 79 sion for brevity
09c0: 2e 29 0a 2a 2f 0a 74 79 70 65 64 65 66 20 73 74 .).*/.typedef st
09d0: 72 75 63 74 20 68 61 73 68 20 68 61 73 68 3b 0a ruct hash hash;.
09e0: 73 74 72 75 63 74 20 68 61 73 68 20 7b 0a 20 20 struct hash {.
09f0: 75 31 36 20 61 2c 20 62 3b 20 20 20 20 20 20 20 u16 a, b;
0a00: 20 20 2f 2a 20 48 61 73 68 20 76 61 6c 75 65 73 /* Hash values
0a10: 20 2a 2f 0a 20 20 75 31 36 20 69 3b 20 20 20 20 */. u16 i;
0a20: 20 20 20 20 20 20 20 20 2f 2a 20 53 74 61 72 74 /* Start
0a30: 20 6f 66 20 74 68 65 20 68 61 73 68 20 77 69 6e of the hash win
0a40: 64 6f 77 20 2a 2f 0a 20 20 63 68 61 72 20 7a 5b dow */. char z[
0a50: 4e 48 41 53 48 5d 3b 20 20 20 20 2f 2a 20 54 68 NHASH]; /* Th
0a60: 65 20 76 61 6c 75 65 73 20 74 68 61 74 20 68 61 e values that ha
0a70: 76 65 20 62 65 65 6e 20 68 61 73 68 65 64 20 2a ve been hashed *
0a80: 2f 0a 7d 3b 0a 0a 2f 2a 0a 2a 2a 20 49 6e 69 74 /.};../*.** Init
0a90: 69 61 6c 69 7a 65 20 74 68 65 20 72 6f 6c 6c 69 ialize the rolli
0aa0: 6e 67 20 68 61 73 68 20 75 73 69 6e 67 20 74 68 ng hash using th
0ab0: 65 20 66 69 72 73 74 20 4e 48 41 53 48 20 63 68 e first NHASH ch
0ac0: 61 72 61 63 74 65 72 73 20 6f 66 20 7a 5b 5d 0a aracters of z[].
0ad0: 2a 2f 0a 73 74 61 74 69 63 20 76 6f 69 64 20 68 */.static void h
0ae0: 61 73 68 5f 69 6e 69 74 28 68 61 73 68 20 2a 70 ash_init(hash *p
0af0: 48 61 73 68 2c 20 63 6f 6e 73 74 20 63 68 61 72 Hash, const char
0b00: 20 2a 7a 29 7b 0a 20 20 75 31 36 20 61 2c 20 62 *z){. u16 a, b
0b10: 2c 20 69 3b 0a 20 20 61 20 3d 20 62 20 3d 20 30 , i;. a = b = 0
0b20: 3b 0a 20 20 66 6f 72 28 69 3d 30 3b 20 69 3c 4e ;. for(i=0; i<N
0b30: 48 41 53 48 3b 20 69 2b 2b 29 7b 0a 20 20 20 20 HASH; i++){.
0b40: 61 20 2b 3d 20 7a 5b 69 5d 3b 0a 20 20 20 20 62 a += z[i];. b
0b50: 20 2b 3d 20 28 4e 48 41 53 48 2d 69 29 2a 7a 5b += (NHASH-i)*z[
0b60: 69 5d 3b 0a 20 20 20 20 70 48 61 73 68 2d 3e 7a i];. pHash->z
0b70: 5b 69 5d 20 3d 20 7a 5b 69 5d 3b 0a 20 20 7d 0a [i] = z[i];. }.
0b80: 20 20 70 48 61 73 68 2d 3e 61 20 3d 20 61 20 26 pHash->a = a &
0b90: 20 30 78 66 66 66 66 3b 0a 20 20 70 48 61 73 68 0xffff;. pHash
0ba0: 2d 3e 62 20 3d 20 62 20 26 20 30 78 66 66 66 66 ->b = b & 0xffff
0bb0: 3b 0a 20 20 70 48 61 73 68 2d 3e 69 20 3d 20 30 ;. pHash->i = 0
0bc0: 3b 0a 7d 0a 0a 2f 2a 0a 2a 2a 20 41 64 76 61 6e ;.}../*.** Advan
0bd0: 63 65 20 74 68 65 20 72 6f 6c 6c 69 6e 67 20 68 ce the rolling h
0be0: 61 73 68 20 62 79 20 61 20 73 69 6e 67 6c 65 20 ash by a single
0bf0: 63 68 61 72 61 63 74 65 72 20 22 63 22 0a 2a 2f character "c".*/
0c00: 0a 73 74 61 74 69 63 20 76 6f 69 64 20 68 61 73 .static void has
0c10: 68 5f 6e 65 78 74 28 68 61 73 68 20 2a 70 48 61 h_next(hash *pHa
0c20: 73 68 2c 20 69 6e 74 20 63 29 7b 0a 20 20 75 31 sh, int c){. u1
0c30: 36 20 6f 6c 64 20 3d 20 70 48 61 73 68 2d 3e 7a 6 old = pHash->z
0c40: 5b 70 48 61 73 68 2d 3e 69 5d 3b 0a 20 20 70 48 [pHash->i];. pH
0c50: 61 73 68 2d 3e 7a 5b 70 48 61 73 68 2d 3e 69 5d ash->z[pHash->i]
0c60: 20 3d 20 63 3b 0a 20 20 70 48 61 73 68 2d 3e 69 = c;. pHash->i
0c70: 20 3d 20 28 70 48 61 73 68 2d 3e 69 2b 31 29 26 = (pHash->i+1)&
0c80: 28 4e 48 41 53 48 2d 31 29 3b 0a 20 20 70 48 61 (NHASH-1);. pHa
0c90: 73 68 2d 3e 61 20 3d 20 70 48 61 73 68 2d 3e 61 sh->a = pHash->a
0ca0: 20 2d 20 6f 6c 64 20 2b 20 63 3b 0a 20 20 70 48 - old + c;. pH
0cb0: 61 73 68 2d 3e 62 20 3d 20 70 48 61 73 68 2d 3e ash->b = pHash->
0cc0: 62 20 2d 20 4e 48 41 53 48 2a 6f 6c 64 20 2b 20 b - NHASH*old +
0cd0: 70 48 61 73 68 2d 3e 61 3b 0a 7d 0a 0a 2f 2a 0a pHash->a;.}../*.
0ce0: 2a 2a 20 52 65 74 75 72 6e 20 61 20 33 32 2d 62 ** Return a 32-b
0cf0: 69 74 20 68 61 73 68 20 76 61 6c 75 65 0a 2a 2f it hash value.*/
0d00: 0a 73 74 61 74 69 63 20 75 33 32 20 68 61 73 68 .static u32 hash
0d10: 5f 33 32 62 69 74 28 68 61 73 68 20 2a 70 48 61 _32bit(hash *pHa
0d20: 73 68 29 7b 0a 20 20 72 65 74 75 72 6e 20 28 70 sh){. return (p
0d30: 48 61 73 68 2d 3e 61 20 26 20 30 78 66 66 66 66 Hash->a & 0xffff
0d40: 29 20 7c 20 28 28 28 75 33 32 29 28 70 48 61 73 ) | (((u32)(pHas
0d50: 68 2d 3e 62 20 26 20 30 78 66 66 66 66 29 29 3c h->b & 0xffff))<
0d60: 3c 31 36 29 3b 0a 7d 0a 0a 2f 2a 0a 2a 2a 20 57 <16);.}../*.** W
0d70: 72 69 74 65 20 61 6e 20 62 61 73 65 2d 36 34 20 rite an base-64
0d80: 69 6e 74 65 67 65 72 20 69 6e 74 6f 20 74 68 65 integer into the
0d90: 20 67 69 76 65 6e 20 62 75 66 66 65 72 2e 0a 2a given buffer..*
0da0: 2f 0a 73 74 61 74 69 63 20 76 6f 69 64 20 70 75 /.static void pu
0db0: 74 49 6e 74 28 75 6e 73 69 67 6e 65 64 20 69 6e tInt(unsigned in
0dc0: 74 20 76 2c 20 63 68 61 72 20 2a 2a 70 7a 29 7b t v, char **pz){
0dd0: 0a 20 20 73 74 61 74 69 63 20 63 6f 6e 73 74 20 . static const
0de0: 63 68 61 72 20 7a 44 69 67 69 74 73 5b 5d 20 3d char zDigits[] =
0df0: 20 0a 20 20 20 20 22 30 31 32 33 34 35 36 37 38 . "012345678
0e00: 39 41 42 43 44 45 46 47 48 49 4a 4b 4c 4d 4e 4f 9ABCDEFGHIJKLMNO
0e10: 50 51 52 53 54 55 56 57 58 59 5a 5f 61 62 63 64 PQRSTUVWXYZ_abcd
0e20: 65 66 67 68 69 6a 6b 6c 6d 6e 6f 70 71 72 73 74 efghijklmnopqrst
0e30: 75 76 77 78 79 7a 7e 22 3b 0a 20 20 2f 2a 20 20 uvwxyz~";. /*
0e40: 31 32 33 34 35 36 37 38 39 20 31 32 33 34 35 36 123456789 123456
0e50: 37 38 39 20 31 32 33 34 35 36 37 38 39 20 31 32 789 123456789 12
0e60: 33 34 35 36 37 38 39 20 31 32 33 34 35 36 37 38 3456789 12345678
0e70: 39 20 31 32 33 34 35 36 37 38 39 20 31 32 33 20 9 123456789 123
0e80: 2a 2f 0a 20 20 69 6e 74 20 69 2c 20 6a 3b 0a 20 */. int i, j;.
0e90: 20 63 68 61 72 20 7a 42 75 66 5b 32 30 5d 3b 0a char zBuf[20];.
0ea0: 20 20 69 66 28 20 76 3d 3d 30 20 29 7b 0a 20 20 if( v==0 ){.
0eb0: 20 20 2a 28 2a 70 7a 29 2b 2b 20 3d 20 27 30 27 *(*pz)++ = '0'
0ec0: 3b 0a 20 20 20 20 72 65 74 75 72 6e 3b 0a 20 20 ;. return;.
0ed0: 7d 0a 20 20 66 6f 72 28 69 3d 30 3b 20 76 3e 30 }. for(i=0; v>0
0ee0: 3b 20 69 2b 2b 2c 20 76 3e 3e 3d 36 29 7b 0a 20 ; i++, v>>=6){.
0ef0: 20 20 20 7a 42 75 66 5b 69 5d 20 3d 20 7a 44 69 zBuf[i] = zDi
0f00: 67 69 74 73 5b 76 26 30 78 33 66 5d 3b 0a 20 20 gits[v&0x3f];.
0f10: 7d 0a 20 20 66 6f 72 28 6a 3d 69 2d 31 3b 20 6a }. for(j=i-1; j
0f20: 3e 3d 30 3b 20 6a 2d 2d 29 7b 0a 20 20 20 20 2a >=0; j--){. *
0f30: 28 2a 70 7a 29 2b 2b 20 3d 20 7a 42 75 66 5b 6a (*pz)++ = zBuf[j
0f40: 5d 3b 0a 20 20 7d 0a 7d 0a 0a 2f 2a 0a 2a 2a 20 ];. }.}../*.**
0f50: 52 65 61 64 20 62 79 74 65 73 20 66 72 6f 6d 20 Read bytes from
0f60: 2a 70 7a 20 61 6e 64 20 63 6f 6e 76 65 72 74 20 *pz and convert
0f70: 74 68 65 6d 20 69 6e 74 6f 20 61 20 70 6f 73 69 them into a posi
0f80: 74 69 76 65 20 69 6e 74 65 67 65 72 2e 20 20 57 tive integer. W
0f90: 68 65 6e 0a 2a 2a 20 66 69 6e 69 73 68 65 64 2c hen.** finished,
0fa0: 20 6c 65 61 76 65 20 2a 70 7a 20 70 6f 69 6e 74 leave *pz point
0fb0: 69 6e 67 20 74 6f 20 74 68 65 20 66 69 72 73 74 ing to the first
0fc0: 20 63 68 61 72 61 63 74 65 72 20 70 61 73 74 20 character past
0fd0: 74 68 65 20 65 6e 64 20 6f 66 0a 2a 2a 20 74 68 the end of.** th
0fe0: 65 20 69 6e 74 65 67 65 72 2e 20 20 54 68 65 20 e integer. The
0ff0: 2a 70 4c 65 6e 20 70 61 72 61 6d 65 74 65 72 20 *pLen parameter
1000: 68 6f 6c 64 73 20 74 68 65 20 6c 65 6e 67 74 68 holds the length
1010: 20 6f 66 20 74 68 65 20 73 74 72 69 6e 67 0a 2a of the string.*
1020: 2a 20 69 6e 20 2a 70 7a 20 61 6e 64 20 69 73 20 * in *pz and is
1030: 64 65 63 72 65 6d 65 6e 74 65 64 20 6f 6e 63 65 decremented once
1040: 20 66 6f 72 20 65 61 63 68 20 63 68 61 72 61 63 for each charac
1050: 74 65 72 20 69 6e 20 74 68 65 20 69 6e 74 65 67 ter in the integ
1060: 65 72 2e 0a 2a 2f 0a 73 74 61 74 69 63 20 75 6e er..*/.static un
1070: 73 69 67 6e 65 64 20 69 6e 74 20 67 65 74 49 6e signed int getIn
1080: 74 28 63 6f 6e 73 74 20 63 68 61 72 20 2a 2a 70 t(const char **p
1090: 7a 2c 20 69 6e 74 20 2a 70 4c 65 6e 29 7b 0a 20 z, int *pLen){.
10a0: 20 73 74 61 74 69 63 20 63 6f 6e 73 74 20 73 69 static const si
10b0: 67 6e 65 64 20 63 68 61 72 20 7a 56 61 6c 75 65 gned char zValue
10c0: 5b 5d 20 3d 20 7b 0a 20 20 20 20 2d 31 2c 20 2d [] = {. -1, -
10d0: 31 2c 20 2d 31 2c 20 2d 31 2c 20 2d 31 2c 20 2d 1, -1, -1, -1, -
10e0: 31 2c 20 2d 31 2c 20 2d 31 2c 20 20 20 2d 31 2c 1, -1, -1, -1,
10f0: 20 2d 31 2c 20 2d 31 2c 20 2d 31 2c 20 2d 31 2c -1, -1, -1, -1,
1100: 20 2d 31 2c 20 2d 31 2c 20 2d 31 2c 0a 20 20 20 -1, -1, -1,.
1110: 20 2d 31 2c 20 2d 31 2c 20 2d 31 2c 20 2d 31 2c -1, -1, -1, -1,
1120: 20 2d 31 2c 20 2d 31 2c 20 2d 31 2c 20 2d 31 2c -1, -1, -1, -1,
1130: 20 20 20 2d 31 2c 20 2d 31 2c 20 2d 31 2c 20 2d -1, -1, -1, -
1140: 31 2c 20 2d 31 2c 20 2d 31 2c 20 2d 31 2c 20 2d 1, -1, -1, -1, -
1150: 31 2c 0a 20 20 20 20 2d 31 2c 20 2d 31 2c 20 2d 1,. -1, -1, -
1160: 31 2c 20 2d 31 2c 20 2d 31 2c 20 2d 31 2c 20 2d 1, -1, -1, -1, -
1170: 31 2c 20 2d 31 2c 20 20 20 2d 31 2c 20 2d 31 2c 1, -1, -1, -1,
1180: 20 2d 31 2c 20 2d 31 2c 20 2d 31 2c 20 2d 31 2c -1, -1, -1, -1,
1190: 20 2d 31 2c 20 2d 31 2c 0a 20 20 20 20 20 30 2c -1, -1,. 0,
11a0: 20 20 31 2c 20 20 32 2c 20 20 33 2c 20 20 34 2c 1, 2, 3, 4,
11b0: 20 20 35 2c 20 20 36 2c 20 20 37 2c 20 20 20 20 5, 6, 7,
11c0: 38 2c 20 20 39 2c 20 2d 31 2c 20 2d 31 2c 20 2d 8, 9, -1, -1, -
11d0: 31 2c 20 2d 31 2c 20 2d 31 2c 20 2d 31 2c 0a 20 1, -1, -1, -1,.
11e0: 20 20 20 2d 31 2c 20 31 30 2c 20 31 31 2c 20 31 -1, 10, 11, 1
11f0: 32 2c 20 31 33 2c 20 31 34 2c 20 31 35 2c 20 31 2, 13, 14, 15, 1
1200: 36 2c 20 20 20 31 37 2c 20 31 38 2c 20 31 39 2c 6, 17, 18, 19,
1210: 20 32 30 2c 20 32 31 2c 20 32 32 2c 20 32 33 2c 20, 21, 22, 23,
1220: 20 32 34 2c 0a 20 20 20 20 32 35 2c 20 32 36 2c 24,. 25, 26,
1230: 20 32 37 2c 20 32 38 2c 20 32 39 2c 20 33 30 2c 27, 28, 29, 30,
1240: 20 33 31 2c 20 33 32 2c 20 20 20 33 33 2c 20 33 31, 32, 33, 3
1250: 34 2c 20 33 35 2c 20 2d 31 2c 20 2d 31 2c 20 2d 4, 35, -1, -1, -
1260: 31 2c 20 2d 31 2c 20 33 36 2c 0a 20 20 20 20 2d 1, -1, 36,. -
1270: 31 2c 20 33 37 2c 20 33 38 2c 20 33 39 2c 20 34 1, 37, 38, 39, 4
1280: 30 2c 20 34 31 2c 20 34 32 2c 20 34 33 2c 20 20 0, 41, 42, 43,
1290: 20 34 34 2c 20 34 35 2c 20 34 36 2c 20 34 37 2c 44, 45, 46, 47,
12a0: 20 34 38 2c 20 34 39 2c 20 35 30 2c 20 35 31 2c 48, 49, 50, 51,
12b0: 0a 20 20 20 20 35 32 2c 20 35 33 2c 20 35 34 2c . 52, 53, 54,
12c0: 20 35 35 2c 20 35 36 2c 20 35 37 2c 20 35 38 2c 55, 56, 57, 58,
12d0: 20 35 39 2c 20 20 20 36 30 2c 20 36 31 2c 20 36 59, 60, 61, 6
12e0: 32 2c 20 2d 31 2c 20 2d 31 2c 20 2d 31 2c 20 36 2, -1, -1, -1, 6
12f0: 33 2c 20 2d 31 2c 0a 20 20 7d 3b 0a 20 20 75 6e 3, -1,. };. un
1300: 73 69 67 6e 65 64 20 69 6e 74 20 76 20 3d 20 30 signed int v = 0
1310: 3b 0a 20 20 69 6e 74 20 63 3b 0a 20 20 75 6e 73 ;. int c;. uns
1320: 69 67 6e 65 64 20 63 68 61 72 20 2a 7a 20 3d 20 igned char *z =
1330: 28 75 6e 73 69 67 6e 65 64 20 63 68 61 72 2a 29 (unsigned char*)
1340: 2a 70 7a 3b 0a 20 20 75 6e 73 69 67 6e 65 64 20 *pz;. unsigned
1350: 63 68 61 72 20 2a 7a 53 74 61 72 74 20 3d 20 7a char *zStart = z
1360: 3b 0a 20 20 77 68 69 6c 65 28 20 28 63 20 3d 20 ;. while( (c =
1370: 7a 56 61 6c 75 65 5b 30 78 37 66 26 2a 28 7a 2b zValue[0x7f&*(z+
1380: 2b 29 5d 29 3e 3d 30 20 29 7b 0a 20 20 20 20 20 +)])>=0 ){.
1390: 76 20 3d 20 28 76 3c 3c 36 29 20 2b 20 63 3b 0a v = (v<<6) + c;.
13a0: 20 20 7d 0a 20 20 7a 2d 2d 3b 0a 20 20 2a 70 4c }. z--;. *pL
13b0: 65 6e 20 2d 3d 20 7a 20 2d 20 7a 53 74 61 72 74 en -= z - zStart
13c0: 3b 0a 20 20 2a 70 7a 20 3d 20 28 63 68 61 72 2a ;. *pz = (char*
13d0: 29 7a 3b 0a 20 20 72 65 74 75 72 6e 20 76 3b 0a )z;. return v;.
13e0: 7d 0a 0a 2f 2a 0a 2a 2a 20 52 65 74 75 72 6e 20 }../*.** Return
13f0: 74 68 65 20 6e 75 6d 62 65 72 20 64 69 67 69 74 the number digit
1400: 73 20 69 6e 20 74 68 65 20 62 61 73 65 2d 36 34 s in the base-64
1410: 20 72 65 70 72 65 73 65 6e 74 61 74 69 6f 6e 20 representation
1420: 6f 66 20 61 20 70 6f 73 69 74 69 76 65 20 69 6e of a positive in
1430: 74 65 67 65 72 0a 2a 2f 0a 73 74 61 74 69 63 20 teger.*/.static
1440: 69 6e 74 20 64 69 67 69 74 5f 63 6f 75 6e 74 28 int digit_count(
1450: 69 6e 74 20 76 29 7b 0a 20 20 75 6e 73 69 67 6e int v){. unsign
1460: 65 64 20 69 6e 74 20 69 2c 20 78 3b 0a 20 20 66 ed int i, x;. f
1470: 6f 72 28 69 3d 31 2c 20 78 3d 36 34 3b 20 76 3e or(i=1, x=64; v>
1480: 3d 78 3b 20 69 2b 2b 2c 20 78 20 3c 3c 3d 20 36 =x; i++, x <<= 6
1490: 29 7b 7d 0a 20 20 72 65 74 75 72 6e 20 69 3b 0a ){}. return i;.
14a0: 7d 0a 0a 2f 2a 0a 2a 2a 20 43 6f 6d 70 75 74 65 }../*.** Compute
14b0: 20 61 20 33 32 2d 62 69 74 20 63 68 65 63 6b 73 a 32-bit checks
14c0: 75 6d 20 6f 6e 20 74 68 65 20 4e 2d 62 79 74 65 um on the N-byte
14d0: 20 62 75 66 66 65 72 2e 20 20 52 65 74 75 72 6e buffer. Return
14e0: 20 74 68 65 20 72 65 73 75 6c 74 2e 0a 2a 2f 0a the result..*/.
14f0: 73 74 61 74 69 63 20 75 6e 73 69 67 6e 65 64 20 static unsigned
1500: 69 6e 74 20 63 68 65 63 6b 73 75 6d 28 63 6f 6e int checksum(con
1510: 73 74 20 63 68 61 72 20 2a 7a 49 6e 2c 20 73 69 st char *zIn, si
1520: 7a 65 5f 74 20 4e 29 7b 0a 20 20 63 6f 6e 73 74 ze_t N){. const
1530: 20 75 6e 73 69 67 6e 65 64 20 63 68 61 72 20 2a unsigned char *
1540: 7a 20 3d 20 28 63 6f 6e 73 74 20 75 6e 73 69 67 z = (const unsig
1550: 6e 65 64 20 63 68 61 72 20 2a 29 7a 49 6e 3b 0a ned char *)zIn;.
1560: 20 20 75 6e 73 69 67 6e 65 64 20 73 75 6d 20 3d unsigned sum =
1570: 20 30 3b 0a 20 20 77 68 69 6c 65 28 4e 20 3e 3d 0;. while(N >=
1580: 20 31 36 29 7b 0a 20 20 20 20 73 75 6d 20 2b 3d 16){. sum +=
1590: 20 28 28 75 6e 73 69 67 6e 65 64 29 7a 5b 30 5d ((unsigned)z[0]
15a0: 20 2b 20 7a 5b 34 5d 20 2b 20 7a 5b 38 5d 20 2b + z[4] + z[8] +
15b0: 20 7a 5b 31 32 5d 29 20 3c 3c 20 32 34 3b 0a 20 z[12]) << 24;.
15c0: 20 20 20 73 75 6d 20 2b 3d 20 28 28 75 6e 73 69 sum += ((unsi
15d0: 67 6e 65 64 29 7a 5b 31 5d 20 2b 20 7a 5b 35 5d gned)z[1] + z[5]
15e0: 20 2b 20 7a 5b 39 5d 20 2b 20 7a 5b 31 33 5d 29 + z[9] + z[13])
15f0: 20 3c 3c 20 31 36 3b 0a 20 20 20 20 73 75 6d 20 << 16;. sum
1600: 2b 3d 20 28 28 75 6e 73 69 67 6e 65 64 29 7a 5b += ((unsigned)z[
1610: 32 5d 20 2b 20 7a 5b 36 5d 20 2b 20 7a 5b 31 30 2] + z[6] + z[10
1620: 5d 2b 20 7a 5b 31 34 5d 29 20 3c 3c 20 38 3b 0a ]+ z[14]) << 8;.
1630: 20 20 20 20 73 75 6d 20 2b 3d 20 28 28 75 6e 73 sum += ((uns
1640: 69 67 6e 65 64 29 7a 5b 33 5d 20 2b 20 7a 5b 37 igned)z[3] + z[7
1650: 5d 20 2b 20 7a 5b 31 31 5d 2b 20 7a 5b 31 35 5d ] + z[11]+ z[15]
1660: 29 3b 0a 20 20 20 20 7a 20 2b 3d 20 31 36 3b 0a );. z += 16;.
1670: 20 20 20 20 4e 20 2d 3d 20 31 36 3b 0a 20 20 7d N -= 16;. }
1680: 0a 20 20 77 68 69 6c 65 28 4e 20 3e 3d 20 34 29 . while(N >= 4)
1690: 7b 0a 20 20 20 20 73 75 6d 20 2b 3d 20 28 7a 5b {. sum += (z[
16a0: 30 5d 3c 3c 32 34 29 20 7c 20 28 7a 5b 31 5d 3c 0]<<24) | (z[1]<
16b0: 3c 31 36 29 20 7c 20 28 7a 5b 32 5d 3c 3c 38 29 <16) | (z[2]<<8)
16c0: 20 7c 20 7a 5b 33 5d 3b 0a 20 20 20 20 7a 20 2b | z[3];. z +
16d0: 3d 20 34 3b 0a 20 20 20 20 4e 20 2d 3d 20 34 3b = 4;. N -= 4;
16e0: 0a 20 20 7d 0a 20 20 73 77 69 74 63 68 28 4e 29 . }. switch(N)
16f0: 7b 0a 20 20 20 20 63 61 73 65 20 33 3a 20 20 20 {. case 3:
1700: 73 75 6d 20 2b 3d 20 28 7a 5b 32 5d 20 3c 3c 20 sum += (z[2] <<
1710: 38 29 3b 0a 20 20 20 20 63 61 73 65 20 32 3a 20 8);. case 2:
1720: 20 20 73 75 6d 20 2b 3d 20 28 7a 5b 31 5d 20 3c sum += (z[1] <
1730: 3c 20 31 36 29 3b 0a 20 20 20 20 63 61 73 65 20 < 16);. case
1740: 31 3a 20 20 20 73 75 6d 20 2b 3d 20 28 7a 5b 30 1: sum += (z[0
1750: 5d 20 3c 3c 20 32 34 29 3b 0a 20 20 20 20 64 65 ] << 24);. de
1760: 66 61 75 6c 74 3a 20 20 3b 0a 20 20 7d 0a 20 20 fault: ;. }.
1770: 72 65 74 75 72 6e 20 73 75 6d 3b 0a 7d 0a 0a 2f return sum;.}../
1780: 2a 0a 2a 2a 20 4d 61 78 69 6d 75 6d 20 6e 75 6d *.** Maximum num
1790: 62 65 72 20 6f 66 20 6c 61 6e 64 6d 61 72 6b 73 ber of landmarks
17a0: 20 74 6f 20 73 65 74 20 69 6e 20 74 68 65 20 73 to set in the s
17b0: 6f 75 72 63 65 20 66 69 6c 65 2e 0a 2a 2f 0a 23 ource file..*/.#
17c0: 64 65 66 69 6e 65 20 4d 58 5f 4c 41 4e 44 4d 41 define MX_LANDMA
17d0: 52 4b 20 28 31 30 32 34 2a 31 32 38 29 0a 0a 2f RK (1024*128)../
17e0: 2a 0a 2a 2a 20 43 72 65 61 74 65 20 61 20 6e 65 *.** Create a ne
17f0: 77 20 64 65 6c 74 61 2e 0a 2a 2a 0a 2a 2a 20 54 w delta..**.** T
1800: 68 65 20 64 65 6c 74 61 20 69 73 20 77 72 69 74 he delta is writ
1810: 74 65 6e 20 69 6e 74 6f 20 61 20 70 72 65 61 6c ten into a preal
1820: 6c 6f 63 61 74 65 64 20 62 75 66 66 65 72 2c 20 located buffer,
1830: 7a 44 65 6c 74 61 2c 20 77 68 69 63 68 20 0a 2a zDelta, which .*
1840: 2a 20 73 68 6f 75 6c 64 20 62 65 20 61 74 20 6c * should be at l
1850: 65 61 73 74 20 36 30 20 62 79 74 65 73 20 6c 6f east 60 bytes lo
1860: 6e 67 65 72 20 74 68 61 6e 20 74 68 65 20 74 61 nger than the ta
1870: 72 67 65 74 20 66 69 6c 65 2c 20 7a 4f 75 74 2e rget file, zOut.
1880: 0a 2a 2a 20 54 68 65 20 64 65 6c 74 61 20 73 74 .** The delta st
1890: 72 69 6e 67 20 77 69 6c 6c 20 62 65 20 4e 55 4c ring will be NUL
18a0: 2d 74 65 72 6d 69 6e 61 74 65 64 2c 20 62 75 74 -terminated, but
18b0: 20 69 74 20 6d 69 67 68 74 20 61 6c 73 6f 20 63 it might also c
18c0: 6f 6e 74 61 69 6e 0a 2a 2a 20 65 6d 62 65 64 64 ontain.** embedd
18d0: 65 64 20 4e 55 4c 20 63 68 61 72 61 63 74 65 72 ed NUL character
18e0: 73 20 69 66 20 65 69 74 68 65 72 20 74 68 65 20 s if either the
18f0: 7a 53 72 63 20 6f 72 20 7a 4f 75 74 20 66 69 6c zSrc or zOut fil
1900: 65 73 20 61 72 65 0a 2a 2a 20 62 69 6e 61 72 79 es are.** binary
1910: 2e 20 20 54 68 69 73 20 66 75 6e 63 74 69 6f 6e . This function
1920: 20 72 65 74 75 72 6e 73 20 74 68 65 20 6c 65 6e returns the len
1930: 67 74 68 20 6f 66 20 74 68 65 20 64 65 6c 74 61 gth of the delta
1940: 20 73 74 72 69 6e 67 0a 2a 2a 20 69 6e 20 62 79 string.** in by
1950: 74 65 73 2c 20 65 78 63 6c 75 64 69 6e 67 20 74 tes, excluding t
1960: 68 65 20 66 69 6e 61 6c 20 4e 55 4c 20 74 65 72 he final NUL ter
1970: 6d 69 6e 61 74 6f 72 20 63 68 61 72 61 63 74 65 minator characte
1980: 72 2e 0a 2a 2a 0a 2a 2a 20 4f 75 74 70 75 74 20 r..**.** Output
1990: 46 6f 72 6d 61 74 3a 0a 2a 2a 0a 2a 2a 20 54 68 Format:.**.** Th
19a0: 65 20 64 65 6c 74 61 20 62 65 67 69 6e 73 20 77 e delta begins w
19b0: 69 74 68 20 61 20 62 61 73 65 36 34 20 6e 75 6d ith a base64 num
19c0: 62 65 72 20 66 6f 6c 6c 6f 77 65 64 20 62 79 20 ber followed by
19d0: 61 20 6e 65 77 6c 69 6e 65 2e 20 20 54 68 69 73 a newline. This
19e0: 0a 2a 2a 20 6e 75 6d 62 65 72 20 69 73 20 74 68 .** number is th
19f0: 65 20 6e 75 6d 62 65 72 20 6f 66 20 62 79 74 65 e number of byte
1a00: 73 20 69 6e 20 74 68 65 20 54 41 52 47 45 54 20 s in the TARGET
1a10: 66 69 6c 65 2e 20 20 54 68 75 73 2c 20 67 69 76 file. Thus, giv
1a20: 65 6e 20 61 0a 2a 2a 20 64 65 6c 74 61 20 66 69 en a.** delta fi
1a30: 6c 65 20 7a 2c 20 61 20 70 72 6f 67 72 61 6d 20 le z, a program
1a40: 63 61 6e 20 63 6f 6d 70 75 74 65 20 74 68 65 20 can compute the
1a50: 73 69 7a 65 20 6f 66 20 74 68 65 20 6f 75 74 70 size of the outp
1a60: 75 74 20 66 69 6c 65 0a 2a 2a 20 73 69 6d 70 6c ut file.** simpl
1a70: 79 20 62 79 20 72 65 61 64 69 6e 67 20 74 68 65 y by reading the
1a80: 20 66 69 72 73 74 20 6c 69 6e 65 20 61 6e 64 20 first line and
1a90: 64 65 63 6f 64 69 6e 67 20 74 68 65 20 62 61 73 decoding the bas
1aa0: 65 2d 36 34 20 6e 75 6d 62 65 72 0a 2a 2a 20 66 e-64 number.** f
1ab0: 6f 75 6e 64 20 74 68 65 72 65 2e 20 20 54 68 65 ound there. The
1ac0: 20 64 65 6c 74 61 5f 6f 75 74 70 75 74 5f 73 69 delta_output_si
1ad0: 7a 65 28 29 20 72 6f 75 74 69 6e 65 20 64 6f 65 ze() routine doe
1ae0: 73 20 65 78 61 63 74 6c 79 20 74 68 69 73 2e 0a s exactly this..
1af0: 2a 2a 0a 2a 2a 20 41 66 74 65 72 20 74 68 65 20 **.** After the
1b00: 69 6e 69 74 69 61 6c 20 73 69 7a 65 20 6e 75 6d initial size num
1b10: 62 65 72 2c 20 74 68 65 20 64 65 6c 74 61 20 63 ber, the delta c
1b20: 6f 6e 73 69 73 74 73 20 6f 66 20 61 20 73 65 72 onsists of a ser
1b30: 69 65 73 20 6f 66 0a 2a 2a 20 6c 69 74 65 72 61 ies of.** litera
1b40: 6c 20 74 65 78 74 20 73 65 67 6d 65 6e 74 73 20 l text segments
1b50: 61 6e 64 20 63 6f 6d 6d 61 6e 64 73 20 74 6f 20 and commands to
1b60: 63 6f 70 79 20 66 72 6f 6d 20 74 68 65 20 53 4f copy from the SO
1b70: 55 52 43 45 20 66 69 6c 65 2e 20 20 0a 2a 2a 20 URCE file. .**
1b80: 41 20 63 6f 70 79 20 63 6f 6d 6d 61 6e 64 20 6c A copy command l
1b90: 6f 6f 6b 73 20 6c 69 6b 65 20 74 68 69 73 3a 0a ooks like this:.
1ba0: 2a 2a 0a 2a 2a 20 20 20 20 20 4e 4e 4e 40 4d 4d **.** NNN@MM
1bb0: 4d 2c 0a 2a 2a 0a 2a 2a 20 77 68 65 72 65 20 4e M,.**.** where N
1bc0: 4e 4e 20 69 73 20 74 68 65 20 6e 75 6d 62 65 72 NN is the number
1bd0: 20 6f 66 20 62 79 74 65 73 20 74 6f 20 62 65 20 of bytes to be
1be0: 63 6f 70 69 65 64 20 61 6e 64 20 4d 4d 4d 20 69 copied and MMM i
1bf0: 73 20 74 68 65 20 6f 66 66 73 65 74 0a 2a 2a 20 s the offset.**
1c00: 69 6e 74 6f 20 74 68 65 20 73 6f 75 72 63 65 20 into the source
1c10: 66 69 6c 65 20 6f 66 20 74 68 65 20 66 69 72 73 file of the firs
1c20: 74 20 62 79 74 65 20 28 62 6f 74 68 20 62 61 73 t byte (both bas
1c30: 65 2d 36 34 29 2e 20 20 20 49 66 20 4e 4e 4e 20 e-64). If NNN
1c40: 69 73 20 30 0a 2a 2a 20 69 74 20 6d 65 61 6e 73 is 0.** it means
1c50: 20 63 6f 70 79 20 74 68 65 20 72 65 73 74 20 6f copy the rest o
1c60: 66 20 74 68 65 20 69 6e 70 75 74 20 66 69 6c 65 f the input file
1c70: 2e 20 20 4c 69 74 65 72 61 6c 20 74 65 78 74 20 . Literal text
1c80: 69 73 20 6c 69 6b 65 20 74 68 69 73 3a 0a 2a 2a is like this:.**
1c90: 0a 2a 2a 20 20 20 20 20 4e 4e 4e 3a 54 54 54 54 .** NNN:TTTT
1ca0: 54 0a 2a 2a 0a 2a 2a 20 77 68 65 72 65 20 4e 4e T.**.** where NN
1cb0: 4e 20 69 73 20 74 68 65 20 6e 75 6d 62 65 72 20 N is the number
1cc0: 6f 66 20 62 79 74 65 73 20 6f 66 20 74 65 78 74 of bytes of text
1cd0: 20 28 62 61 73 65 2d 36 34 29 20 61 6e 64 20 54 (base-64) and T
1ce0: 54 54 54 54 20 69 73 20 74 68 65 20 74 65 78 74 TTTT is the text
1cf0: 2e 0a 2a 2a 0a 2a 2a 20 54 68 65 20 6c 61 73 74 ..**.** The last
1d00: 20 74 65 72 6d 20 69 73 20 6f 66 20 74 68 65 20 term is of the
1d10: 66 6f 72 6d 0a 2a 2a 0a 2a 2a 20 20 20 20 20 4e form.**.** N
1d20: 4e 4e 3b 0a 2a 2a 0a 2a 2a 20 49 6e 20 74 68 69 NN;.**.** In thi
1d30: 73 20 63 61 73 65 2c 20 4e 4e 4e 20 69 73 20 61 s case, NNN is a
1d40: 20 33 32 2d 62 69 74 20 62 69 67 65 6e 64 69 61 32-bit bigendia
1d50: 6e 20 63 68 65 63 6b 73 75 6d 20 6f 66 20 74 68 n checksum of th
1d60: 65 20 6f 75 74 70 75 74 20 66 69 6c 65 0a 2a 2a e output file.**
1d70: 20 74 68 61 74 20 63 61 6e 20 62 65 20 75 73 65 that can be use
1d80: 64 20 74 6f 20 76 65 72 69 66 79 20 74 68 61 74 d to verify that
1d90: 20 74 68 65 20 64 65 6c 74 61 20 61 70 70 6c 69 the delta appli
1da0: 65 64 20 63 6f 72 72 65 63 74 6c 79 2e 20 20 41 ed correctly. A
1db0: 6c 6c 0a 2a 2a 20 6e 75 6d 62 65 72 73 20 61 72 ll.** numbers ar
1dc0: 65 20 69 6e 20 62 61 73 65 2d 36 34 2e 0a 2a 2a e in base-64..**
1dd0: 0a 2a 2a 20 50 75 72 65 20 74 65 78 74 20 66 69 .** Pure text fi
1de0: 6c 65 73 20 67 65 6e 65 72 61 74 65 20 61 20 70 les generate a p
1df0: 75 72 65 20 74 65 78 74 20 64 65 6c 74 61 2e 20 ure text delta.
1e00: 20 42 69 6e 61 72 79 20 66 69 6c 65 73 20 67 65 Binary files ge
1e10: 6e 65 72 61 74 65 20 61 0a 2a 2a 20 64 65 6c 74 nerate a.** delt
1e20: 61 20 74 68 61 74 20 6d 61 79 20 63 6f 6e 74 61 a that may conta
1e30: 69 6e 20 73 6f 6d 65 20 62 69 6e 61 72 79 20 64 in some binary d
1e40: 61 74 61 2e 0a 2a 2a 0a 2a 2a 20 41 6c 67 6f 72 ata..**.** Algor
1e50: 69 74 68 6d 3a 0a 2a 2a 0a 2a 2a 20 54 68 65 20 ithm:.**.** The
1e60: 65 6e 63 6f 64 65 72 20 66 69 72 73 74 20 62 75 encoder first bu
1e70: 69 6c 64 73 20 61 20 68 61 73 68 20 74 61 62 6c ilds a hash tabl
1e80: 65 20 74 6f 20 68 65 6c 70 20 69 74 20 66 69 6e e to help it fin
1e90: 64 20 6d 61 74 63 68 69 6e 67 0a 2a 2a 20 70 61 d matching.** pa
1ea0: 74 74 65 72 6e 73 20 69 6e 20 74 68 65 20 73 6f tterns in the so
1eb0: 75 72 63 65 20 66 69 6c 65 2e 20 20 31 36 2d 62 urce file. 16-b
1ec0: 79 74 65 20 63 68 75 6e 6b 73 20 6f 66 20 74 68 yte chunks of th
1ed0: 65 20 73 6f 75 72 63 65 20 66 69 6c 65 0a 2a 2a e source file.**
1ee0: 20 73 61 6d 70 6c 65 64 20 61 74 20 65 76 65 6e sampled at even
1ef0: 6c 79 20 73 70 61 63 65 64 20 69 6e 74 65 72 76 ly spaced interv
1f00: 61 6c 73 20 61 72 65 20 75 73 65 64 20 74 6f 20 als are used to
1f10: 70 6f 70 75 6c 61 74 65 20 74 68 65 20 68 61 73 populate the has
1f20: 68 0a 2a 2a 20 74 61 62 6c 65 2e 0a 2a 2a 0a 2a h.** table..**.*
1f30: 2a 20 4e 65 78 74 20 77 65 20 62 65 67 69 6e 20 * Next we begin
1f40: 73 63 61 6e 6e 69 6e 67 20 74 68 65 20 74 61 72 scanning the tar
1f50: 67 65 74 20 66 69 6c 65 20 75 73 69 6e 67 20 61 get file using a
1f60: 20 73 6c 69 64 69 6e 67 20 31 36 2d 62 79 74 65 sliding 16-byte
1f70: 0a 2a 2a 20 77 69 6e 64 6f 77 2e 20 20 54 68 65 .** window. The
1f80: 20 68 61 73 68 20 6f 66 20 74 68 65 20 31 36 2d hash of the 16-
1f90: 62 79 74 65 20 77 69 6e 64 6f 77 20 69 6e 20 74 byte window in t
1fa0: 68 65 20 74 61 72 67 65 74 20 69 73 20 75 73 65 he target is use
1fb0: 64 20 74 6f 0a 2a 2a 20 73 65 61 72 63 68 20 66 d to.** search f
1fc0: 6f 72 20 61 20 6d 61 74 63 68 69 6e 67 20 73 65 or a matching se
1fd0: 63 74 69 6f 6e 20 69 6e 20 74 68 65 20 73 6f 75 ction in the sou
1fe0: 72 63 65 20 66 69 6c 65 2e 20 20 57 68 65 6e 20 rce file. When
1ff0: 61 20 6d 61 74 63 68 0a 2a 2a 20 69 73 20 66 6f a match.** is fo
2000: 75 6e 64 2c 20 61 20 63 6f 70 79 20 63 6f 6d 6d und, a copy comm
2010: 61 6e 64 20 69 73 20 61 64 64 65 64 20 74 6f 20 and is added to
2020: 74 68 65 20 64 65 6c 74 61 2e 20 20 41 6e 20 65 the delta. An e
2030: 66 66 6f 72 74 20 69 73 0a 2a 2a 20 6d 61 64 65 ffort is.** made
2040: 20 74 6f 20 65 78 74 65 6e 64 20 74 68 65 20 6d to extend the m
2050: 61 74 63 68 69 6e 67 20 73 65 63 74 69 6f 6e 20 atching section
2060: 74 6f 20 72 65 67 69 6f 6e 73 20 74 68 61 74 20 to regions that
2070: 63 6f 6d 65 20 62 65 66 6f 72 65 0a 2a 2a 20 61 come before.** a
2080: 6e 64 20 61 66 74 65 72 20 74 68 65 20 31 36 2d nd after the 16-
2090: 62 79 74 65 20 68 61 73 68 20 77 69 6e 64 6f 77 byte hash window
20a0: 2e 20 20 41 20 63 6f 70 79 20 63 6f 6d 6d 61 6e . A copy comman
20b0: 64 20 69 73 20 6f 6e 6c 79 20 69 73 73 75 65 64 d is only issued
20c0: 0a 2a 2a 20 69 66 20 74 68 65 20 72 65 73 75 6c .** if the resul
20d0: 74 20 77 6f 75 6c 64 20 75 73 65 20 6c 65 73 73 t would use less
20e0: 20 73 70 61 63 65 20 74 68 61 74 20 6a 75 73 74 space that just
20f0: 20 71 75 6f 74 69 6e 67 20 74 68 65 20 74 65 78 quoting the tex
2100: 74 0a 2a 2a 20 6c 69 74 65 72 61 6c 6c 79 2e 20 t.** literally.
2110: 4c 69 74 65 72 61 6c 20 74 65 78 74 20 69 73 20 Literal text is
2120: 61 64 64 65 64 20 74 6f 20 74 68 65 20 64 65 6c added to the del
2130: 74 61 20 66 6f 72 20 73 65 63 74 69 6f 6e 73 20 ta for sections
2140: 74 68 61 74 20 0a 2a 2a 20 64 6f 20 6e 6f 74 20 that .** do not
2150: 6d 61 74 63 68 20 6f 72 20 77 68 69 63 68 20 63 match or which c
2160: 61 6e 20 6e 6f 74 20 62 65 20 65 6e 63 6f 64 65 an not be encode
2170: 64 20 65 66 66 69 63 69 65 6e 74 6c 79 20 75 73 d efficiently us
2180: 69 6e 67 20 63 6f 70 79 0a 2a 2a 20 63 6f 6d 6d ing copy.** comm
2190: 61 6e 64 73 2e 0a 2a 2f 0a 69 6e 74 20 64 65 6c ands..*/.int del
21a0: 74 61 5f 63 72 65 61 74 65 28 0a 20 20 63 6f 6e ta_create(. con
21b0: 73 74 20 63 68 61 72 20 2a 7a 53 72 63 2c 20 20 st char *zSrc,
21c0: 20 20 20 20 2f 2a 20 54 68 65 20 73 6f 75 72 63 /* The sourc
21d0: 65 20 6f 72 20 70 61 74 74 65 72 6e 20 66 69 6c e or pattern fil
21e0: 65 20 2a 2f 0a 20 20 75 6e 73 69 67 6e 65 64 20 e */. unsigned
21f0: 69 6e 74 20 6c 65 6e 53 72 63 2c 20 20 20 2f 2a int lenSrc, /*
2200: 20 4c 65 6e 67 74 68 20 6f 66 20 74 68 65 20 73 Length of the s
2210: 6f 75 72 63 65 20 66 69 6c 65 20 2a 2f 0a 20 20 ource file */.
2220: 63 6f 6e 73 74 20 63 68 61 72 20 2a 7a 4f 75 74 const char *zOut
2230: 2c 20 20 20 20 20 20 2f 2a 20 54 68 65 20 74 61 , /* The ta
2240: 72 67 65 74 20 66 69 6c 65 20 2a 2f 0a 20 20 75 rget file */. u
2250: 6e 73 69 67 6e 65 64 20 69 6e 74 20 6c 65 6e 4f nsigned int lenO
2260: 75 74 2c 20 20 20 2f 2a 20 4c 65 6e 67 74 68 20 ut, /* Length
2270: 6f 66 20 74 68 65 20 74 61 72 67 65 74 20 66 69 of the target fi
2280: 6c 65 20 2a 2f 0a 20 20 63 68 61 72 20 2a 7a 44 le */. char *zD
2290: 65 6c 74 61 20 20 20 20 20 20 20 20 20 20 20 2f elta /
22a0: 2a 20 57 72 69 74 65 20 74 68 65 20 64 65 6c 74 * Write the delt
22b0: 61 20 69 6e 74 6f 20 74 68 69 73 20 62 75 66 66 a into this buff
22c0: 65 72 20 2a 2f 0a 29 7b 0a 20 20 69 6e 74 20 69 er */.){. int i
22d0: 2c 20 62 61 73 65 3b 0a 20 20 63 68 61 72 20 2a , base;. char *
22e0: 7a 4f 72 69 67 44 65 6c 74 61 20 3d 20 7a 44 65 zOrigDelta = zDe
22f0: 6c 74 61 3b 0a 20 20 68 61 73 68 20 68 3b 0a 20 lta;. hash h;.
2300: 20 69 6e 74 20 2a 63 6f 6c 6c 69 64 65 3b 0a 20 int *collide;.
2310: 20 69 6e 74 20 6c 61 73 74 52 65 61 64 20 3d 20 int lastRead =
2320: 2d 31 3b 20 20 20 20 20 20 20 20 20 2f 2a 20 4c -1; /* L
2330: 61 73 74 20 62 79 74 65 20 6f 66 20 7a 53 72 63 ast byte of zSrc
2340: 20 72 65 61 64 20 62 79 20 61 20 43 4f 50 59 20 read by a COPY
2350: 63 6f 6d 6d 61 6e 64 20 2a 2f 0a 20 20 69 6e 74 command */. int
2360: 20 6c 61 6e 64 6d 61 72 6b 5b 4d 58 5f 4c 41 4e landmark[MX_LAN
2370: 44 4d 41 52 4b 5d 3b 0a 0a 20 20 2f 2a 20 41 64 DMARK];.. /* Ad
2380: 64 20 74 68 65 20 74 61 72 67 65 74 20 66 69 6c d the target fil
2390: 65 20 73 69 7a 65 20 74 6f 20 74 68 65 20 62 65 e size to the be
23a0: 67 69 6e 6e 69 6e 67 20 6f 66 20 74 68 65 20 64 ginning of the d
23b0: 65 6c 74 61 0a 20 20 2a 2f 0a 20 20 70 75 74 49 elta. */. putI
23c0: 6e 74 28 6c 65 6e 4f 75 74 2c 20 26 7a 44 65 6c nt(lenOut, &zDel
23d0: 74 61 29 3b 0a 20 20 2a 28 7a 44 65 6c 74 61 2b ta);. *(zDelta+
23e0: 2b 29 20 3d 20 27 5c 6e 27 3b 0a 0a 20 20 2f 2a +) = '\n';.. /*
23f0: 20 49 66 20 74 68 65 20 73 6f 75 72 63 65 20 66 If the source f
2400: 69 6c 65 20 69 73 20 76 65 72 79 20 73 6d 61 6c ile is very smal
2410: 6c 2c 20 69 74 20 6d 65 61 6e 73 20 74 68 61 74 l, it means that
2420: 20 77 65 20 68 61 76 65 20 6e 6f 0a 20 20 2a 2a we have no. **
2430: 20 63 68 61 6e 63 65 20 6f 66 20 65 76 65 72 20 chance of ever
2440: 64 6f 69 6e 67 20 61 20 63 6f 70 79 20 63 6f 6d doing a copy com
2450: 6d 61 6e 64 2e 20 20 4a 75 73 74 20 6f 75 74 70 mand. Just outp
2460: 75 74 20 61 20 73 69 6e 67 6c 65 0a 20 20 2a 2a ut a single. **
2470: 20 6c 69 74 65 72 61 6c 20 73 65 67 6d 65 6e 74 literal segment
2480: 20 66 6f 72 20 74 68 65 20 65 6e 74 69 72 65 20 for the entire
2490: 74 61 72 67 65 74 20 61 6e 64 20 65 78 69 74 2e target and exit.
24a0: 0a 20 20 2a 2f 0a 20 20 69 66 28 20 6c 65 6e 53 . */. if( lenS
24b0: 72 63 3c 3d 4e 48 41 53 48 20 29 7b 0a 20 20 20 rc<=NHASH ){.
24c0: 20 70 75 74 49 6e 74 28 6c 65 6e 4f 75 74 2c 20 putInt(lenOut,
24d0: 26 7a 44 65 6c 74 61 29 3b 0a 20 20 20 20 2a 28 &zDelta);. *(
24e0: 7a 44 65 6c 74 61 2b 2b 29 20 3d 20 27 3a 27 3b zDelta++) = ':';
24f0: 0a 20 20 20 20 6d 65 6d 63 70 79 28 7a 44 65 6c . memcpy(zDel
2500: 74 61 2c 20 7a 4f 75 74 2c 20 6c 65 6e 4f 75 74 ta, zOut, lenOut
2510: 29 3b 0a 20 20 20 20 7a 44 65 6c 74 61 20 2b 3d );. zDelta +=
2520: 20 6c 65 6e 4f 75 74 3b 0a 20 20 20 20 70 75 74 lenOut;. put
2530: 49 6e 74 28 63 68 65 63 6b 73 75 6d 28 7a 4f 75 Int(checksum(zOu
2540: 74 2c 20 6c 65 6e 4f 75 74 29 2c 20 26 7a 44 65 t, lenOut), &zDe
2550: 6c 74 61 29 3b 0a 20 20 20 20 2a 28 7a 44 65 6c lta);. *(zDel
2560: 74 61 2b 2b 29 20 3d 20 27 3b 27 3b 0a 20 20 20 ta++) = ';';.
2570: 20 72 65 74 75 72 6e 20 7a 44 65 6c 74 61 20 2d return zDelta -
2580: 20 7a 4f 72 69 67 44 65 6c 74 61 3b 0a 20 20 7d zOrigDelta;. }
2590: 0a 0a 20 20 2f 2a 20 43 6f 6d 70 75 74 65 20 74 .. /* Compute t
25a0: 68 65 20 68 61 73 68 20 74 61 62 6c 65 20 75 73 he hash table us
25b0: 65 64 20 74 6f 20 6c 6f 63 61 74 65 20 6d 61 74 ed to locate mat
25c0: 63 68 69 6e 67 20 73 65 63 74 69 6f 6e 73 20 69 ching sections i
25d0: 6e 20 74 68 65 0a 20 20 2a 2a 20 73 6f 75 72 63 n the. ** sourc
25e0: 65 20 66 69 6c 65 2e 0a 20 20 2a 2f 0a 20 20 63 e file.. */. c
25f0: 6f 6c 6c 69 64 65 20 3d 20 6d 61 6c 6c 6f 63 28 ollide = malloc(
2600: 20 6c 65 6e 53 72 63 2a 73 69 7a 65 6f 66 28 69 lenSrc*sizeof(i
2610: 6e 74 29 2f 4e 48 41 53 48 20 29 3b 0a 20 20 69 nt)/NHASH );. i
2620: 66 28 20 63 6f 6c 6c 69 64 65 3d 3d 30 20 29 20 f( collide==0 )
2630: 72 65 74 75 72 6e 20 2d 31 3b 0a 20 20 6d 65 6d return -1;. mem
2640: 73 65 74 28 6c 61 6e 64 6d 61 72 6b 2c 20 2d 31 set(landmark, -1
2650: 2c 20 73 69 7a 65 6f 66 28 6c 61 6e 64 6d 61 72 , sizeof(landmar
2660: 6b 29 29 3b 0a 20 20 6d 65 6d 73 65 74 28 63 6f k));. memset(co
2670: 6c 6c 69 64 65 2c 20 2d 31 2c 20 6c 65 6e 53 72 llide, -1, lenSr
2680: 63 2a 73 69 7a 65 6f 66 28 69 6e 74 29 2f 4e 48 c*sizeof(int)/NH
2690: 41 53 48 20 29 3b 0a 20 20 66 6f 72 28 69 3d 30 ASH );. for(i=0
26a0: 3b 20 69 3c 6c 65 6e 53 72 63 2d 4e 48 41 53 48 ; i<lenSrc-NHASH
26b0: 3b 20 69 2b 3d 4e 48 41 53 48 29 7b 0a 20 20 20 ; i+=NHASH){.
26c0: 20 69 6e 74 20 68 76 3b 0a 20 20 20 20 68 61 73 int hv;. has
26d0: 68 5f 69 6e 69 74 28 26 68 2c 20 26 7a 53 72 63 h_init(&h, &zSrc
26e0: 5b 69 5d 29 3b 0a 20 20 20 20 68 76 20 3d 20 68 [i]);. hv = h
26f0: 61 73 68 5f 33 32 62 69 74 28 26 68 29 20 26 20 ash_32bit(&h) &
2700: 28 4d 58 5f 4c 41 4e 44 4d 41 52 4b 2d 31 29 3b (MX_LANDMARK-1);
2710: 0a 20 20 20 20 63 6f 6c 6c 69 64 65 5b 69 2f 4e . collide[i/N
2720: 48 41 53 48 5d 20 3d 20 6c 61 6e 64 6d 61 72 6b HASH] = landmark
2730: 5b 68 76 5d 3b 0a 20 20 20 20 6c 61 6e 64 6d 61 [hv];. landma
2740: 72 6b 5b 68 76 5d 20 3d 20 69 2f 4e 48 41 53 48 rk[hv] = i/NHASH
2750: 3b 0a 20 20 7d 0a 0a 20 20 2f 2a 20 42 65 67 69 ;. }.. /* Begi
2760: 6e 20 73 63 61 6e 6e 69 6e 67 20 74 68 65 20 74 n scanning the t
2770: 61 72 67 65 74 20 66 69 6c 65 20 61 6e 64 20 67 arget file and g
2780: 65 6e 65 72 61 74 69 6e 67 20 63 6f 70 79 20 63 enerating copy c
2790: 6f 6d 6d 61 6e 64 73 20 61 6e 64 0a 20 20 2a 2a ommands and. **
27a0: 20 6c 69 74 65 72 61 6c 20 73 65 63 74 69 6f 6e literal section
27b0: 73 20 6f 66 20 74 68 65 20 64 65 6c 74 61 2e 0a s of the delta..
27c0: 20 20 2a 2f 0a 20 20 62 61 73 65 20 3d 20 30 3b */. base = 0;
27d0: 20 20 20 20 2f 2a 20 57 65 20 68 61 76 65 20 61 /* We have a
27e0: 6c 72 65 61 64 79 20 67 65 6e 65 72 61 74 65 64 lready generated
27f0: 20 65 76 65 72 79 74 68 69 6e 67 20 62 65 66 6f everything befo
2800: 72 65 20 7a 4f 75 74 5b 62 61 73 65 5d 20 2a 2f re zOut[base] */
2810: 0a 20 20 77 68 69 6c 65 28 20 62 61 73 65 2b 4e . while( base+N
2820: 48 41 53 48 3c 6c 65 6e 4f 75 74 20 29 7b 0a 20 HASH<lenOut ){.
2830: 20 20 20 69 6e 74 20 69 53 72 63 2c 20 69 42 6c int iSrc, iBl
2840: 6f 63 6b 3b 0a 20 20 20 20 75 6e 73 69 67 6e 65 ock;. unsigne
2850: 64 20 69 6e 74 20 62 65 73 74 43 6e 74 2c 20 62 d int bestCnt, b
2860: 65 73 74 4f 66 73 74 3d 30 2c 20 62 65 73 74 4c estOfst=0, bestL
2870: 69 74 73 7a 3d 30 3b 0a 20 20 20 20 68 61 73 68 itsz=0;. hash
2880: 5f 69 6e 69 74 28 26 68 2c 20 26 7a 4f 75 74 5b _init(&h, &zOut[
2890: 62 61 73 65 5d 29 3b 0a 20 20 20 20 69 20 3d 20 base]);. i =
28a0: 30 3b 20 20 20 20 20 2f 2a 20 54 72 79 69 6e 67 0; /* Trying
28b0: 20 74 6f 20 6d 61 74 63 68 20 61 20 6c 61 6e 64 to match a land
28c0: 6d 61 72 6b 20 61 67 61 69 6e 73 74 20 7a 4f 75 mark against zOu
28d0: 74 5b 62 61 73 65 2b 69 5d 20 2a 2f 0a 20 20 20 t[base+i] */.
28e0: 20 62 65 73 74 43 6e 74 20 3d 20 30 3b 0a 20 20 bestCnt = 0;.
28f0: 20 20 77 68 69 6c 65 28 20 31 20 29 7b 0a 20 20 while( 1 ){.
2900: 20 20 20 20 69 6e 74 20 68 76 3b 0a 20 20 20 20 int hv;.
2910: 20 20 69 6e 74 20 6c 69 6d 69 74 20 3d 20 32 35 int limit = 25
2920: 30 3b 0a 0a 20 20 20 20 20 20 68 76 20 3d 20 68 0;.. hv = h
2930: 61 73 68 5f 33 32 62 69 74 28 26 68 29 20 26 20 ash_32bit(&h) &
2940: 28 4d 58 5f 4c 41 4e 44 4d 41 52 4b 2d 31 29 3b (MX_LANDMARK-1);
2950: 0a 20 20 20 20 20 20 44 45 42 55 47 32 28 20 70 . DEBUG2( p
2960: 72 69 6e 74 66 28 22 4c 4f 4f 4b 49 4e 47 3a 20 rintf("LOOKING:
2970: 25 34 64 20 5b 25 73 5d 5c 6e 22 2c 20 62 61 73 %4d [%s]\n", bas
2980: 65 2b 69 2c 20 70 72 69 6e 74 31 36 28 26 7a 4f e+i, print16(&zO
2990: 75 74 5b 62 61 73 65 2b 69 5d 29 29 3b 20 29 0a ut[base+i])); ).
29a0: 20 20 20 20 20 20 69 42 6c 6f 63 6b 20 3d 20 6c iBlock = l
29b0: 61 6e 64 6d 61 72 6b 5b 68 76 5d 3b 0a 20 20 20 andmark[hv];.
29c0: 20 20 20 77 68 69 6c 65 28 20 69 42 6c 6f 63 6b while( iBlock
29d0: 3e 3d 30 20 26 26 20 28 6c 69 6d 69 74 2d 2d 29 >=0 && (limit--)
29e0: 3e 30 20 29 7b 0a 20 20 20 20 20 20 20 20 2f 2a >0 ){. /*
29f0: 0a 20 20 20 20 20 20 20 20 2a 2a 20 54 68 65 20 . ** The
2a00: 68 61 73 68 20 77 69 6e 64 6f 77 20 68 61 73 20 hash window has
2a10: 69 64 65 6e 74 69 66 69 65 64 20 61 20 70 6f 74 identified a pot
2a20: 65 6e 74 69 61 6c 20 6d 61 74 63 68 20 61 67 61 ential match aga
2a30: 69 6e 73 74 20 0a 20 20 20 20 20 20 20 20 2a 2a inst . **
2a40: 20 6c 61 6e 64 6d 61 72 6b 20 62 6c 6f 63 6b 20 landmark block
2a50: 69 42 6c 6f 63 6b 2e 20 20 42 75 74 20 77 65 20 iBlock. But we
2a60: 6e 65 65 64 20 74 6f 20 69 6e 76 65 73 74 69 67 need to investig
2a70: 61 74 65 20 66 75 72 74 68 65 72 2e 0a 20 20 20 ate further..
2a80: 20 20 20 20 20 2a 2a 20 0a 20 20 20 20 20 20 20 ** .
2a90: 20 2a 2a 20 4c 6f 6f 6b 20 66 6f 72 20 61 20 72 ** Look for a r
2aa0: 65 67 69 6f 6e 20 69 6e 20 7a 4f 75 74 20 74 68 egion in zOut th
2ab0: 61 74 20 6d 61 74 63 68 65 73 20 7a 53 72 63 2e at matches zSrc.
2ac0: 20 41 6e 63 68 6f 72 20 74 68 65 20 73 65 61 72 Anchor the sear
2ad0: 63 68 0a 20 20 20 20 20 20 20 20 2a 2a 20 61 74 ch. ** at
2ae0: 20 7a 53 72 63 5b 69 53 72 63 5d 20 61 6e 64 20 zSrc[iSrc] and
2af0: 7a 4f 75 74 5b 62 61 73 65 2b 69 5d 2e 20 20 44 zOut[base+i]. D
2b00: 6f 20 6e 6f 74 20 69 6e 63 6c 75 64 65 20 61 6e o not include an
2b10: 79 74 68 69 6e 67 20 70 72 69 6f 72 20 74 6f 0a ything prior to.
2b20: 20 20 20 20 20 20 20 20 2a 2a 20 7a 4f 75 74 5b ** zOut[
2b30: 62 61 73 65 5d 20 6f 72 20 61 66 74 65 72 20 7a base] or after z
2b40: 4f 75 74 5b 6f 75 74 4c 65 6e 5d 20 6e 6f 72 20 Out[outLen] nor
2b50: 61 6e 79 74 68 69 6e 67 20 61 66 74 65 72 20 7a anything after z
2b60: 53 72 63 5b 73 72 63 4c 65 6e 5d 2e 0a 20 20 20 Src[srcLen]..
2b70: 20 20 20 20 20 2a 2a 0a 20 20 20 20 20 20 20 20 **.
2b80: 2a 2a 20 53 65 74 20 63 6e 74 20 65 71 75 61 6c ** Set cnt equal
2b90: 20 74 6f 20 74 68 65 20 6c 65 6e 67 74 68 20 6f to the length o
2ba0: 66 20 74 68 65 20 6d 61 74 63 68 20 61 6e 64 20 f the match and
2bb0: 73 65 74 20 6f 66 73 74 20 73 6f 20 74 68 61 74 set ofst so that
2bc0: 0a 20 20 20 20 20 20 20 20 2a 2a 20 7a 53 72 63 . ** zSrc
2bd0: 5b 6f 66 73 74 5d 20 69 73 20 74 68 65 20 66 69 [ofst] is the fi
2be0: 72 73 74 20 65 6c 65 6d 65 6e 74 20 6f 66 20 74 rst element of t
2bf0: 68 65 20 6d 61 74 63 68 2e 20 20 6c 69 74 73 7a he match. litsz
2c00: 20 69 73 20 74 68 65 20 6e 75 6d 62 65 72 0a 20 is the number.
2c10: 20 20 20 20 20 20 20 2a 2a 20 6f 66 20 63 68 61 ** of cha
2c20: 72 61 63 74 65 72 73 20 62 65 74 77 65 65 6e 20 racters between
2c30: 7a 4f 75 74 5b 62 61 73 65 5d 20 61 6e 64 20 74 zOut[base] and t
2c40: 68 65 20 62 65 67 69 6e 6e 69 6e 67 20 6f 66 20 he beginning of
2c50: 74 68 65 20 6d 61 74 63 68 2e 0a 20 20 20 20 20 the match..
2c60: 20 20 20 2a 2a 20 73 7a 20 77 69 6c 6c 20 62 65 ** sz will be
2c70: 20 74 68 65 20 6f 76 65 72 68 65 61 64 20 28 69 the overhead (i
2c80: 6e 20 62 79 74 65 73 29 20 6e 65 65 64 65 64 20 n bytes) needed
2c90: 74 6f 20 65 6e 63 6f 64 65 20 74 68 65 20 63 6f to encode the co
2ca0: 70 79 0a 20 20 20 20 20 20 20 20 2a 2a 20 63 6f py. ** co
2cb0: 6d 6d 61 6e 64 2e 20 20 4f 6e 6c 79 20 67 65 6e mmand. Only gen
2cc0: 65 72 61 74 65 20 63 6f 70 79 20 63 6f 6d 6d 61 erate copy comma
2cd0: 6e 64 20 69 66 20 74 68 65 20 6f 76 65 72 68 65 nd if the overhe
2ce0: 61 64 20 6f 66 20 74 68 65 0a 20 20 20 20 20 20 ad of the.
2cf0: 20 20 2a 2a 20 63 6f 70 79 20 63 6f 6d 6d 61 6e ** copy comman
2d00: 64 20 69 73 20 6c 65 73 73 20 74 68 61 6e 20 74 d is less than t
2d10: 68 65 20 61 6d 6f 75 6e 74 20 6f 66 20 6c 69 74 he amount of lit
2d20: 65 72 61 6c 20 74 65 78 74 20 74 6f 20 62 65 20 eral text to be
2d30: 63 6f 70 69 65 64 2e 0a 20 20 20 20 20 20 20 20 copied..
2d40: 2a 2f 0a 20 20 20 20 20 20 20 20 69 6e 74 20 63 */. int c
2d50: 6e 74 2c 20 6f 66 73 74 2c 20 6c 69 74 73 7a 3b nt, ofst, litsz;
2d60: 0a 20 20 20 20 20 20 20 20 69 6e 74 20 6a 2c 20 . int j,
2d70: 6b 2c 20 78 2c 20 79 3b 0a 20 20 20 20 20 20 20 k, x, y;.
2d80: 20 69 6e 74 20 73 7a 3b 0a 0a 20 20 20 20 20 20 int sz;..
2d90: 20 20 2f 2a 20 42 65 67 69 6e 6e 69 6e 67 20 61 /* Beginning a
2da0: 74 20 69 53 72 63 2c 20 6d 61 74 63 68 20 66 6f t iSrc, match fo
2db0: 72 77 61 72 64 73 20 61 73 20 66 61 72 20 61 73 rwards as far as
2dc0: 20 77 65 20 63 61 6e 2e 20 20 6a 20 63 6f 75 6e we can. j coun
2dd0: 74 73 0a 20 20 20 20 20 20 20 20 2a 2a 20 74 68 ts. ** th
2de0: 65 20 6e 75 6d 62 65 72 20 6f 66 20 63 68 61 72 e number of char
2df0: 61 63 74 65 72 73 20 74 68 61 74 20 6d 61 74 63 acters that matc
2e00: 68 20 2a 2f 0a 20 20 20 20 20 20 20 20 69 53 72 h */. iSr
2e10: 63 20 3d 20 69 42 6c 6f 63 6b 2a 4e 48 41 53 48 c = iBlock*NHASH
2e20: 3b 0a 20 20 20 20 20 20 20 20 66 6f 72 28 6a 3d ;. for(j=
2e30: 30 2c 20 78 3d 69 53 72 63 2c 20 79 3d 62 61 73 0, x=iSrc, y=bas
2e40: 65 2b 69 3b 20 78 3c 6c 65 6e 53 72 63 20 26 26 e+i; x<lenSrc &&
2e50: 20 79 3c 6c 65 6e 4f 75 74 3b 20 6a 2b 2b 2c 20 y<lenOut; j++,
2e60: 78 2b 2b 2c 20 79 2b 2b 29 7b 0a 20 20 20 20 20 x++, y++){.
2e70: 20 20 20 20 20 69 66 28 20 7a 53 72 63 5b 78 5d if( zSrc[x]
2e80: 21 3d 7a 4f 75 74 5b 79 5d 20 29 20 62 72 65 61 !=zOut[y] ) brea
2e90: 6b 3b 0a 20 20 20 20 20 20 20 20 7d 0a 20 20 20 k;. }.
2ea0: 20 20 20 20 20 6a 2d 2d 3b 0a 0a 20 20 20 20 20 j--;..
2eb0: 20 20 20 2f 2a 20 42 65 67 69 6e 6e 69 6e 67 20 /* Beginning
2ec0: 61 74 20 69 53 72 63 2d 31 2c 20 6d 61 74 63 68 at iSrc-1, match
2ed0: 20 62 61 63 6b 77 61 72 64 73 20 61 73 20 66 61 backwards as fa
2ee0: 72 20 61 73 20 77 65 20 63 61 6e 2e 20 20 6b 20 r as we can. k
2ef0: 63 6f 75 6e 74 73 0a 20 20 20 20 20 20 20 20 2a counts. *
2f00: 2a 20 74 68 65 20 6e 75 6d 62 65 72 20 6f 66 20 * the number of
2f10: 63 68 61 72 61 63 74 65 72 73 20 74 68 61 74 20 characters that
2f20: 6d 61 74 63 68 20 2a 2f 0a 20 20 20 20 20 20 20 match */.
2f30: 20 66 6f 72 28 6b 3d 31 3b 20 6b 3c 69 53 72 63 for(k=1; k<iSrc
2f40: 20 26 26 20 6b 3c 3d 69 3b 20 6b 2b 2b 29 7b 0a && k<=i; k++){.
2f50: 20 20 20 20 20 20 20 20 20 20 69 66 28 20 7a 53 if( zS
2f60: 72 63 5b 69 53 72 63 2d 6b 5d 21 3d 7a 4f 75 74 rc[iSrc-k]!=zOut
2f70: 5b 62 61 73 65 2b 69 2d 6b 5d 20 29 20 62 72 65 [base+i-k] ) bre
2f80: 61 6b 3b 0a 20 20 20 20 20 20 20 20 7d 0a 20 20 ak;. }.
2f90: 20 20 20 20 20 20 6b 2d 2d 3b 0a 0a 20 20 20 20 k--;..
2fa0: 20 20 20 20 2f 2a 20 43 6f 6d 70 75 74 65 20 74 /* Compute t
2fb0: 68 65 20 6f 66 66 73 65 74 20 61 6e 64 20 73 69 he offset and si
2fc0: 7a 65 20 6f 66 20 74 68 65 20 6d 61 74 63 68 69 ze of the matchi
2fd0: 6e 67 20 72 65 67 69 6f 6e 20 2a 2f 0a 20 20 20 ng region */.
2fe0: 20 20 20 20 20 6f 66 73 74 20 3d 20 69 53 72 63 ofst = iSrc
2ff0: 2d 6b 3b 0a 20 20 20 20 20 20 20 20 63 6e 74 20 -k;. cnt
3000: 3d 20 6a 2b 6b 2b 31 3b 0a 20 20 20 20 20 20 20 = j+k+1;.
3010: 20 6c 69 74 73 7a 20 3d 20 69 2d 6b 3b 20 20 2f litsz = i-k; /
3020: 2a 20 4e 75 6d 62 65 72 20 6f 66 20 62 79 74 65 * Number of byte
3030: 73 20 6f 66 20 6c 69 74 65 72 61 6c 20 74 65 78 s of literal tex
3040: 74 20 62 65 66 6f 72 65 20 74 68 65 20 63 6f 70 t before the cop
3050: 79 20 2a 2f 0a 20 20 20 20 20 20 20 20 44 45 42 y */. DEB
3060: 55 47 32 28 20 70 72 69 6e 74 66 28 22 4d 41 54 UG2( printf("MAT
3070: 43 48 20 25 64 20 62 79 74 65 73 20 61 74 20 25 CH %d bytes at %
3080: 64 3a 20 5b 25 73 5d 20 6c 69 74 73 7a 3d 25 64 d: [%s] litsz=%d
3090: 5c 6e 22 2c 0a 20 20 20 20 20 20 20 20 20 20 20 \n",.
30a0: 20 20 20 20 20 20 20 20 20 20 20 20 20 63 6e 74 cnt
30b0: 2c 20 6f 66 73 74 2c 20 70 72 69 6e 74 31 36 28 , ofst, print16(
30c0: 26 7a 53 72 63 5b 6f 66 73 74 5d 29 2c 20 6c 69 &zSrc[ofst]), li
30d0: 74 73 7a 29 3b 20 29 0a 20 20 20 20 20 20 20 20 tsz); ).
30e0: 2f 2a 20 73 7a 20 77 69 6c 6c 20 68 6f 6c 64 20 /* sz will hold
30f0: 74 68 65 20 6e 75 6d 62 65 72 20 6f 66 20 62 79 the number of by
3100: 74 65 73 20 6e 65 65 64 65 64 20 74 6f 20 65 6e tes needed to en
3110: 63 6f 64 65 20 74 68 65 20 22 69 6e 73 65 72 74 code the "insert
3120: 22 0a 20 20 20 20 20 20 20 20 2a 2a 20 63 6f 6d ". ** com
3130: 6d 61 6e 64 20 61 6e 64 20 74 68 65 20 63 6f 70 mand and the cop
3140: 79 20 63 6f 6d 6d 61 6e 64 2c 20 6e 6f 74 20 63 y command, not c
3150: 6f 75 6e 74 69 6e 67 20 74 68 65 20 22 69 6e 73 ounting the "ins
3160: 65 72 74 22 20 74 65 78 74 20 2a 2f 0a 20 20 20 ert" text */.
3170: 20 20 20 20 20 73 7a 20 3d 20 64 69 67 69 74 5f sz = digit_
3180: 63 6f 75 6e 74 28 69 2d 6b 29 2b 64 69 67 69 74 count(i-k)+digit
3190: 5f 63 6f 75 6e 74 28 63 6e 74 29 2b 64 69 67 69 _count(cnt)+digi
31a0: 74 5f 63 6f 75 6e 74 28 6f 66 73 74 29 2b 33 3b t_count(ofst)+3;
31b0: 0a 20 20 20 20 20 20 20 20 69 66 28 20 63 6e 74 . if( cnt
31c0: 3e 3d 73 7a 20 26 26 20 63 6e 74 3e 62 65 73 74 >=sz && cnt>best
31d0: 43 6e 74 20 29 7b 0a 20 20 20 20 20 20 20 20 20 Cnt ){.
31e0: 20 2f 2a 20 52 65 6d 65 6d 62 65 72 20 74 68 69 /* Remember thi
31f0: 73 20 6d 61 74 63 68 20 6f 6e 6c 79 20 69 66 20 s match only if
3200: 69 74 20 69 73 20 74 68 65 20 62 65 73 74 20 73 it is the best s
3210: 6f 20 66 61 72 20 61 6e 64 20 69 74 0a 20 20 20 o far and it.
3220: 20 20 20 20 20 20 20 2a 2a 20 64 6f 65 73 20 6e ** does n
3230: 6f 74 20 69 6e 63 72 65 61 73 65 20 74 68 65 20 ot increase the
3240: 66 69 6c 65 20 73 69 7a 65 20 2a 2f 0a 20 20 20 file size */.
3250: 20 20 20 20 20 20 20 62 65 73 74 43 6e 74 20 3d bestCnt =
3260: 20 63 6e 74 3b 0a 20 20 20 20 20 20 20 20 20 20 cnt;.
3270: 62 65 73 74 4f 66 73 74 20 3d 20 69 53 72 63 2d bestOfst = iSrc-
3280: 6b 3b 0a 20 20 20 20 20 20 20 20 20 20 62 65 73 k;. bes
3290: 74 4c 69 74 73 7a 20 3d 20 6c 69 74 73 7a 3b 0a tLitsz = litsz;.
32a0: 20 20 20 20 20 20 20 20 20 20 44 45 42 55 47 32 DEBUG2
32b0: 28 20 70 72 69 6e 74 66 28 22 2e 2e 2e 20 42 45 ( printf("... BE
32c0: 53 54 20 53 4f 20 46 41 52 5c 6e 22 29 3b 20 29 ST SO FAR\n"); )
32d0: 0a 20 20 20 20 20 20 20 20 7d 0a 0a 20 20 20 20 . }..
32e0: 20 20 20 20 2f 2a 20 43 68 65 63 6b 20 74 68 65 /* Check the
32f0: 20 6e 65 78 74 20 6d 61 74 63 68 69 6e 67 20 62 next matching b
3300: 6c 6f 63 6b 20 2a 2f 0a 20 20 20 20 20 20 20 20 lock */.
3310: 69 42 6c 6f 63 6b 20 3d 20 63 6f 6c 6c 69 64 65 iBlock = collide
3320: 5b 69 42 6c 6f 63 6b 5d 3b 0a 20 20 20 20 20 20 [iBlock];.
3330: 7d 0a 0a 20 20 20 20 20 20 2f 2a 20 57 65 20 68 }.. /* We h
3340: 61 76 65 20 61 20 63 6f 70 79 20 63 6f 6d 6d 61 ave a copy comma
3350: 6e 64 20 74 68 61 74 20 64 6f 65 73 20 6e 6f 74 nd that does not
3360: 20 63 61 75 73 65 20 74 68 65 20 64 65 6c 74 61 cause the delta
3370: 20 74 6f 20 62 65 20 6c 61 72 67 65 72 0a 20 20 to be larger.
3380: 20 20 20 20 2a 2a 20 74 68 61 6e 20 61 20 6c 69 ** than a li
3390: 74 65 72 61 6c 20 69 6e 73 65 72 74 2e 20 20 53 teral insert. S
33a0: 6f 20 61 64 64 20 74 68 65 20 63 6f 70 79 20 63 o add the copy c
33b0: 6f 6d 6d 61 6e 64 20 74 6f 20 74 68 65 20 64 65 ommand to the de
33c0: 6c 74 61 2e 0a 20 20 20 20 20 20 2a 2f 0a 20 20 lta.. */.
33d0: 20 20 20 20 69 66 28 20 62 65 73 74 43 6e 74 3e if( bestCnt>
33e0: 30 20 29 7b 0a 20 20 20 20 20 20 20 20 69 66 28 0 ){. if(
33f0: 20 62 65 73 74 4c 69 74 73 7a 3e 30 20 29 7b 0a bestLitsz>0 ){.
3400: 20 20 20 20 20 20 20 20 20 20 2f 2a 20 41 64 64 /* Add
3410: 20 61 6e 20 69 6e 73 65 72 74 20 63 6f 6d 6d 61 an insert comma
3420: 6e 64 20 62 65 66 6f 72 65 20 74 68 65 20 63 6f nd before the co
3430: 70 79 20 2a 2f 0a 20 20 20 20 20 20 20 20 20 20 py */.
3440: 70 75 74 49 6e 74 28 62 65 73 74 4c 69 74 73 7a putInt(bestLitsz
3450: 2c 26 7a 44 65 6c 74 61 29 3b 0a 20 20 20 20 20 ,&zDelta);.
3460: 20 20 20 20 20 2a 28 7a 44 65 6c 74 61 2b 2b 29 *(zDelta++)
3470: 20 3d 20 27 3a 27 3b 0a 20 20 20 20 20 20 20 20 = ':';.
3480: 20 20 6d 65 6d 63 70 79 28 7a 44 65 6c 74 61 2c memcpy(zDelta,
3490: 20 26 7a 4f 75 74 5b 62 61 73 65 5d 2c 20 62 65 &zOut[base], be
34a0: 73 74 4c 69 74 73 7a 29 3b 0a 20 20 20 20 20 20 stLitsz);.
34b0: 20 20 20 20 7a 44 65 6c 74 61 20 2b 3d 20 62 65 zDelta += be
34c0: 73 74 4c 69 74 73 7a 3b 0a 20 20 20 20 20 20 20 stLitsz;.
34d0: 20 20 20 62 61 73 65 20 2b 3d 20 62 65 73 74 4c base += bestL
34e0: 69 74 73 7a 3b 0a 20 20 20 20 20 20 20 20 20 20 itsz;.
34f0: 44 45 42 55 47 32 28 20 70 72 69 6e 74 66 28 22 DEBUG2( printf("
3500: 69 6e 73 65 72 74 20 25 64 5c 6e 22 2c 20 62 65 insert %d\n", be
3510: 73 74 4c 69 74 73 7a 29 3b 20 29 0a 20 20 20 20 stLitsz); ).
3520: 20 20 20 20 7d 0a 20 20 20 20 20 20 20 20 62 61 }. ba
3530: 73 65 20 2b 3d 20 62 65 73 74 43 6e 74 3b 0a 20 se += bestCnt;.
3540: 20 20 20 20 20 20 20 70 75 74 49 6e 74 28 62 65 putInt(be
3550: 73 74 43 6e 74 2c 20 26 7a 44 65 6c 74 61 29 3b stCnt, &zDelta);
3560: 0a 20 20 20 20 20 20 20 20 2a 28 7a 44 65 6c 74 . *(zDelt
3570: 61 2b 2b 29 20 3d 20 27 40 27 3b 0a 20 20 20 20 a++) = '@';.
3580: 20 20 20 20 70 75 74 49 6e 74 28 62 65 73 74 4f putInt(bestO
3590: 66 73 74 2c 20 26 7a 44 65 6c 74 61 29 3b 0a 20 fst, &zDelta);.
35a0: 20 20 20 20 20 20 20 44 45 42 55 47 32 28 20 70 DEBUG2( p
35b0: 72 69 6e 74 66 28 22 63 6f 70 79 20 25 64 20 62 rintf("copy %d b
35c0: 79 74 65 73 20 66 72 6f 6d 20 25 64 5c 6e 22 2c ytes from %d\n",
35d0: 20 62 65 73 74 43 6e 74 2c 20 62 65 73 74 4f 66 bestCnt, bestOf
35e0: 73 74 29 3b 20 29 0a 20 20 20 20 20 20 20 20 2a st); ). *
35f0: 28 7a 44 65 6c 74 61 2b 2b 29 20 3d 20 27 2c 27 (zDelta++) = ','
3600: 3b 0a 20 20 20 20 20 20 20 20 69 66 28 20 62 65 ;. if( be
3610: 73 74 4f 66 73 74 20 2b 20 62 65 73 74 43 6e 74 stOfst + bestCnt
3620: 20 2d 31 20 3e 20 6c 61 73 74 52 65 61 64 20 29 -1 > lastRead )
3630: 7b 0a 20 20 20 20 20 20 20 20 20 20 6c 61 73 74 {. last
3640: 52 65 61 64 20 3d 20 62 65 73 74 4f 66 73 74 20 Read = bestOfst
3650: 2b 20 62 65 73 74 43 6e 74 20 2d 20 31 3b 0a 20 + bestCnt - 1;.
3660: 20 20 20 20 20 20 20 20 20 44 45 42 55 47 32 28 DEBUG2(
3670: 20 70 72 69 6e 74 66 28 22 6c 61 73 74 52 65 61 printf("lastRea
3680: 64 20 62 65 63 6f 6d 65 73 20 25 64 5c 6e 22 2c d becomes %d\n",
3690: 20 6c 61 73 74 52 65 61 64 29 3b 20 29 0a 20 20 lastRead); ).
36a0: 20 20 20 20 20 20 7d 0a 20 20 20 20 20 20 20 20 }.
36b0: 62 65 73 74 43 6e 74 20 3d 20 30 3b 0a 20 20 20 bestCnt = 0;.
36c0: 20 20 20 20 20 62 72 65 61 6b 3b 0a 20 20 20 20 break;.
36d0: 20 20 7d 0a 0a 20 20 20 20 20 20 2f 2a 20 49 66 }.. /* If
36e0: 20 77 65 20 72 65 61 63 68 20 74 68 69 73 20 70 we reach this p
36f0: 6f 69 6e 74 2c 20 69 74 20 6d 65 61 6e 73 20 6e oint, it means n
3700: 6f 20 6d 61 74 63 68 20 69 73 20 66 6f 75 6e 64 o match is found
3710: 20 73 6f 20 66 61 72 20 2a 2f 0a 20 20 20 20 20 so far */.
3720: 20 69 66 28 20 62 61 73 65 2b 69 2b 4e 48 41 53 if( base+i+NHAS
3730: 48 3e 6c 65 6e 4f 75 74 20 29 7b 0a 20 20 20 20 H>lenOut ){.
3740: 20 20 20 20 2f 2a 20 57 65 20 68 61 76 65 20 72 /* We have r
3750: 65 61 63 68 65 64 20 74 68 65 20 65 6e 64 20 6f eached the end o
3760: 66 20 74 68 65 20 66 69 6c 65 20 61 6e 64 20 68 f the file and h
3770: 61 76 65 20 6e 6f 74 20 66 6f 75 6e 64 20 61 6e ave not found an
3780: 79 0a 20 20 20 20 20 20 20 20 2a 2a 20 6d 61 74 y. ** mat
3790: 63 68 65 73 2e 20 20 44 6f 20 61 6e 20 22 69 6e ches. Do an "in
37a0: 73 65 72 74 22 20 66 6f 72 20 65 76 65 72 79 74 sert" for everyt
37b0: 68 69 6e 67 20 74 68 61 74 20 64 6f 65 73 20 6e hing that does n
37c0: 6f 74 20 6d 61 74 63 68 20 2a 2f 0a 20 20 20 20 ot match */.
37d0: 20 20 20 20 70 75 74 49 6e 74 28 6c 65 6e 4f 75 putInt(lenOu
37e0: 74 2d 62 61 73 65 2c 20 26 7a 44 65 6c 74 61 29 t-base, &zDelta)
37f0: 3b 0a 20 20 20 20 20 20 20 20 2a 28 7a 44 65 6c ;. *(zDel
3800: 74 61 2b 2b 29 20 3d 20 27 3a 27 3b 0a 20 20 20 ta++) = ':';.
3810: 20 20 20 20 20 6d 65 6d 63 70 79 28 7a 44 65 6c memcpy(zDel
3820: 74 61 2c 20 26 7a 4f 75 74 5b 62 61 73 65 5d 2c ta, &zOut[base],
3830: 20 6c 65 6e 4f 75 74 2d 62 61 73 65 29 3b 0a 20 lenOut-base);.
3840: 20 20 20 20 20 20 20 7a 44 65 6c 74 61 20 2b 3d zDelta +=
3850: 20 6c 65 6e 4f 75 74 2d 62 61 73 65 3b 0a 20 20 lenOut-base;.
3860: 20 20 20 20 20 20 62 61 73 65 20 3d 20 6c 65 6e base = len
3870: 4f 75 74 3b 0a 20 20 20 20 20 20 20 20 62 72 65 Out;. bre
3880: 61 6b 3b 0a 20 20 20 20 20 20 7d 0a 0a 20 20 20 ak;. }..
3890: 20 20 20 2f 2a 20 41 64 76 61 6e 63 65 20 74 68 /* Advance th
38a0: 65 20 68 61 73 68 20 62 79 20 6f 6e 65 20 63 68 e hash by one ch
38b0: 61 72 61 63 74 65 72 2e 20 20 4b 65 65 70 20 6c aracter. Keep l
38c0: 6f 6f 6b 69 6e 67 20 66 6f 72 20 61 20 6d 61 74 ooking for a mat
38d0: 63 68 20 2a 2f 0a 20 20 20 20 20 20 68 61 73 68 ch */. hash
38e0: 5f 6e 65 78 74 28 26 68 2c 20 7a 4f 75 74 5b 62 _next(&h, zOut[b
38f0: 61 73 65 2b 69 2b 4e 48 41 53 48 5d 29 3b 0a 20 ase+i+NHASH]);.
3900: 20 20 20 20 20 69 2b 2b 3b 0a 20 20 20 20 7d 0a i++;. }.
3910: 20 20 7d 0a 20 20 2f 2a 20 4f 75 74 70 75 74 20 }. /* Output
3920: 61 20 66 69 6e 61 6c 20 22 69 6e 73 65 72 74 22 a final "insert"
3930: 20 72 65 63 6f 72 64 20 74 6f 20 67 65 74 20 61 record to get a
3940: 6c 6c 20 74 68 65 20 74 65 78 74 20 61 74 20 74 ll the text at t
3950: 68 65 20 65 6e 64 20 6f 66 0a 20 20 2a 2a 20 74 he end of. ** t
3960: 68 65 20 66 69 6c 65 20 74 68 61 74 20 64 6f 65 he file that doe
3970: 73 20 6e 6f 74 20 6d 61 74 63 68 20 61 6e 79 74 s not match anyt
3980: 68 69 6e 67 20 69 6e 20 74 68 65 20 73 6f 75 72 hing in the sour
3990: 63 65 20 66 69 6c 65 2e 0a 20 20 2a 2f 0a 20 20 ce file.. */.
39a0: 69 66 28 20 62 61 73 65 3c 6c 65 6e 4f 75 74 20 if( base<lenOut
39b0: 29 7b 0a 20 20 20 20 70 75 74 49 6e 74 28 6c 65 ){. putInt(le
39c0: 6e 4f 75 74 2d 62 61 73 65 2c 20 26 7a 44 65 6c nOut-base, &zDel
39d0: 74 61 29 3b 0a 20 20 20 20 2a 28 7a 44 65 6c 74 ta);. *(zDelt
39e0: 61 2b 2b 29 20 3d 20 27 3a 27 3b 0a 20 20 20 20 a++) = ':';.
39f0: 6d 65 6d 63 70 79 28 7a 44 65 6c 74 61 2c 20 26 memcpy(zDelta, &
3a00: 7a 4f 75 74 5b 62 61 73 65 5d 2c 20 6c 65 6e 4f zOut[base], lenO
3a10: 75 74 2d 62 61 73 65 29 3b 0a 20 20 20 20 7a 44 ut-base);. zD
3a20: 65 6c 74 61 20 2b 3d 20 6c 65 6e 4f 75 74 2d 62 elta += lenOut-b
3a30: 61 73 65 3b 0a 20 20 7d 0a 20 20 2f 2a 20 4f 75 ase;. }. /* Ou
3a40: 74 70 75 74 20 74 68 65 20 66 69 6e 61 6c 20 63 tput the final c
3a50: 68 65 63 6b 73 75 6d 20 72 65 63 6f 72 64 2e 20 hecksum record.
3a60: 2a 2f 0a 20 20 70 75 74 49 6e 74 28 63 68 65 63 */. putInt(chec
3a70: 6b 73 75 6d 28 7a 4f 75 74 2c 20 6c 65 6e 4f 75 ksum(zOut, lenOu
3a80: 74 29 2c 20 26 7a 44 65 6c 74 61 29 3b 0a 20 20 t), &zDelta);.
3a90: 2a 28 7a 44 65 6c 74 61 2b 2b 29 20 3d 20 27 3b *(zDelta++) = ';
3aa0: 27 3b 0a 20 20 66 72 65 65 28 63 6f 6c 6c 69 64 ';. free(collid
3ab0: 65 29 3b 0a 20 20 72 65 74 75 72 6e 20 7a 44 65 e);. return zDe
3ac0: 6c 74 61 20 2d 20 7a 4f 72 69 67 44 65 6c 74 61 lta - zOrigDelta
3ad0: 3b 20 0a 7d 0a 0a 2f 2a 0a 2a 2a 20 52 65 74 75 ; .}../*.** Retu
3ae0: 72 6e 20 74 68 65 20 73 69 7a 65 20 28 69 6e 20 rn the size (in
3af0: 62 79 74 65 73 29 20 6f 66 20 74 68 65 20 6f 75 bytes) of the ou
3b00: 74 70 75 74 20 66 72 6f 6d 20 61 70 70 6c 79 69 tput from applyi
3b10: 6e 67 0a 2a 2a 20 61 20 64 65 6c 74 61 2e 20 0a ng.** a delta. .
3b20: 2a 2a 0a 2a 2a 20 54 68 69 73 20 72 6f 75 74 69 **.** This routi
3b30: 6e 65 20 69 73 20 70 72 6f 76 69 64 65 64 20 73 ne is provided s
3b40: 6f 20 74 68 61 74 20 61 6e 20 70 72 6f 63 65 64 o that an proced
3b50: 75 72 65 20 74 68 61 74 20 69 73 20 61 62 6c 65 ure that is able
3b60: 0a 2a 2a 20 74 6f 20 63 61 6c 6c 20 64 65 6c 74 .** to call delt
3b70: 61 5f 61 70 70 6c 79 28 29 20 63 61 6e 20 6c 65 a_apply() can le
3b80: 61 72 6e 20 68 6f 77 20 6d 75 63 68 20 73 70 61 arn how much spa
3b90: 63 65 20 69 73 20 72 65 71 75 69 72 65 64 0a 2a ce is required.*
3ba0: 2a 20 66 6f 72 20 74 68 65 20 6f 75 74 70 75 74 * for the output
3bb0: 20 61 6e 64 20 68 65 6e 63 65 20 61 6c 6c 6f 63 and hence alloc
3bc0: 61 74 65 20 6e 6f 72 20 6d 6f 72 65 20 73 70 61 ate nor more spa
3bd0: 63 65 20 74 68 61 74 20 69 73 20 72 65 61 6c 6c ce that is reall
3be0: 79 0a 2a 2a 20 6e 65 65 64 65 64 2e 0a 2a 2f 0a y.** needed..*/.
3bf0: 69 6e 74 20 64 65 6c 74 61 5f 6f 75 74 70 75 74 int delta_output
3c00: 5f 73 69 7a 65 28 63 6f 6e 73 74 20 63 68 61 72 _size(const char
3c10: 20 2a 7a 44 65 6c 74 61 2c 20 69 6e 74 20 6c 65 *zDelta, int le
3c20: 6e 44 65 6c 74 61 29 7b 0a 20 20 69 6e 74 20 73 nDelta){. int s
3c30: 69 7a 65 3b 0a 20 20 73 69 7a 65 20 3d 20 67 65 ize;. size = ge
3c40: 74 49 6e 74 28 26 7a 44 65 6c 74 61 2c 20 26 6c tInt(&zDelta, &l
3c50: 65 6e 44 65 6c 74 61 29 3b 0a 20 20 69 66 28 20 enDelta);. if(
3c60: 2a 7a 44 65 6c 74 61 21 3d 27 5c 6e 27 20 29 7b *zDelta!='\n' ){
3c70: 0a 20 20 20 20 2f 2a 20 45 52 52 4f 52 3a 20 73 . /* ERROR: s
3c80: 69 7a 65 20 69 6e 74 65 67 65 72 20 6e 6f 74 20 ize integer not
3c90: 74 65 72 6d 69 6e 61 74 65 64 20 62 79 20 22 5c terminated by "\
3ca0: 6e 22 20 2a 2f 0a 20 20 20 20 72 65 74 75 72 6e n" */. return
3cb0: 20 2d 31 3b 0a 20 20 7d 0a 20 20 72 65 74 75 72 -1;. }. retur
3cc0: 6e 20 73 69 7a 65 3b 0a 7d 0a 0a 0a 2f 2a 0a 2a n size;.}.../*.*
3cd0: 2a 20 41 70 70 6c 79 20 61 20 64 65 6c 74 61 2e * Apply a delta.
3ce0: 0a 2a 2a 0a 2a 2a 20 54 68 65 20 6f 75 74 70 75 .**.** The outpu
3cf0: 74 20 62 75 66 66 65 72 20 73 68 6f 75 6c 64 20 t buffer should
3d00: 62 65 20 62 69 67 20 65 6e 6f 75 67 68 20 74 6f be big enough to
3d10: 20 68 6f 6c 64 20 74 68 65 20 77 68 6f 6c 65 20 hold the whole
3d20: 6f 75 74 70 75 74 0a 2a 2a 20 66 69 6c 65 20 61 output.** file a
3d30: 6e 64 20 61 20 4e 55 4c 20 74 65 72 6d 69 6e 61 nd a NUL termina
3d40: 74 6f 72 20 61 74 20 74 68 65 20 65 6e 64 2e 20 tor at the end.
3d50: 20 54 68 65 20 64 65 6c 74 61 5f 6f 75 74 70 75 The delta_outpu
3d60: 74 5f 73 69 7a 65 28 29 0a 2a 2a 20 72 6f 75 74 t_size().** rout
3d70: 69 6e 65 20 77 69 6c 6c 20 64 65 74 65 72 6d 69 ine will determi
3d80: 6e 65 20 74 68 69 73 20 73 69 7a 65 20 66 6f 72 ne this size for
3d90: 20 79 6f 75 2e 0a 2a 2a 0a 2a 2a 20 54 68 65 20 you..**.** The
3da0: 64 65 6c 74 61 20 73 74 72 69 6e 67 20 73 68 6f delta string sho
3db0: 75 6c 64 20 62 65 20 6e 75 6c 6c 2d 74 65 72 6d uld be null-term
3dc0: 69 6e 61 74 65 64 2e 20 20 42 75 74 20 74 68 65 inated. But the
3dd0: 20 64 65 6c 74 61 20 73 74 72 69 6e 67 0a 2a 2a delta string.**
3de0: 20 6d 61 79 20 63 6f 6e 74 61 69 6e 20 65 6d 62 may contain emb
3df0: 65 64 64 65 64 20 4e 55 4c 20 63 68 61 72 61 63 edded NUL charac
3e00: 74 65 72 73 20 28 69 66 20 74 68 65 20 69 6e 70 ters (if the inp
3e10: 75 74 20 61 6e 64 20 6f 75 74 70 75 74 20 61 72 ut and output ar
3e20: 65 0a 2a 2a 20 62 69 6e 61 72 79 20 66 69 6c 65 e.** binary file
3e30: 73 29 20 73 6f 20 77 65 20 61 6c 73 6f 20 68 61 s) so we also ha
3e40: 76 65 20 74 6f 20 70 61 73 73 20 69 6e 20 74 68 ve to pass in th
3e50: 65 20 6c 65 6e 67 74 68 20 6f 66 20 74 68 65 20 e length of the
3e60: 64 65 6c 74 61 20 69 6e 0a 2a 2a 20 74 68 65 20 delta in.** the
3e70: 6c 65 6e 44 65 6c 74 61 20 70 61 72 61 6d 65 74 lenDelta paramet
3e80: 65 72 2e 0a 2a 2a 0a 2a 2a 20 54 68 69 73 20 66 er..**.** This f
3e90: 75 6e 63 74 69 6f 6e 20 72 65 74 75 72 6e 73 20 unction returns
3ea0: 74 68 65 20 73 69 7a 65 20 6f 66 20 74 68 65 20 the size of the
3eb0: 6f 75 74 70 75 74 20 66 69 6c 65 20 69 6e 20 62 output file in b
3ec0: 79 74 65 73 20 28 65 78 63 6c 75 64 69 6e 67 0a ytes (excluding.
3ed0: 2a 2a 20 74 68 65 20 66 69 6e 61 6c 20 4e 55 4c ** the final NUL
3ee0: 20 74 65 72 6d 69 6e 61 74 6f 72 20 63 68 61 72 terminator char
3ef0: 61 63 74 65 72 29 2e 20 20 45 78 63 65 70 74 2c acter). Except,
3f00: 20 69 66 20 74 68 65 20 64 65 6c 74 61 20 73 74 if the delta st
3f10: 72 69 6e 67 20 69 73 0a 2a 2a 20 6d 61 6c 66 6f ring is.** malfo
3f20: 72 6d 65 64 20 6f 72 20 69 6e 74 65 6e 64 65 64 rmed or intended
3f30: 20 66 6f 72 20 75 73 65 20 77 69 74 68 20 61 20 for use with a
3f40: 73 6f 75 72 63 65 20 66 69 6c 65 20 6f 74 68 65 source file othe
3f50: 72 20 74 68 61 6e 20 7a 53 72 63 2c 0a 2a 2a 20 r than zSrc,.**
3f60: 74 68 65 6e 20 74 68 69 73 20 72 6f 75 74 69 6e then this routin
3f70: 65 20 72 65 74 75 72 6e 73 20 2d 31 2e 0a 2a 2a e returns -1..**
3f80: 0a 2a 2a 20 52 65 66 65 72 20 74 6f 20 74 68 65 .** Refer to the
3f90: 20 64 65 6c 74 61 5f 63 72 65 61 74 65 28 29 20 delta_create()
3fa0: 64 6f 63 75 6d 65 6e 74 61 74 69 6f 6e 20 61 62 documentation ab
3fb0: 6f 76 65 20 66 6f 72 20 61 20 64 65 73 63 72 69 ove for a descri
3fc0: 70 74 69 6f 6e 0a 2a 2a 20 6f 66 20 74 68 65 20 ption.** of the
3fd0: 64 65 6c 74 61 20 66 69 6c 65 20 66 6f 72 6d 61 delta file forma
3fe0: 74 2e 0a 2a 2f 0a 69 6e 74 20 64 65 6c 74 61 5f t..*/.int delta_
3ff0: 61 70 70 6c 79 28 0a 20 20 63 6f 6e 73 74 20 63 apply(. const c
4000: 68 61 72 20 2a 7a 53 72 63 2c 20 20 20 20 20 20 har *zSrc,
4010: 2f 2a 20 54 68 65 20 73 6f 75 72 63 65 20 6f 72 /* The source or
4020: 20 70 61 74 74 65 72 6e 20 66 69 6c 65 20 2a 2f pattern file */
4030: 0a 20 20 69 6e 74 20 6c 65 6e 53 72 63 2c 20 20 . int lenSrc,
4040: 20 20 20 20 20 20 20 20 20 20 2f 2a 20 4c 65 6e /* Len
4050: 67 74 68 20 6f 66 20 74 68 65 20 73 6f 75 72 63 gth of the sourc
4060: 65 20 66 69 6c 65 20 2a 2f 0a 20 20 63 6f 6e 73 e file */. cons
4070: 74 20 63 68 61 72 20 2a 7a 44 65 6c 74 61 2c 20 t char *zDelta,
4080: 20 20 20 2f 2a 20 44 65 6c 74 61 20 74 6f 20 61 /* Delta to a
4090: 70 70 6c 79 20 74 6f 20 74 68 65 20 70 61 74 74 pply to the patt
40a0: 65 72 6e 20 2a 2f 0a 20 20 69 6e 74 20 6c 65 6e ern */. int len
40b0: 44 65 6c 74 61 2c 20 20 20 20 20 20 20 20 20 20 Delta,
40c0: 2f 2a 20 4c 65 6e 67 74 68 20 6f 66 20 74 68 65 /* Length of the
40d0: 20 64 65 6c 74 61 20 2a 2f 0a 20 20 63 68 61 72 delta */. char
40e0: 20 2a 7a 4f 75 74 20 20 20 20 20 20 20 20 20 20 *zOut
40f0: 20 20 20 2f 2a 20 57 72 69 74 65 20 74 68 65 20 /* Write the
4100: 6f 75 74 70 75 74 20 69 6e 74 6f 20 74 68 69 73 output into this
4110: 20 70 72 65 61 6c 6c 6f 63 61 74 65 64 20 62 75 preallocated bu
4120: 66 66 65 72 20 2a 2f 0a 29 7b 0a 20 20 75 6e 73 ffer */.){. uns
4130: 69 67 6e 65 64 20 69 6e 74 20 6c 69 6d 69 74 3b igned int limit;
4140: 0a 20 20 75 6e 73 69 67 6e 65 64 20 69 6e 74 20 . unsigned int
4150: 74 6f 74 61 6c 20 3d 20 30 3b 0a 20 20 63 68 61 total = 0;. cha
4160: 72 20 2a 7a 4f 72 69 67 4f 75 74 20 3d 20 7a 4f r *zOrigOut = zO
4170: 75 74 3b 0a 0a 20 20 6c 69 6d 69 74 20 3d 20 67 ut;.. limit = g
4180: 65 74 49 6e 74 28 26 7a 44 65 6c 74 61 2c 20 26 etInt(&zDelta, &
4190: 6c 65 6e 44 65 6c 74 61 29 3b 0a 20 20 69 66 28 lenDelta);. if(
41a0: 20 2a 7a 44 65 6c 74 61 21 3d 27 5c 6e 27 20 29 *zDelta!='\n' )
41b0: 7b 0a 20 20 20 20 2f 2a 20 45 52 52 4f 52 3a 20 {. /* ERROR:
41c0: 73 69 7a 65 20 69 6e 74 65 67 65 72 20 6e 6f 74 size integer not
41d0: 20 74 65 72 6d 69 6e 61 74 65 64 20 62 79 20 22 terminated by "
41e0: 5c 6e 22 20 2a 2f 0a 20 20 20 20 72 65 74 75 72 \n" */. retur
41f0: 6e 20 2d 31 3b 0a 20 20 7d 0a 20 20 7a 44 65 6c n -1;. }. zDel
4200: 74 61 2b 2b 3b 20 6c 65 6e 44 65 6c 74 61 2d 2d ta++; lenDelta--
4210: 3b 0a 20 20 77 68 69 6c 65 28 20 2a 7a 44 65 6c ;. while( *zDel
4220: 74 61 20 26 26 20 6c 65 6e 44 65 6c 74 61 3e 30 ta && lenDelta>0
4230: 20 29 7b 0a 20 20 20 20 75 6e 73 69 67 6e 65 64 ){. unsigned
4240: 20 69 6e 74 20 63 6e 74 2c 20 6f 66 73 74 3b 0a int cnt, ofst;.
4250: 20 20 20 20 63 6e 74 20 3d 20 67 65 74 49 6e 74 cnt = getInt
4260: 28 26 7a 44 65 6c 74 61 2c 20 26 6c 65 6e 44 65 (&zDelta, &lenDe
4270: 6c 74 61 29 3b 0a 20 20 20 20 73 77 69 74 63 68 lta);. switch
4280: 28 20 7a 44 65 6c 74 61 5b 30 5d 20 29 7b 0a 20 ( zDelta[0] ){.
4290: 20 20 20 20 20 63 61 73 65 20 27 40 27 3a 20 7b case '@': {
42a0: 0a 20 20 20 20 20 20 20 20 7a 44 65 6c 74 61 2b . zDelta+
42b0: 2b 3b 20 6c 65 6e 44 65 6c 74 61 2d 2d 3b 0a 20 +; lenDelta--;.
42c0: 20 20 20 20 20 20 20 6f 66 73 74 20 3d 20 67 65 ofst = ge
42d0: 74 49 6e 74 28 26 7a 44 65 6c 74 61 2c 20 26 6c tInt(&zDelta, &l
42e0: 65 6e 44 65 6c 74 61 29 3b 0a 20 20 20 20 20 20 enDelta);.
42f0: 20 20 69 66 28 20 7a 44 65 6c 74 61 5b 30 5d 21 if( zDelta[0]!
4300: 3d 27 2c 27 20 29 7b 0a 20 20 20 20 20 20 20 20 =',' ){.
4310: 20 20 2f 2a 20 45 52 52 4f 52 3a 20 63 6f 70 79 /* ERROR: copy
4320: 20 63 6f 6d 6d 61 6e 64 20 6e 6f 74 20 74 65 72 command not ter
4330: 6d 69 6e 61 74 65 64 20 62 79 20 27 2c 27 20 2a minated by ',' *
4340: 2f 0a 20 20 20 20 20 20 20 20 20 20 72 65 74 75 /. retu
4350: 72 6e 20 2d 31 3b 0a 20 20 20 20 20 20 20 20 7d rn -1;. }
4360: 0a 20 20 20 20 20 20 20 20 7a 44 65 6c 74 61 2b . zDelta+
4370: 2b 3b 20 6c 65 6e 44 65 6c 74 61 2d 2d 3b 0a 20 +; lenDelta--;.
4380: 20 20 20 20 20 20 20 44 45 42 55 47 31 28 20 70 DEBUG1( p
4390: 72 69 6e 74 66 28 22 43 4f 50 59 20 25 64 20 66 rintf("COPY %d f
43a0: 72 6f 6d 20 25 64 5c 6e 22 2c 20 63 6e 74 2c 20 rom %d\n", cnt,
43b0: 6f 66 73 74 29 3b 20 29 0a 20 20 20 20 20 20 20 ofst); ).
43c0: 20 74 6f 74 61 6c 20 2b 3d 20 63 6e 74 3b 0a 20 total += cnt;.
43d0: 20 20 20 20 20 20 20 69 66 28 20 74 6f 74 61 6c if( total
43e0: 3e 6c 69 6d 69 74 20 29 7b 0a 20 20 20 20 20 20 >limit ){.
43f0: 20 20 20 20 2f 2a 20 45 52 52 4f 52 3a 20 63 6f /* ERROR: co
4400: 70 79 20 65 78 63 65 65 64 73 20 6f 75 74 70 75 py exceeds outpu
4410: 74 20 66 69 6c 65 20 73 69 7a 65 20 2a 2f 0a 20 t file size */.
4420: 20 20 20 20 20 20 20 20 20 72 65 74 75 72 6e 20 return
4430: 2d 31 3b 0a 20 20 20 20 20 20 20 20 7d 0a 20 20 -1;. }.
4440: 20 20 20 20 20 20 69 66 28 20 6f 66 73 74 2b 63 if( ofst+c
4450: 6e 74 20 3e 20 6c 65 6e 53 72 63 20 29 7b 0a 20 nt > lenSrc ){.
4460: 20 20 20 20 20 20 20 20 20 2f 2a 20 45 52 52 4f /* ERRO
4470: 52 3a 20 63 6f 70 79 20 65 78 74 65 6e 64 73 20 R: copy extends
4480: 70 61 73 74 20 65 6e 64 20 6f 66 20 69 6e 70 75 past end of inpu
4490: 74 20 2a 2f 0a 20 20 20 20 20 20 20 20 20 20 72 t */. r
44a0: 65 74 75 72 6e 20 2d 31 3b 0a 20 20 20 20 20 20 eturn -1;.
44b0: 20 20 7d 0a 20 20 20 20 20 20 20 20 6d 65 6d 63 }. memc
44c0: 70 79 28 7a 4f 75 74 2c 20 26 7a 53 72 63 5b 6f py(zOut, &zSrc[o
44d0: 66 73 74 5d 2c 20 63 6e 74 29 3b 0a 20 20 20 20 fst], cnt);.
44e0: 20 20 20 20 7a 4f 75 74 20 2b 3d 20 63 6e 74 3b zOut += cnt;
44f0: 0a 20 20 20 20 20 20 20 20 62 72 65 61 6b 3b 0a . break;.
4500: 20 20 20 20 20 20 7d 0a 20 20 20 20 20 20 63 61 }. ca
4510: 73 65 20 27 3a 27 3a 20 7b 0a 20 20 20 20 20 20 se ':': {.
4520: 20 20 7a 44 65 6c 74 61 2b 2b 3b 20 6c 65 6e 44 zDelta++; lenD
4530: 65 6c 74 61 2d 2d 3b 0a 20 20 20 20 20 20 20 20 elta--;.
4540: 74 6f 74 61 6c 20 2b 3d 20 63 6e 74 3b 0a 20 20 total += cnt;.
4550: 20 20 20 20 20 20 69 66 28 20 74 6f 74 61 6c 3e if( total>
4560: 6c 69 6d 69 74 20 29 7b 0a 20 20 20 20 20 20 20 limit ){.
4570: 20 20 20 2f 2a 20 45 52 52 4f 52 3a 20 20 69 6e /* ERROR: in
4580: 73 65 72 74 20 63 6f 6d 6d 61 6e 64 20 67 69 76 sert command giv
4590: 65 73 20 61 6e 20 6f 75 74 70 75 74 20 6c 61 72 es an output lar
45a0: 67 65 72 20 74 68 61 6e 20 70 72 65 64 69 63 74 ger than predict
45b0: 65 64 20 2a 2f 0a 20 20 20 20 20 20 20 20 20 20 ed */.
45c0: 72 65 74 75 72 6e 20 2d 31 3b 0a 20 20 20 20 20 return -1;.
45d0: 20 20 20 7d 0a 20 20 20 20 20 20 20 20 44 45 42 }. DEB
45e0: 55 47 31 28 20 70 72 69 6e 74 66 28 22 49 4e 53 UG1( printf("INS
45f0: 45 52 54 20 25 64 5c 6e 22 2c 20 63 6e 74 29 3b ERT %d\n", cnt);
4600: 20 29 0a 20 20 20 20 20 20 20 20 69 66 28 20 63 ). if( c
4610: 6e 74 3e 6c 65 6e 44 65 6c 74 61 20 29 7b 0a 20 nt>lenDelta ){.
4620: 20 20 20 20 20 20 20 20 20 2f 2a 20 45 52 52 4f /* ERRO
4630: 52 3a 20 69 6e 73 65 72 74 20 63 6f 75 6e 74 20 R: insert count
4640: 65 78 63 65 65 64 73 20 73 69 7a 65 20 6f 66 20 exceeds size of
4650: 64 65 6c 74 61 20 2a 2f 0a 20 20 20 20 20 20 20 delta */.
4660: 20 20 20 72 65 74 75 72 6e 20 2d 31 3b 0a 20 20 return -1;.
4670: 20 20 20 20 20 20 7d 0a 20 20 20 20 20 20 20 20 }.
4680: 6d 65 6d 63 70 79 28 7a 4f 75 74 2c 20 7a 44 65 memcpy(zOut, zDe
4690: 6c 74 61 2c 20 63 6e 74 29 3b 0a 20 20 20 20 20 lta, cnt);.
46a0: 20 20 20 7a 4f 75 74 20 2b 3d 20 63 6e 74 3b 0a zOut += cnt;.
46b0: 20 20 20 20 20 20 20 20 7a 44 65 6c 74 61 20 2b zDelta +
46c0: 3d 20 63 6e 74 3b 0a 20 20 20 20 20 20 20 20 6c = cnt;. l
46d0: 65 6e 44 65 6c 74 61 20 2d 3d 20 63 6e 74 3b 0a enDelta -= cnt;.
46e0: 20 20 20 20 20 20 20 20 62 72 65 61 6b 3b 0a 20 break;.
46f0: 20 20 20 20 20 7d 0a 20 20 20 20 20 20 63 61 73 }. cas
4700: 65 20 27 3b 27 3a 20 7b 0a 20 20 20 20 20 20 20 e ';': {.
4710: 20 7a 44 65 6c 74 61 2b 2b 3b 20 6c 65 6e 44 65 zDelta++; lenDe
4720: 6c 74 61 2d 2d 3b 0a 20 20 20 20 20 20 20 20 7a lta--;. z
4730: 4f 75 74 5b 30 5d 20 3d 20 30 3b 0a 20 20 20 20 Out[0] = 0;.
4740: 20 20 20 20 69 66 28 20 63 6e 74 21 3d 63 68 65 if( cnt!=che
4750: 63 6b 73 75 6d 28 7a 4f 72 69 67 4f 75 74 2c 20 cksum(zOrigOut,
4760: 74 6f 74 61 6c 29 20 29 7b 0a 20 20 20 20 20 20 total) ){.
4770: 20 20 20 20 2f 2a 20 45 52 52 4f 52 3a 20 20 62 /* ERROR: b
4780: 61 64 20 63 68 65 63 6b 73 75 6d 20 2a 2f 0a 20 ad checksum */.
4790: 20 20 20 20 20 20 20 20 20 72 65 74 75 72 6e 20 return
47a0: 2d 31 3b 0a 20 20 20 20 20 20 20 20 7d 0a 20 20 -1;. }.
47b0: 20 20 20 20 20 20 69 66 28 20 74 6f 74 61 6c 21 if( total!
47c0: 3d 6c 69 6d 69 74 20 29 7b 0a 20 20 20 20 20 20 =limit ){.
47d0: 20 20 20 20 2f 2a 20 45 52 52 4f 52 3a 20 67 65 /* ERROR: ge
47e0: 6e 65 72 61 74 65 64 20 73 69 7a 65 20 64 6f 65 nerated size doe
47f0: 73 20 6e 6f 74 20 6d 61 74 63 68 20 70 72 65 64 s not match pred
4800: 69 63 74 65 64 20 73 69 7a 65 20 2a 2f 0a 20 20 icted size */.
4810: 20 20 20 20 20 20 20 20 72 65 74 75 72 6e 20 2d return -
4820: 31 3b 0a 20 20 20 20 20 20 20 20 7d 0a 20 20 20 1;. }.
4830: 20 20 20 20 20 72 65 74 75 72 6e 20 74 6f 74 61 return tota
4840: 6c 3b 0a 20 20 20 20 20 20 7d 0a 20 20 20 20 20 l;. }.
4850: 20 64 65 66 61 75 6c 74 3a 20 7b 0a 20 20 20 20 default: {.
4860: 20 20 20 20 2f 2a 20 45 52 52 4f 52 3a 20 75 6e /* ERROR: un
4870: 6b 6e 6f 77 6e 20 64 65 6c 74 61 20 6f 70 65 72 known delta oper
4880: 61 74 6f 72 20 2a 2f 0a 20 20 20 20 20 20 20 20 ator */.
4890: 72 65 74 75 72 6e 20 2d 31 3b 0a 20 20 20 20 20 return -1;.
48a0: 20 7d 0a 20 20 20 20 7d 0a 20 20 7d 0a 20 20 2f }. }. }. /
48b0: 2a 20 45 52 52 4f 52 3a 20 75 6e 74 65 72 6d 69 * ERROR: untermi
48c0: 6e 61 74 65 64 20 64 65 6c 74 61 20 2a 2f 0a 20 nated delta */.
48d0: 20 72 65 74 75 72 6e 20 2d 31 3b 0a 7d 0a return -1;.}.